Trang 1 trên tổng số 2 12 Cuối cùngCuối cùng
Từ 1 tới 10 trên tổng số 12 kết quả

Đề tài: Lập trình nhận dạng giọng nói

  1. #1
    Ngày gia nhập
    03 2012
    Bài viết
    2

    Wink Lập trình nhận dạng giọng nói

    Mọi người để lập trình một chương trình nhận dạng giọng nói như Siri của apple thì những kiến thức cần có là gì vậy ? Mọi người có thể cho mình biết hướng đi của việc này không ?

  2. #2
    Ngày gia nhập
    10 2008
    Bài viết
    0

    Mình nghĩ nếu bạn đã đặt ra câu hỏi này thì bạn nên bắt đầu từ các bộ sdk nhận dạng giọng nói sẵn có . Chúc bạn may mắm

  3. #3
    Ngày gia nhập
    12 2011
    Nơi ở
    vùng kín
    Bài viết
    139

    làm đc cái này bạn mang bán đc ối tiền đó

  4. #4
    Ngày gia nhập
    03 2012
    Bài viết
    2

    Vậy không có tài liệu liên quan hả bạn ? Ý tưởng thì có nhưng khả năng có hạn. Mình chỉ cố gắng học những điều mình đam mê thôi. Mong mọi người giúp đỡ !

  5. #5
    Ngày gia nhập
    08 2011
    Bài viết
    117

    Mình đang làm việc trong lĩnh vực này nên muốn góp ý với bạn. Tài Liệu thì có và đó là cả một chuyên ngành trong khoa học máy tính. để làm được việc phân tích giọng nói rồi xử lý trả về kết quả cho người dùng thì trước tiên bạn nghiên cứu xử lý đầu vào là text rồi trả về kết quả cũng dạng text cho người dùng, làm được như vậy đã là thành công rồi.

    có 2 từ khóa bạn cần nghiên cứu sâu :
    natural language processing
    information retrieval
    mình search được cái document giới thiệu qua cho bạn
    Ref Link Code:

    chúc bạn thành công.
    Đã được chỉnh sửa lần cuối bởi CIMinuv : 18-02-2013 lúc 09:29 AM.

  6. #6
    Ngày gia nhập
    03 2012
    Bài viết
    2

    Mặc định Lập trình nhận dạng giọng nói

    Trích dẫn Nguyên bản được gửi bởi CIMinuv Xem bài viết
    Mình đang làm việc trong lĩnh vực này nên muốn góp ý với bạn. Tài Liệu thì có và đó là cả một chuyên ngành trong khoa học máy tính. để làm được việc phân tích giọng nói rồi xử lý trả về kết quả cho người dùng thì trước tiên bạn nghiên cứu xử lý đầu vào là text rồi trả về kết quả cũng dạng text cho người dùng, làm được như vậy đã là thành công rồi.

    có 2 từ khóa bạn cần nghiên cứu sâu :



    mình search được cái document giới thiệu qua cho bạn


    chúc bạn thành công.
    Cảm ơn bạn nhé ! Hy vọng mình có thể tiếp thu được nhiều.

  7. #7
    Ngày gia nhập
    06 2007
    Nơi ở
    C:\WINDOWS\system32\dllcache\
    Bài viết
    3,007

    Trích dẫn Nguyên bản được gửi bởi CIMinuv Xem bài viết
    Mình đang làm việc trong lĩnh vực này nên muốn góp ý với bạn. Tài Liệu thì có và đó là cả một chuyên ngành trong khoa học máy tính. để làm được việc phân tích giọng nói rồi xử lý trả về kết quả cho người dùng thì trước tiên bạn nghiên cứu xử lý đầu vào là text rồi trả về kết quả cũng dạng text cho người dùng, làm được như vậy đã là thành công rồi.

    có 2 từ khóa bạn cần nghiên cứu sâu :



    mình search được cái document giới thiệu qua cho bạn
    Ref Link Code:

    chúc bạn thành công.
    Không làm việc trong lĩnh vực này nhưng cũng có 1 tí tí xíu hiểu biết nên thấy rằng 2 từ khóa mà bạn đưa ra là chưa đủ với câu hỏi của bạn chủ topic

    nlp chỉ là ở trung gian thôi
    + trước nlp còn asr cũng ko đơn giản, và
    + sau nlp thường là 1 nltk ở dạng rule base hoặc static base (hoặc kết hợp thì phải dựa vào 1 hệ chuyên gia để suy luân và có đánh giá tỉ lệ để đưa ra quyết định)

    nói thế có đúng ko nhỉ ta ơi, có gì sai mong được a em chỉ bảo ạ
    ^_,^

    Facebook : https://www.facebook.com/langmaninternet

    Bùi Tấn Quang

  8. #8
    Ngày gia nhập
    08 2011
    Bài viết
    117

    Trích dẫn Nguyên bản được gửi bởi langman Xem bài viết
    Không làm việc trong lĩnh vực này nhưng cũng có 1 tí tí xíu hiểu biết nên thấy rằng 2 từ khóa mà bạn đưa ra là chưa đủ với câu hỏi của bạn chủ topic

    nlp chỉ là ở trung gian thôi
    + trước nlp còn asr cũng ko đơn giản, và
    + sau nlp thường là 1 nltk ở dạng rule base hoặc static base (hoặc kết hợp thì phải dựa vào 1 hệ chuyên gia để suy luân và có đánh giá tỉ lệ để đưa ra quyết định)

    nói thế có đúng ko nhỉ ta ơi, có gì sai mong được a em chỉ bảo ạ
    Bạn này máy móc quá rồi, mình đưa ra 2 từ khóa mang tính gợi ý chủ topic tìm hiểu vấn đề chứ không phải để chỉ ra để tạo ra nó phải có những cái này cái kia ... về từ khóa thứ nhất muốn chủ topic tìm hiểu về xử lý ngôn ngữ tự nhiên. về từ khóa thứ 2 tìm hiểu sâu chủ topic có thể tìm hiểu bộ máy search engine làm việc thế nào nếu có đam mê thực sự có thể xây dựng một search engine. kết hợp 2 từ khóa đó chủ topic sẽ hoàn thiện tư duy một bộ máy tìm kiếm cấu trúc, xử lý thế nào để đưa ra kết quả tốt nhất cho người dùng. mình chỉ giúp được đến đó, còn việc xử lý Speech to Text cho tiếng việt để đưa vào bộ search thì bạn chủ topic phải tự nghiên cứu thêm phần này mình không giúp được gì.

  9. #9
    Ngày gia nhập
    06 2007
    Nơi ở
    C:\WINDOWS\system32\dllcache\
    Bài viết
    3,007

    Trích dẫn Nguyên bản được gửi bởi CIMinuv Xem bài viết
    Bạn này máy móc quá rồi, mình đưa ra 2 từ khóa mang tính gợi ý chủ topic tìm hiểu vấn đề chứ không phải để chỉ ra để tạo ra nó phải có những cái này cái kia ... về từ khóa thứ nhất muốn chủ topic tìm hiểu về xử lý ngôn ngữ tự nhiên. về từ khóa thứ 2 tìm hiểu sâu chủ topic có thể tìm hiểu bộ máy search engine làm việc thế nào nếu có đam mê thực sự có thể xây dựng một search engine. kết hợp 2 từ khóa đó chủ topic sẽ hoàn thiện tư duy một bộ máy tìm kiếm cấu trúc, xử lý thế nào để đưa ra kết quả tốt nhất cho người dùng. mình chỉ giúp được đến đó, còn việc xử lý Speech to Text cho tiếng việt để đưa vào bộ search thì bạn chủ topic phải tự nghiên cứu thêm phần này mình không giúp được gì.
    thế tớ mới hỏi là có sai chỗ nào ko, mà cũng là xây dựng thêm từ ý của cậu nói thôi mà.


    nhưng mà tớ ko hiểu idea của bạn về cái chỗ tại sao lại phải xây dựng 1 search engine ở trong đây?
    ^_,^

    Facebook : https://www.facebook.com/langmaninternet

    Bùi Tấn Quang

  10. #10
    Ngày gia nhập
    08 2011
    Bài viết
    117

    Trích dẫn Nguyên bản được gửi bởi langman Xem bài viết
    thế tớ mới hỏi là có sai chỗ nào ko, mà cũng là xây dựng thêm từ ý của cậu nói thôi mà.


    nhưng mà tớ ko hiểu idea của bạn về cái chỗ tại sao lại phải xây dựng 1 search engine ở trong đây?
    Về bản chất hoạt động của các chương trình này là hoạt động dựa trên một bộ search engine. Search engine đảm nghiệm nghiệm vụ tìm đáp án "gần sát nhất" với query (câu hỏi) của người dùng trong rất rất nhiều document khác nhau một cách nhanh nhất. mà công việc đó không thể làm việc với database bình thường với các document có nhiều loại format khác nhau mà cho kết quả nhanh và chính xác gần nhất được.
    Đã được chỉnh sửa lần cuối bởi CIMinuv : 20-02-2013 lúc 01:42 PM.

Các đề tài tương tự

  1. Cách sử dụng thư viện VSpeech.dll để nhận diện giọng nói Tiếng Việt?
    Gửi bởi meocon5000 trong diễn đàn Thắc mắc lập trình C#
    Trả lời: 0
    Bài viết cuối: 25-12-2013, 12:43 PM
  2. Socket Lỗi HEHException sử dụng vspeech.dll (thư viện nhận dạng giọng nói Việt)
    Gửi bởi yeucsharp trong diễn đàn Thắc mắc lập trình C#
    Trả lời: 1
    Bài viết cuối: 11-02-2013, 01:12 PM
  3. Quà tặng âm nhạc - Thay lời muốn nói
    Gửi bởi quatangamnhac trong diễn đàn Giới thiệu website, sản phẩm của bạn
    Trả lời: 1
    Bài viết cuối: 08-05-2012, 10:03 AM
  4. Kỹ thuật C dùng HTK toolkit cho ứng dụng nhận dạng giọng nói!
    Gửi bởi nbinh trong diễn đàn Thắc mắc lập trình C/C++/C++0x
    Trả lời: 4
    Bài viết cuối: 23-09-2011, 01:19 PM
  5. Các câu nói phét kinh điển (nói dóc)
    Gửi bởi Kevin Hoang trong diễn đàn Giải trí - Thư giãn
    Trả lời: 26
    Bài viết cuối: 25-04-2011, 08:57 PM

Quyền hạn của bạn

  • Bạn không thể gửi đề tài mới
  • Bạn không thể gửi bài trả lời
  • Bạn không thể gửi các đính kèm
  • Bạn không thể chỉnh sửa bài viết của bạn