Từ 1 tới 4 trên tổng số 4 kết quả

Đề tài: Xác định mức độ giống nhau khi so sánh hai chuỗi tiếng Anh

  1. #1
    Ngày gia nhập
    05 2011
    Bài viết
    96

    Mặc định Xác định mức độ giống nhau khi so sánh hai chuỗi tiếng Anh

    Chào các bạn,
    ...
    Cho 3 chuỗi sau:
    str1 = "I'm a student, I can play football".
    str2 = "I'm a programmer, I can play billar".
    str3 = "Steve Jobs was died, I can't football".

    ...
    Có cách nào để đưa ra mức độ giống nhau từng đôi một của 3 chuỗi trên không các bạn.
    V/d:
    (str1,str2), (str1,str3), (str2,str3).

    Chú ý: (a,b), thì lấy b làm chuỗi gốc, lấy a so sánh với b.

    3 chuỗi trên là ngắn, trường hợp mỗi chuỗi có 10.000 char thì quét lặp đừ. Ko biết có giải pháp nào tối ưu ko.Các bạn tư vấn giúp

  2. #2
    Ngày gia nhập
    10 2009
    Bài viết
    13

    theo mình hiểu thì công việc của bạn tương tự như Parsing trong NLP

    đại khái nó như sau: đưa vào 1 câu tiếng Anh -> chuyển về dạng cấu trúc
    ví dụ:
    Code:
    "I'm a student, I can play football." -> /PRP /VBP /DT /NN /, /PRP /MD /VB /NN
    "I'm a programmer, I can play billar" -> /PRP /VBP /DT /NN /, /PRP /MD /VB /NN
    Tiếp theo chắc chỉ là vấn đề so sánh chuỗi nhỉ =)

    Ở đây có một số thuật toán làm việc này như CYK, Earley ...
    mình không nêu chi tiết thuật toán vì không biết công việc của bạn yêu cầu ở mức nào.


    Tuy nhiên mình xin giới thiệu 2 tools cho việc này:
    - c# code: SharpNLP
    - online: http://nlp.********.edu:8080/parser/index.jsp

  3. #3
    Ngày gia nhập
    05 2011
    Bài viết
    96

    Ở đây có một số thuật toán làm việc này như CYK, Earley ...
    mình không nêu chi tiết thuật toán vì không biết công việc của bạn yêu cầu ở mức nào.
    ...
    Mình đang viết giải thuật chống SPAM. Khi user post nội dung trùng lặp nhiều lần thì nghi ngờ. .

    Thank @gierusalem.
    Yeah, NLP ok. Giờ tìm hiểu.
    Bạn tư vấn vài tài liệu tin tưởng nha.

  4. #4
    Ngày gia nhập
    10 2009
    Bài viết
    13

    Trích dẫn Nguyên bản được gửi bởi nhuan07 Xem bài viết
    Yeah, NLP ok. Giờ tìm hiểu.
    Bạn tư vấn vài tài liệu tin tưởng nha.

    NLP là lĩnh vực rộng, bạn tìm hiểu chắc cũng kha khá time mới đến nơi đến chốn.
    Bạn nên tập trung vào lĩnh vực hẹp là parsing + 2 thuật toán như mình nêu trên.
    Tốt nhất là sử dụng lại 2 source mình đưa là tốt nhất


    Ngoài ra bạn tham khảo book sau (theo mình là đầy đủ + cơ bản)
    Code:
    Speech&Language Procesing An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition
    phần III: syntax

Các đề tài tương tự

  1. Tìm chuỗi pattern không liên tiếp có trong chuỗi str cho trước ?
    Gửi bởi kimchinh_no1 trong diễn đàn Nhập môn lập trình Java
    Trả lời: 2
    Bài viết cuối: 23-07-2012, 01:58 PM
  2. Bài tập C++ Cách để so sánh 2 chuỗi kí tự giữa chuỗi nhập từ phím và chuỗi từ file xem có giống nhau không?
    Gửi bởi davilson18 trong diễn đàn Nhập môn lập trình C/C++
    Trả lời: 4
    Bài viết cuối: 09-06-2012, 09:47 AM
  3. Tìm chuỗi con gồm các số giống nhau liên tiếp dài nhất của một chuỗi cho trước
    Gửi bởi dailammoc trong diễn đàn Thắc mắc CTDL & Giải thuật
    Trả lời: 8
    Bài viết cuối: 07-02-2012, 09:03 PM
  4. Chuyển chuỗi tiếng việt sang chuỗi số và ngược lại
    Gửi bởi saonam trong diễn đàn Thắc mắc lập trình C#
    Trả lời: 5
    Bài viết cuối: 18-06-2011, 07:28 AM
  5. Có cách nào kiểm tra một chuỗi trong textbox có phải chuỗi tiếng Việt có dấu ko?
    Gửi bởi bachhaiduong trong diễn đàn Thắc mắc lập trình C#
    Trả lời: 11
    Bài viết cuối: 26-04-2010, 07:52 PM

Quyền hạn của bạn

  • Bạn không thể gửi đề tài mới
  • Bạn không thể gửi bài trả lời
  • Bạn không thể gửi các đính kèm
  • Bạn không thể chỉnh sửa bài viết của bạn