Từ 1 tới 4 trên tổng số 4 kết quả

Đề tài: unicode trong c++

  1. #1
    Ngày gia nhập
    08 2018
    Bài viết
    0

    Post unicode trong c++

    File văn bản document.txt chứa một văn bản có lẫn cả các câu tiếng anh và các câu tiếng
    Việt. Các câu trong văn bản được phân cách nhau bởi dấu '.' hoặc '!'. Hãy ghi ra file văn
    bản english.txt (viet.txt) các cấu tiếng Anh (Việt) trong văn bản document.txt.

    Làm sao để phân biệt được tiếng anh và tiếng việt trong C++ vậy mấy huynh cho đệ gợi ý cái?

  2. #2
    Ngày gia nhập
    01 2008
    Nơi ở
    Rất đông người
    Bài viết
    504

    Khẳng định 1 câu là tiếng Anh (Việt) thì khó. Phủ nhận thì dễ hơn.

    Gọi s là 1 câu, nE(s) là hàm phủ nhận s là tiếng Anh, nV(s) là hàm phủ nhận s là tiếng Việt.

    Code:
    if( nE(s) && !nV(s) ) phán s là tiếng Việt.
    else if( !nE(s) && nV(s)) phán s là tiếng Anh.
    else if( !nE(s) && !nV(s) ) phán s nhập nhằng (không nhận biết được).
    else /* ( nE(s) && nV(s) ) */ phán s có lỗi.
    -...- -.- .. .-.. .-.. - .... . -... . .- ... - .-.-.

  3. #3
    Ngày gia nhập
    08 2018
    Bài viết
    0

    dạ.Thank su huynh rất nhiều.Em ko biết nút thạnk ở đâu.
    Đại loại em nghĩ đến việc xử lý dấu tiếng việt để xác định xem văn bản có phải tiếng Anh hay không Tiếng Anh thì hiển nhiên là không có sử đụng ký tự unicode dấu tiếng việt rồi. Tiếng Việt thì ký tự kết thúc không thể là 1 phụ âm R,B,D ...vvv rồi.
    File này đã được chuẩn hóa về câu, và chắc là chỉ có thể là tiếng Anh hoặc tiếng Việt.
    Em thắc mắc về cách cài đặt thuật toán với kiểu file unicode. Anh chị nào đã kinh qua khoản này của C++ có thể cho em xin tài liệu hoặc 1 ví dụ khai sáng được không ạ.Ví như cách tổ chức các dấu câu tiếng Việt trong Uịcode có đặc điểm gì đặc biệt để nhận ra không ạ. Hay ta phải đọc từng kí tự và so sánh nó với tập các dấu tiếng Việt.

  4. #4
    Ngày gia nhập
    08 2018
    Bài viết
    0

    Vấn đề này hay gặp ví dụ như tách các chú thích tiếng anh trong 1 đoạn văn tiếng việt.

    Hãy tách các đoạn chú thích trong cặp ngoặc đơn và xác định xem nó là tiếng anh hay tiếng việt, và xác định xem nó chú thích cho cái gì.

    "Mỗi pha nói Irên, đặc biệt là pha xây dựng và có thể cả pha triển
    khai, lại được chia thành một số vòng lặp (kéo dài độ 2 đến 4 tuần).
    Mổi vòng lặp sẽ hoàn thành một phần của hệ thống và trải qua nãm
    công đoạn (workflow) sau: nắm bắt yêu cầu, phân tích và thiết kế, thực
    thi, kiểm định và bố trí. Đương nhiên liều lượng cho mỗi công đoạn đó
    trong mỗi vòng lặp là tuỳ thuộc vòng lặp đó ở pha nào: ớ các pha đầu
    thì các công đoạn đầu (nắm bắt yêu cầu. phàn tích thiết kế) được nhấn
    mạnh, còn ở các pha cuối thì các công đoạn cuối (thực thi, kiểm định,
    bố trí) lại được nhấn mạnh."

    Đây là 1 vấn đề mà em đang tìm hiểu. Bác nào thấy hứng thú cho thử 1 giải pháp coi.
    Tiện thể ai đó hướng dẫn làm 1 cái trình soạn thảo văn bản tiếng việt đơn giản hoặc 1 cái từ điển tiếng việt, cần chuẩn bị những kiến thức gì ạ.
    Đã được chỉnh sửa lần cuối bởi emyeuvn : 08-09-2018 lúc 08:59 AM.

Tags của đề tài này

Quyền hạn của bạn

  • Bạn không thể gửi đề tài mới
  • Bạn không thể gửi bài trả lời
  • Bạn không thể gửi các đính kèm
  • Bạn không thể chỉnh sửa bài viết của bạn