Trang 8 trên tổng số 8 Đầu tiênĐầu tiên ... 678
Từ 71 tới 71 trên tổng số 71 kết quả

Đề tài: một phương pháp mã hóa tiếng Việt

  1. #71
    Ngày gia nhập
    01 2008
    Nơi ở
    Rất đông người
    Bài viết
    745

    Mặc định một phương pháp mã hóa tiếng Việt

    Bài này chỉnh lý các định nghĩa, để hợp nhất mã A3 và A3' dưới tên gọi A3. Đồng thời, hoàn toàn tương tự, mã A4 và A4' được hợp nhất dưới tên A4. Mục đích của việc viết thêm thành 1 bài riêng là để tránh edit các bài đã viết trước đây. (Vả lại, để trình bày ý tưởng, dẫn dắt từ mã D, D', C, C' sang A3, A3' là một bước đi tự nhiên, hợp lý.)

    Mục đích của sự chỉnh lý là đơn giản hoá mô tả và bám sát thực tế. Một lợi ích phụ, mô tả mới rõ ràng, chính xác hơn. Thí dụ về sự xa rời thực tế tồn tại là A3 tuy được viện dẫn thường xuyên trong loạt bài nhưng trong thực tế lập trình nó không được dùng, mã được dùng là A3'. Thí dụ về sự phức tạp hiện tại là khái niệm lủng củng "hai ký tự giống nhau về hình thái nhưng khác nhau về nội hàm". Thí dụ về sự mơ hồ, thiếu chính xác hiện tại là khẳng định "mã A4 có nhiều hơn 256 ký tự nhưng chỉ có không quá 256 ký tự phân biệt".

    Nhắc lại [#24], trong B+, chữ (không kể thanh) là một cặp, gồm mã âm đầu và mã âm vần. Nhắc lại, việc tạo ra mã A3 và A3' chẳng qua là việc ký tự hoá mã B+, mà cụ thể là giải nén tiền tố (âm đầu) và giữ nguyên hậu tố (âm vần): trong A3 và A3', chữ (không kể thanh) trở thành một xâu, với âm vần là 1 ký tự còn âm đầu có thể gồm nhiều ký tự, trong đó mỗi ký tự ứng với 1 chữ cái của nguyên bản tiếng Việt. (Nói thật đúng, "tiếng Việt mới", vốn là tiếng Việt ngoại trừ vài sai biệt, như ngèo thay cho nghèo [#24] và thay cho ghê [#70].)

    Mã A3 bây giờ được định nghĩa theo cách dựng [mới] như sau:

    1. Lập danh sách tất cả các âm vần của mã B+.

    2. Thêm vào danh sách các âm đầu là chữ cái của mã B+. (Âm đầu là chữ ghép, chẳng hạn chdz, thì bỏ qua.)

    3. Loại bỏ trùng lắp trong danh sách. (Có những chữ cái và chữ ghép trong bảng mã B+ xuất hiện một cách trùng lặp. Ví dụ, ua xuất hiện hai lần trong bảng mã âm vần. Ví dụ khác, c có mặt trong cả bảng mã âm đầu lẫn trong bảng mã âm vần.)

    4. Sắp xếp danh sách theo thứ tự chính tả (tự điển) và gán mã số theo thứ tự đã sắp xếp.

    Chú ý rằng Bảng 3e, mang tiêu đề "bảng mã A3", bây giờ trở thành bất hợp lệ, còn Bảng 7 (tập hợp các ký tự của mã A3, A3'), vốn chính là danh sách đã sắp xếp, vẫn hợp lệ như thường, với tiêu đề mới "danh sách các ký tự của mã A3".

    Tương tự, Bảng 8 vẫn hợp lệ với tiêu đề mới "danh sách các ký tự của mã A4".
    Đã được chỉnh sửa lần cuối bởi Ada : 29-01-2023 lúc 06:18 AM.
    -...- -.- .. .-.. .-.. - .... . -... . .- ... - .-.-.

Trang 8 trên tổng số 8 Đầu tiênĐầu tiên ... 678

Các đề tài tương tự

  1. Dịch vụ gửi hàng hóa đi Australia, gửi hàng hóa đi France, gửi hàng hóa đi Germany, gửi hàng hóa đi Janpan giá rẻ.
    Gửi bởi sales5ttico trong diễn đàn Giới thiệu website, sản phẩm của bạn
    Trả lời: 1
    Bài viết cuối: 30-07-2014, 02:51 PM
  2. Tính thành tiền trong bảng hóa đơn từ bảng chi tiết hóa đơn
    Gửi bởi tuanvi261 trong diễn đàn Thắc mắc đại cương Database & Reporting
    Trả lời: 2
    Bài viết cuối: 06-05-2013, 08:32 PM
  3. Hóa chất làm giảm điện trở đất, bột than tiếp địa, cọc tiếp địa, cọc thép mạ đồng, kim thu sét ese
    Gửi bởi chong set trong diễn đàn Giới thiệu website, sản phẩm của bạn
    Trả lời: 0
    Bài viết cuối: 18-04-2012, 12:33 PM
  4. Gọi hàm con.. tiến hóa khôn lường
    Gửi bởi luckyfor trong diễn đàn Nhập môn lập trình C/C++
    Trả lời: 5
    Bài viết cuối: 06-10-2011, 03:58 PM

Tags của đề tài này

Quyền hạn của bạn

  • Bạn không thể gửi đề tài mới
  • Bạn không thể gửi bài trả lời
  • Bạn không thể gửi các đính kèm
  • Bạn không thể chỉnh sửa bài viết của bạn