Từ 1 tới 7 trên tổng số 7 kết quả

Đề tài: Làm sao để biết Encoding của một file bằng C#?

  1. #1
    Ngày gia nhập
    12 2008
    Bài viết
    17

    Mặc định Làm sao để biết Encoding của một file bằng C#?

    Hiện tại, tôi đang làm một bài tập, tất cả dừng như đã được giải quyết. Nhưng vấn đề thực sự xảy ra thực hiện với một tool mà tôi may mắn tìm ra được, tuy nhiên tôi có gắng tạo một tập dữ liệu phù hợp với tool này, nhưng mọi cố gắng đều không mang lại kết quả. Mọi hình thức thể hiện của tôi với mô tả của hệ thống đều đúng, và tôi phát hiện ra vấn đề rằng Encoding của chúng có sự khác biệt. Thật sự tôi muốn biết encoding của file trong hệ thống này. Mong các bạn có thể giúp đỡ. Xin chân thành cảm ơn!
    p/s: tôi có up file đính kèm để bạn có thể có dữ liệu trực quan. Tôi thực hiện bài tạp với tool The µ-TBL system.
    Attached Files Attached Files

  2. #2
    Ngày gia nhập
    02 2010
    Bài viết
    73

    Không hiều ý của anh lắm.
    Có phải ý của giống như đọc 1 file text có đuôi lạ và khi anh đọc bằng StreamReader do không biết Encoding của nó nên đọc không đúng định dạng phải không.( tại file của anh ở trên là 1 file text nên em đoán thế :P). Nếu vấn đề của anh tương tự như vậy thì em có cái mẹo là mở file( dĩ nhiên là 1 file text) bằng notepad++ xong bấm vào Encoding thì sẽ biết được Encoding của file text đó.
    Notepad++

    Use Mozilla*
    Again, this is not a fool-proof method, and is not as elegant as auto_ef, but Mozilla is available for most platforms - for free.
    Using this technique, it is important to know the language of the page, so that you can accurately determine the encoding.

    * Open your file in Mozilla. If the text displays properly, then simply do View / Character Encoding, and the marked character encoding is the character encoding of your page.
    * If the text does not display correctly, then do the following:
    o Firstly make sure that you have the correct font support. If you believe that your page contains say Japanese, then go to a Japanese web site and ensure that the text displays correctly.
    o If you've established that you have the correct font support, go to View / Character Encoding, and change the character encoding to what you think it could be. When the page eventually displays correctly, you've found the correct character encoding of your page.

    *Most other browsers have similar functionality.
    http://developers.sun.com/global/tec...-encoding.html thấy cách này cũng chính xác lắm nè
    Đã được chỉnh sửa lần cuối bởi tamthientai : 12-10-2011 lúc 03:37 AM.

  3. #3
    Ngày gia nhập
    02 2011
    Nơi ở
    Tp.HCM
    Bài viết
    124

    Có lẽ là một số ký tự bạn đọc không được?
    Nhìn thì các ký tự không nằm trong bảng chữ cái của tiếng Anh và tiếng Việt nhưng vẫn nằm trong bảng mã ASCII.

    Nếu bạn không chọn Font VNI hay TCVN3 thì các chữ đó vẫn không đổi.

    Nếu nhìn đuôi file mà muốn biết cấu trúc như thế nào hay dùng chương trình gì để đọc thì bạn vào trang này http://www.wotsit.org/list.asp?fc=0. Nếu không có tức là dạng file chưa được công bố.
    Đã được chỉnh sửa lần cuối bởi LieuLuc : 12-10-2011 lúc 08:26 AM.

  4. #4
    Ngày gia nhập
    12 2008
    Bài viết
    17

    Trích dẫn Nguyên bản được gửi bởi LieuLuc Xem bài viết
    Có lẽ là một số ký tự bạn đọc không được?
    Nhìn thì các ký tự không nằm trong bảng chữ cái của tiếng Anh và tiếng Việt nhưng vẫn nằm trong bảng mã ASCII.

    Nếu bạn không chọn Font VNI hay TCVN3 thì các chữ đó vẫn không đổi.

    Nếu nhìn đuôi file mà muốn biết cấu trúc như thế nào hay dùng chương trình gì để đọc thì bạn vào trang này http://www.wotsit.org/list.asp?fc=0. Nếu không có tức là dạng file chưa được công bố.
    Đúng là tôi không tìm thấy Encoding của nó trong website mà bạn chỉ, tuy nhiên nó được giới thiệu tại đây:
    http://www.scss.tcd.ie/undergraduate...WCX%20Concepts
    Tôi và các bạn của tôi đã thử Encoding trực tiếp bằng C#, hầu hết các định dạng được giới thiệu, nhưng kết quả không như mong muốn
    Cảm ơn bạn rất nhiều!

  5. #5
    Ngày gia nhập
    12 2008
    Bài viết
    17

    Trích dẫn Nguyên bản được gửi bởi tamthientai Xem bài viết
    Không hiều ý của anh lắm.
    Có phải ý của giống như đọc 1 file text có đuôi lạ và khi anh đọc bằng StreamReader do không biết Encoding của nó nên đọc không đúng định dạng phải không.( tại file của anh ở trên là 1 file text nên em đoán thế :P). Nếu vấn đề của anh tương tự như vậy thì em có cái mẹo là mở file( dĩ nhiên là 1 file text) bằng notepad++ xong bấm vào Encoding thì sẽ biết được Encoding của file text đó.
    Notepad++

    Use Mozilla*
    Again, this is not a fool-proof method, and is not as elegant as auto_ef, but Mozilla is available for most platforms - for free.
    Using this technique, it is important to know the language of the page, so that you can accurately determine the encoding.

    * Open your file in Mozilla. If the text displays properly, then simply do View / Character Encoding, and the marked character encoding is the character encoding of your page.
    * If the text does not display correctly, then do the following:
    o Firstly make sure that you have the correct font support. If you believe that your page contains say Japanese, then go to a Japanese web site and ensure that the text displays correctly.
    o If you've established that you have the correct font support, go to View / Character Encoding, and change the character encoding to what you think it could be. When the page eventually displays correctly, you've found the correct character encoding of your page.

    *Most other browsers have similar functionality.
    http://developers.sun.com/global/tec...-encoding.html thấy cách này cũng chính xác lắm nè
    File này được tạo bởi chương trình SICtus Prolog. Tuy nhiên, khi bạn mở bằng Notepad++, nó luôn hiện Encoding cho bạn là ANSI, và sử dụng định dạng của hệ điều hành là UNIX. Tuy nhiên, chúng ta không thể biết Encoding của nó có ISO bao nhiêu. Và, tôi cũng đã thử tạo file trên Ubuntu 11.04, nhưng kết quả vẫn không như mong muốn.
    Cảm ơn bạn rất nhiều!

  6. #6
    Ngày gia nhập
    02 2010
    Bài viết
    73

    Mặc định Làm sao để biết Encoding của một file bằng C#?

    Trích dẫn Nguyên bản được gửi bởi blumbebe Xem bài viết
    File này được tạo bởi chương trình SICtus Prolog. Tuy nhiên, khi bạn mở bằng Notepad++, nó luôn hiện Encoding cho bạn là ANSI, và sử dụng định dạng của hệ điều hành là UNIX. Tuy nhiên, chúng ta không thể biết Encoding của nó có ISO bao nhiêu. Và, tôi cũng đã thử tạo file trên Ubuntu 11.04, nhưng kết quả vẫn không như mong muốn.
    Cảm ơn bạn rất nhiều!
    Cách mở bằng Firefox phía dưới có cho bạn biết ISO đấy

  7. #7
    Ngày gia nhập
    12 2008
    Bài viết
    17

    Trích dẫn Nguyên bản được gửi bởi tamthientai Xem bài viết
    Cách mở bằng Firefox phía dưới có cho bạn biết ISO đấy
    Tôi đã thử cách của bạn, tất cả các file đều cho thấy là UTF-8. Tuy nhiên, chắc chắn có sự khác biệt nào đó!
    Xin cảm ơn!

Các đề tài tương tự

  1. Cách lưu file text với encoding Unicode?
    Gửi bởi gamowaxaky trong diễn đàn Thắc mắc lập trình Visual C++
    Trả lời: 6
    Bài viết cuối: 09-04-2013, 09:14 PM
  2. Đọc ma trận từ file text có sử dụng biến con trỏ???. Mình không biết sai ở đâu???
    Gửi bởi manhkhang trong diễn đàn Thảo luận, góp ý code C/C++ của bạn
    Trả lời: 1
    Bài viết cuối: 21-07-2012, 03:28 PM
  3. Thuộc tính khóa ngoài( tham chiếu) biến mất khi biến đổi từ file XML sang DataTable
    Gửi bởi itmanhieu trong diễn đàn Thắc mắc lập trình C#
    Trả lời: 0
    Bài viết cuối: 17-08-2011, 08:02 PM
  4. Vấn đề khi kiểm tra dạng encoding của file txt (ko nhận dạng được)
    Gửi bởi j3amboo trong diễn đàn Nhập môn lập trình C/C++
    Trả lời: 4
    Bài viết cuối: 29-05-2011, 02:56 AM
  5. Lưu file với Encoding là Unicode trong C# ?!!?
    Gửi bởi hoangtu2811 trong diễn đàn Thắc mắc lập trình C#
    Trả lời: 2
    Bài viết cuối: 13-07-2009, 12:29 PM

Quyền hạn của bạn

  • Bạn không thể gửi đề tài mới
  • Bạn không thể gửi bài trả lời
  • Bạn không thể gửi các đính kèm
  • Bạn không thể chỉnh sửa bài viết của bạn