Từ 1 tới 4 trên tổng số 4 kết quả

Đề tài: Tạo từ điển Anh-Việt, lưu vào file bằng cấu trúc cây nhị phân tìm kiếm

  1. #1
    No Avatar
    echip_it Khách

    Red face Tạo từ điển Anh-Việt, lưu vào file bằng cấu trúc cây nhị phân tìm kiếm

    Ban nao biet cach tao tu dien Anh_Viet bang cau truc cay nhi phan tim kiem co the luu vao file roi doc chung thi giup minh voi! cam on !
    Minh muon hoi : cay nhi phan tim kiem : moi nut chi chua 1 du lieu(kieu int) ,vay thi khi tao tu dien ta phai lam the nao de tao 1 nut co 2 du lieu:
    du lieu de nhap vao tu can tra ,"vdu nhu:he", thi du lieu xuat ra la "anh ta"
    Sau do co the sap xep tu dien theo thu tu ABC...
    Day la cau truc ccay nhi phan voi phan du lieu chi co 1 thong tin(kieu int)
    C++ Code:
    1. typedef struct tagTNode
    2. {
    3.     int Key;
    4.     struct tagTNode  *pLeft, *pRight;
    5. }TNODE;
    6.  
    7. typedef TNODE *TREE;
    Đã được chỉnh sửa lần cuối bởi Kevin Hoang : 15-10-2006 lúc 06:37 PM. Lý do: Viết bài không có dấu

  2. #2
    Ngày gia nhập
    10 2006
    Nơi ở
    Hà Nội
    Bài viết
    146

    bạn có thể định nghĩa kiểu dữ liệu tùy bạn, ví dụ.
    C++ Code:
    1. struct tudien{
    2.  char english[];
    3.  char vietnam[];
    4. }tdien;
    5. typedef struct tagTNode
    6. {
    7. tdien *td;
    8. struct tagTNode *pLeft, *pRight;
    9. }TNODE;
    10.  
    11. typedef TNODE *TREE;
    vậy là được mà.

  3. #3
    Ngày gia nhập
    07 2006
    Nơi ở
    Hanoi, Vietnam
    Bài viết
    2,749

    Bạn echip_IT nên viết bài có dấu nhé, nếu không các anh Admin hay mod xóa đi thì tiếc lắm đó.

    Tham khảo cái này xem sao nhé.

    Trích dẫn Nguyên bản được gửi bởi pcworld.com.vn
    Công cụ cần thiết nhất khi học ngoại ngữ chính là từ điển. Chắc hẳn các bạn cũng như tôi luôn cảm thấy vất vả khi phải tra từ trên cuốn từ điển dày cộp. Giải pháp đáng giá là sử dụng ứng dụng từ điển trên máy vi tính. Mặc dù hiện nay các ứng dụng từ điển đã có nhiều nhưng vốn là dân tin học, tôi đã quyết định tự xây dựng cho mình một ứng dụng từ điển riêng.

    Cơ sở dữ liệu

    Phần quan trọng nhất đối với một ứng dụng từ điển chính là cơ sở dữ liệu (CSDL). Việc xây dựng CSDL cho từ điển phải đảm bảo được khả năng truy cập nhanh bởi dữ liệu của từ điển thường khá lớn, lên tới hàng chục nghìn từ. Thật may, DICT.ORG (www.dict.org) đã xây dựng một format (định dạng) từ điển rất dễ sử dụng, format này đã được dùng để xây dựng những bộ từ điển khá lớn. Dict format được mô tả như sau: toàn bộ CSDL được chứa trong 2 file, một file chứa nghĩa của từ và một file index. File index bao gồm tên từ, vị trí nghĩa của từ bắt đầu trong file chứa nghĩa và độ dài của nghĩa. Vị trí bắt đầu và độ dài của nghĩa được mã hoá theo cách như sau: Sử dụng 64 chữ cái: ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwx yz0123456789+/

    chữ cái A tương đương số 0, chữ cái B tương đương số 1 v.v... Giữa từ, vị trí bắt đầu và độ dài nghĩa phân cách nhau bởi ký tự tab (ASCII 9). Mỗi dòng trong file index chứa dữ liệu của một từ. Các dòng phân cách nhau bởi ký tự xuống dòng (ASCII 10).

    Ví dụ trong file index của từ điển Đức-Việt có một dòng như sau:

    Abdeckung kbpP D3

    Như vậy nghĩa của từ Abdeckung trong file chứa nghĩa sẽ bắt đầu tại offset kbpP (theo mã 64 ký tự) và có độ dài là D3.

    Việc chuyển từ mã cơ số 64 về cơ số 10 được thực hiện như sau:

    Đối với vị trí bắt đầu: kbpP. Ta có k (ở cơ số 64) = 36 (ở cơ số 10), b = 27, p = 41, P = 15. Như vậy chuyển sang cơ số 10, mã kbpP có giá trị là: 36*643 + 27*642 + 41*641 + 15*640 = 9550415

    Đối với độ dài nghĩa: D3. Ta có D = 3, 3 = 55. Như vậy chuyển sang cơ số 10, mã D3 ở cơ số 64 có giá trị là: 247.

    File index được sắp xếp để giảm bớt thời gian tìm kiếm. Việc mã hoá theo cơ số 64 như trên giúp cho kích thước file index giảm xuống rất nhiều so với không mã hóa.

    Còn cấu trúc của file chứa nghĩa gồm các phần như sau:
    @headword
    * tu loai (noun, verb...)

    - dinh nghia 1
    = cau vi du cho dinh nghia 1 + nghia cua cau do

    - dinh nghia 2
    = cau vi du cho dinh nghia 2 + nghia cua cau do
    * tu loai

    - dinh nghia 3

    Nghĩa của mỗi từ gồm một phần như trên, các nghĩa của mỗi từ nối tiếp nhau liên tục.

    Như vậy, các bạn hoàn toàn có thể xây dựng cho mình các bộ từ điển riêng. Tuy nhiên, công việc nhập dữ liệu lại không hề đơn giản chút nào. Nhưng, lại một lần nữa, chúng ta thật may mắn vì có một số bạn đã bỏ công nhập sẵn một số bộ từ điển thông dụng. Các bạn có thể tham khảo thêm tại: www.ttdomain.net/ttdownload/, www.informatik.uni-leipzig.de/~duc/Dict/, huybien.vze.com... Ngoài ra còn rất nhiều bộ từ điển chuyên dụng khác nữa, các bạn có thể tham khảo thêm ở các địa chỉ trên hoặc tại www.dict.org.

    Xây dựng chương trình

    Ở đây tôi xin trình bày cách sử dụng ngôn ngữ Visual C++ 6.0 và thư viện MFC. Các bạn hoàn toàn có thể sử dụng các ngôn ngữ khác. Trong khuôn khổ bài viết, tôi chỉ xin đưa ra những phần chủ yếu nhất. Các phần như thiết kế giao diện, bố trí giao diện v.v... các bạn có thể tham khảo chương trình mẫu và tự sáng tạo thêm.

    1. Các thành phần giao diện cơ bản:

    • Edit Box: dùng để nhập từ. Cài biến cho điều khiển: 'Variable name: m_word, Category: Value, Type: Cstring;'

    • WebBrowser: dùng để hiện nghĩa của từ. Việc sử dụng WebBrowser chỉ nhằm mục đích hiển thị nghĩa trực quan và sinh động hơn bằng cách xử lý chuỗi (sẽ được đề cập sau này). Bạn có thể thêm điều khiển ActiveX Web Browser vào ứng dụng của mình bằng cách chọn Project->Add to Project->Components And Controls, chọn trong thư mục Registered ActiveX Controls điều khiển Microsoft Web Browser. Cài biến cho điều khiển: 'Variable name : m_wordmean;'

    • Listbox, dùng để hiện danh sách từ. Cài biến cho điều khiển: 'Variable name: m_wordlist; Category: Control;'

    • Listbox, dùng để lưu trữ dữ liệu về từ. Cài biến cho điều khiển: 'Variable name: m_worddata, Category:Control;'

    2. Mã chương trình:

    • Nạp dữ liệu vào các list box: bạn đặt phần mã này ở sự kiện WM_OnInitDialog() để dữ liệu được nạp ngay từ lúc khởi động chương trình. Ở đây, bạn thay tên file index bằng tên file tương ứng với từ điển bạn sử dụng.

    Code:
    FILE *inFile;
    
    inFile = fopen ('mydic.index','r');
    
    if (inFile == NULL){
    
    MessageBox ('Cannot open index file');
    
    }else {
    
         char * line;
    
         char lineBuf[100];
    
         line = (char *) lineBuf;
    
         m_wordlist.ResetContent();
    
         m_worddata.ResetContent();
    
         CString word = '';
    
         CString sWord = '';
    
         CString sData = '';
    
         while (!feof(inFile)){
    
            fgets(line,99,inFile);
    
            if (strlen(line)>=2){
    
                word = line;
    
                int pos = word.Find('\t',0);
    
                sWord = word.Left(pos);
    
         sData = word.Mid(pos+1,word.
    
                          GetLength()-pos-1);
    
         if (sData.Find('\n',0) > 0){
    
            sData = sData.Left(sData.
    
                          GetLength()-1); }
    
         if (sWord.GetLength()>=1){
    
            m_wordlist.AddString(sWord);
    
            m_worddata.AddString(sData);}
    
    } } }
    
    fclose(inFile);
    • Hàm chuyển từ mã cơ số 64 sang cơ số 10

    Code:
    int GetDemicalValue (CString str){
    
       CString base64 = 'ABCDEFGHIJKLM-NOPQRSTUVWXYZabcdefghijklmnopqrstu-vwxyz0123456789+/';
    
        int decValue = 0;
    
        int len = str.GetLength();
    
        for (int i = 0; i<len; i++){
    
              int pos = base64.Find(str.
    
                     GetAt(i),0);
    
              decValue += (int)pow(64,len-i-
    
                                1)*pos;
    
     }
    
    return decValue;
    
    }
    • Hàm xử lý chuỗi ký tự nghĩa. Như đã đề cập ở trên, tôi sử dụng điều khiển Web Browser để hiển thị nghĩa cho thêm phần sinh động. Hàm này có tác dụng xử lý chuỗi ký tự nghĩa bằng cách thêm các tag HTML để nghĩa được thể hiện sinh động hơn ví dụ như: các nghĩa con thì in đậm, chữ đỏ, các ví dụ thì in nghiêng, chữ xanh v.v...

    Code:
    CString ChangeStyle(CString wordmean){
    
       CString meaning = wordmean;
    
       meaning = meaning.Right(meaning.GetLength()-1);
    
       int pos = meaning.Find('\n',1);
    
       meaning.Insert(pos,'</b>');
    
       meaning = '<b>' + meaning;
    
       meaning.Replace('\n','<br>');
    
       meaning.Replace('{','<font color=\'#FF0000\'><b>');
    
       meaning.Replace('}','</b></font>');
    
       meaning.Replace('[','<font color=\'#FF0000\'><b>');
    
       meaning.Replace(']','</b></font>');
    
       meaning.Replace('+',' ');
    
       return meaning;
    
    }
    • Hàm lấy nghĩa của từ: hàm này có tác dụng đọc từ file chứa nghĩa để lấy nghĩa của từ, sau đó xử lý chuỗi nghĩa rồi ghi ra file temp.htm. Nếu lấy nghĩa thành công, hàm trả về giá trị TRUE, nếu lấy nghĩa không thành công, hàm trả về giá trị FALSE. Bạn thay tên file mydict.dict bằng tên của file từ điển tương ứng.

    Code:
    BOOL CXDictDlg::GetMeaning (){
    
        CFile f;
    
        CString meaning='';
    
        if (f.Open('mydic.dict',CFile::modeRead) == FALSE) {
    
             meaning = 'Can not open database file!';
    
    } else {
    
          CString sOffLen;
    
          m_worddata.GetText(m_wordlist.GetCurSel(),sOffLen);
    
          int pos = sOffLen.Find('\t',0);
    
          CString sOff = sOffLen.Left(pos);
    
          CString sLen = sOffLen.Right(sOffLen.GetLength()-pos-1);
    
          int iOff = GetDemicalValue(sOff);
    
          int iLength = GetDemicalValue(sLen);
    
          int temp = f.Seek(iOff,CFile::begin);
    
          char buff[64];
    
          DWORD dwRead;
    
          do {
    
             if (iLength>=64)
    
               dwRead = f.Read(buff,64);
    
         else
    
              dwRead = f.Read(buff,iLength);
    
              iLength -= dwRead;
    
              CString stemp = buff;
    
              stemp = stemp.Left(dwRead);
    
              meaning += stemp;
    
         }while (iLength>0);
    
          f.Close();
    
    }
    
    meaning = ChangeStyle(meaning);
    
    CString strHtml('');
    
    strHtml += '<html>\n<head>\n';
    
    strHtml += '****** **********=\'Content-Type\' content=\'text/html; charset=utf-8\'>\n';
    
    strHtml += '</head>\n<body>\n';
    
    strHtml += meaning + '\n</body>\n</html>';
    
    CFile f2;
    
    if (f2.Open('temp.htm',CFile::modeCreate | CFile::modeWrite) == FALSE){
    
             MessageBox('Cannot write meaning file!','Error!');
    
             return 0;
    
    }
    
    f2.Write(strHtml,strHtml.GetLength());
    
    f2.Close();
    
    return 1;
    
    }
    • Hiển thị nghĩa của từ, bạn cài đoạn mã này vào sự kiện DoubleClick của điều khiển list box.

    Code:
    BOOL gm = GetMeaning();
    
    if (gm){
    
           m_wordlist.GetText(m_wordlist.GetCurSel(),m_word);
    
           UpdateData(FALSE);
    
              // Lay duong dan cua thu muc hien thoi
    
           DWORD cchCurDir;
    
           LPTSTR lpszCurDir;
    
           TCHAR buffer[MAX_PATH];
    
            lpszCurDir = buffer;
    
          GetCurrentDirectory(cchCurDir, lpszCurDir);
    
          CString str = lpszCurDir;
    
          str = 'file://'+str+'\\temp.htm';
    
    //Hien thi nghia cua tu
    
    m_wordmean.Navigate
    
    (str,NULL,NULL,NULL,NULL);
    
    }else {
    
          MessageBox('Can't get the meaning of the word');
    
    }
    • Tìm kiếm từ trong list box tương ứng với sự thay đổi trong từ nhập trong điều khiển Edit. Bạn cài đặt phần mã này vào sự kiển EN_CHANGE của điều khiển Edit. Như vậy mỗi khi bạn đánh 1 ký từ vào điều khiển Edit, chương trình sẽ tự động tìm một từ gần giống nhất trong danh sách các từ.

    UpdateData(TRUE);

    m_wordlist.SelectString(-1,m_word);

    Sau khi xây dựng thành công, chương trình sẽ có giao diện như hình.

    Trên đây, tôi đã trình bày cách thức xây dựng một ứng dụng từ điển đơn giản. Với những sáng tạo và các kiến thức đã có, bạn hoàn toàn có thể bổ sung những khả năng mới cho ứng dụng từ điển này để nó không thua kém các phần mềm từ điển thương mại. Ngoài ra, với một format từ điển khá đơn giản như trên, bạn có thể dễ dàng xây dựng thêm một ứng dụng nữa để tạo từ điển mới một cách tự động.

    Tôi cũng xin giới thiệu cho bạn một số địa chỉ các phần mềm có sử dụng các bộ từ điển theo chuẩn của DICT.ORG để các bạn tham khảo thêm:

    • Trang Web của Hồ Ngọc Đức, www.informatik.uni-leipzig.de/~duc/Dict/, tại đây bạn có thể tra từ điển trực tuyến hoặc download ứng dụng viết bằng Java và các file từ điển để chạy trực tiếp trên máy.

    o PowerClick, www.ttdomain.net/ttdownload. Phần mềm đã được giới thiệu trên TGVT - PCW VN A 7/2004, có khả năng tra theo kiểu Click and See trên một số ứng dụng.

    • E-lexicon, www.edusoft.com.vn. Phần mềm đã được giới thiệu trên TCVT - PCW VN A 7/2004, làm việc theo mô hình Client - Server.

    • MultiDictionary, http://huybien.vze.com/. Ứng dùng đa từ điển, giao diện đẹp, có khả năng phát âm các tiếng Anh, Nga, Pháp, Đức.

    Chúc các bạn thành công và hài lòng với ứng dụng từ điển của mình.
    Chúc thành công nhiều
    Email: admin[@]congdongcviet.com | CC to: info[@]congdongcviet.com
    Phone: 0972 89 7667 (Office: 04 6329 2380)
    Yahoo & Skype: dreaminess_world (Vui lòng chỉ rõ mục đích ngay khi liên hệ, cảm ơn!)

    Một người nào đó coi thường ý thức kỷ luật cũng có nghĩa là người đó đã coi thường tương lai số phận của chính bản thân người đó. Những người coi thường ý thức kỷ luật sẽ không bao giờ có được sự thành công trong sự nghiệp!

  4. #4
    Ngày gia nhập
    11 2010
    Bài viết
    7

    Bạn nào có mã C# cái ví dụ của Kevin hoang không.tớ đang rất cần

Các đề tài tương tự

  1. Tư vấn kiến trúc, ưu và nhược của nhà lệch tầng
    Gửi bởi tomitoan22jambon trong diễn đàn Giới thiệu website, sản phẩm của bạn
    Trả lời: 0
    Bài viết cuối: 11-10-2012, 08:53 AM
  2. kiến trúc và tỏ chức máy tính
    Gửi bởi thu.uct trong diễn đàn Thắc mắc chung
    Trả lời: 2
    Bài viết cuối: 29-09-2010, 06:35 PM
  3. Tìm hiểu về kiến trúc tập lệnh
    Gửi bởi zodjac1990 trong diễn đàn Thắc mắc chung
    Trả lời: 1
    Bài viết cuối: 04-03-2010, 11:06 PM
  4. Cấu trúc file excel | Cấu trúc file xls. Giúp mình với?
    Gửi bởi knightofit trong diễn đàn Thắc mắc lập trình C/C++/C++0x
    Trả lời: 2
    Bài viết cuối: 02-04-2009, 10:44 PM

Quyền hạn của bạn

  • Bạn không thể gửi đề tài mới
  • Bạn không thể gửi bài trả lời
  • Bạn không thể gửi các đính kèm
  • Bạn không thể chỉnh sửa bài viết của bạn