1. Giới thiệu

- Trò chơi đối kháng (two-agent,conflicting game ) : Gồm 2 người chơi, đối thủ này sẽ tìm cách dành chiến thắng trước đối thủ kia trong một số hữu hạn nước đi, mỗi nước đi đuợc tạo ra dựa từ 1 trạng thái bất kỳ của trận đấu. Nếu sau 1 số giới hạn nước đi, nếu chưa ai dành chiến thắng thì xem như hoà. Ngoài ra, thông tin về trận đấu là hoàn toàn biết đuợc (perfect information) đối với cả 2 đối thủ.

- Cờ Carô (hay còn gọi là Gomoku ) cũng là 1 loại trò chơi đối kháng, trong đó mỗi đối thủ trong mỗi lượt đi của mình sẽ chọn 1 ô trống còn lại trên bàn cờ (kẻ sẵn các ô lưới ) sao cho tạo thành n con liên tiếp để chiến thắng ... Nếu n = 3 thì nó có 1 tên khác là Tic Tac Toe , nếu bổ sung thêm luật cho nó thì có thể đổi tên là Penta,Pentix (có ăn quân) ... Ngoài ra, có luật thi đấu mà người ta đã chứng minh đuợc người đi truớc bao giờ cung có thuật toán để thắng (thông tin này đáng tin cậy không thì em hông chắc ... chỉ biết là em có đọc qua tài liệu này ...hì hì hì... ), do đó để hạn chế thuận lợi của người đi trước, người ta đã đặt ra "luật rừng" sau ( luật này sẽ sử dụng cho quá trình phát triển chương trình ) :

+ Bàn cờ có kích thước tuỳ ý NxN, chọn n = 16;
+ Quân cờ đầu tiên phải đánh chính giữa lưới bàn cờ.
+ Nếu tồn tại đúng 5 con liên tiếp trên 1 hàng là thắng (chéo,ngang,dọc).
+ Nếu hết chỗ đi thì 2 bên hoà.
+ Và 1 số luật khác, nhưng để đon giản, em dẹp sạch ...

Luật này đáng lẽ là gắt hơn như sau : Đúng 5 con và không bị chặn hai đầu ... nhưng em để dành cho các bác cải tiến ...

2. Thuật ngữ Anh Việt

- Để tiện cho các bác đọc sau này, em xin giới thiệu 1 số thuật ngữ cơ bản sau, dĩ nhiên mớ này là em tự dịch hoặc xem tài liệu nên không tránh đuợc sai sót hoặc chưa chính xác ... mong các bác thông cảm và góp ý ...

(1) Giới thiệu về không gian tìm kiếm nước đi :
- Như các bác đã biết, trong trò chơi Caro, cứ sau mỗi nước cờ, mỗi đối thủ sẽ chọn ra từ những ô trống (empty - not occupied) để đi, do đó, sau 1 mỗi nước đi thì số ô trống còn lại sẽ giảm. Như vậy, việc tìm nước đi tiếp theo cho trạng thái có sẵn chỉ là việc tìm kiếm những ô trống còn lại, đồng thời, không gian tìm kiếm sẽ thu hẹp theo số nước đi đã tạo ... Em nói đến điều này là để sau này cải tiến thêm việc gia tăng độ sâu tính toán cho chương trình ở những nước cờ tàn ... Như vậy, để chọn 1 nước đi kế tiếp từ 1 trạng thái bàn cờ có sẵn, ta phải tìm kiếm nước đi ...

- Không gian chọn nước đi từ mỗi trạng thái ban đầu là hữu hạn, nhưng không gian tìm kiếm (searching space) 1 nước đi dẫn đến chiến thắng là ... hữu hạn luôn (?..hì..?..hì..?..hì... ) ... nhưng rõ ràng số lượng phần tử của hai không gian này đuợc so sánh giống như hạt cát và sa mạc ( hoặc như tập số tự nhiên là vô hạn đếm đuợc, tập số hữu tỉ cũng vô hạn đếm đuợc nhưng mà số lượng phần tử của Q so với của N là 1 trời 1 vực ...) ... Do đó ta không thể vét sạch không gian tìm kiếm nước đi này ( nếu làm đuợc điều này thì làm gì còn những giải cờ nữa ... vì chỉ cần học thuộc thế cờ là xong ...) mà ta phải giới hạn không gian tìm kiếm ...

- Một không gian tìm kiếm có thể hiện thực theo dạng 1 cái cây đa phân bình thường như trong Data Struct định nghia, lúc này nó đuợc gọi là cây tìm kiếm, cây trò chơi ...( Searching Tree,Game Tree), mỗi nút (Node) cùng mức của cây này thể hiện một lựa chọn các nước đi có sẵn, mức (Ply) này sẽ thể hiện cho việc đánh giá khoảng cách từ nút gốc đến những nút con này ... Nếu số nút ở mỗi mức càng nhiều, tức là có nhiều khả năng chọn lựa 1 nước đi từ 1 trạng thái trước, do đó độ phân nhánh ( Branching factor) của cây này càng lớn ...

- Dựa vào cái cây trò chơi đã định nghĩa ở trên, việc tìm kiếm nước đi là chọn 1 nút trên cây ( ở mức 1) sao cho nước đó là tốt ( tốt ở đây đuợc hiểu là do mình đánh giá thui, vì 1 nước đi này là tốt hơn nước đi kia thì phụ thuộc trình độ, khả năng của người chơi cờ ...), theo thông thường khi chơi, một nước đi tốt hay không là phụ thuộc vào khả năng dành chiến thắng là cao hay thấp sau khi nước đi này đuợc "made" (tức là "đi"), do đó, muốn chọn 1 nước đi tốt thì nếu chỉ dựa vào thế cờ hiện tại là chưa đủ, mà phải biết thông tin của những thế cờ sau khi chọn nước này để đi ... Ví dụ như khi chơi trò Carô, các bác lại chọn một nước đi vào 1 ô nào đó để chận đuờng 3 hở hai đầu của đối thủ (Opponent, Enemy) vì các bác biết là nếu không đi nuớc này thì sẽ thua ở 2 nửa nước đi tiếp theo, tức là trạng thái thua còn chưa biết đuợc nếu ngay sau khi chọn đi 1 ô khác để đi xuất phát trạng thái này. Khái niệm độ sâu cung nảy sinh từ đây, đon giản thì độ sâu (Depth) là khả năng "nhìn thấy trước" (looking ahead) 1 nước đi tốt sau một loạt nước đi xuất phát từ hiện tại , ví dụ như nếu từ trạng thái này, các bác nhận biết đuợc là sau 6 con nữa là mình sẽ thắng (tức là mỗi bên đi 3 con), khi đó độ sâu tính toán của các bác là >= 6 [not 3], ví dụ này cung chưa chính xác lắm, nhưng 1 ví dụ khác thế này nhá : ở trạng thái hiện tại, các bác chọn đi 1 nuớc đi "tốt" theo sự tính toán của mình, các bác dự đoán là sau 4 con nữa là mình vẫn chưa thua, nhưng thực tế sau đó 3 nuớc nữa (mỗi bên đi 3 con) thì các bác bị thua (..hi hi hi... ), khi đó, rõ ràng "thua" là trạng thái mà các bác không hề nhận thấy khi chọn nước đi tốt ở trên, tức là độ sâu tính toán của các bác trong trường hợp này chính xác là 3, đó cung gọi là độ sâu lớn nhất (Max Depth) mà các bác có thể đạt đuợc khi tìm kiếm ...Như vậy, Max depth thể hiện khả năng & trình độ của người chơi cờ, các bác chơi càng hay thì giá trị này càng lớn ( rõ ràng 1 thằng độ sâu max 6 chơi với 1 thằng độ sâu max 8 thì thằng (6) không bao giờ ăn đuợc thằng (8), hiển nhiên ...)... Khi Max Depth = 0 ==> No thinking ahead

- Lại nói viết chương trình cho máy tính chơi cờ ... tức là máy tính phải tự tìm nước đi khi mình đưa vào 1 trạng thái bàn cờ bất kì, do không gian tìm kiếm là quá lớn (coi như là vô hạn) nên mình chỉ giới hạn cho máy tính chi tìm kiếm đến 1 độ sâu nào đó mà thôi (cách hiện thực này giống như mình chơi cờ thui ...), đó là độ sâu tìm kiếm lớn nhất ... thể hiện khả năng của chương trình, chúng ta sẽ cố gắng nâng cao giá trị này bằng cách cài đặt thêm các tri thức cờ cho nó (Heuristic, Knowledge ...), tức là sau khi chạy chương trình, máy tính phải biết chọn ra 1 nước tốt trong một mớ các ô trống còn lại sao cho sẽ chưa bị thua sau 1 loạt nước đi (= MAXDEPTH [not MAXDEPTH*2]) kế tiếp ...

- Một số thuật ngữ :
Game Tree : cây trò chơi.
Searching Tree : Cây tìm kiếm
Ply : mức của cây (Level)
Depth : độ sâu (max Ply)
Iterative Deepening : Tìm kiếm sâu dần
Quiescence depth : độ sâu tĩnh
Branching factor : độ phân nhánh
Parent Node : nút cha
Children Node : nút con
Leave Node : nút lá
Max Node : nút nước đi của đối thủ hiện tại
Min Node : nút nước đi của đối thủ vừa mới đi
Evaluation : Sự lượng giá
Evaluate : Lượng giá
Static/Dynamic Evaluate : Lượng giá tinh/động
Lazy Evaluation : Lượng giá lười
Extension Knowledge - Extension Heuristic : Tri thức bổ sung
Upperbound : Chận trên
Lowerbound : Chận dưới
Make Move : Uýnh 1 nước đi đã chọn
NULL-Move : nước đi trống
Move Ordering : Sắp xếp nội nước đi
Move Generation : Sinh nuớc đi
Capture : "Đớp"
Generation Move : Nước đi
Dangerous Gen-Move : Nuớc đi nguy hiểm (đe doạ)
Winning thread : Nhánh dẫn đến thắng
Straight four : 4 con đã bị chận 1 đầu (XOOOO*, * là ô trống)
Opened three : Đuờng 3 mở 2 đầu (**OOO**,X*OOO**...)
Broken three : đuờng 3 gãy không bị chận 2 đầu (*OO*O*)
Winning line : Đuờng thắng (ví dụ : Straight four,Open three,Broken three..)
Tranpositon Table : Bảng truyền
Hash Table : Bảng băm
Offense/Defense - Offensive/Defensive - Aggressive Attack : Các chế độ chiến đấu của chương trình
Prune, Pruning, Cut Off,...: Cắt nhánh
Horizontal Effect : Hiệu ứng đuờng chân trời,đuờng ngang
Back Tracking : Quay lui tìm tới
Opening Books : Mở Book-Database
Search by MinMax/AlphaBeta/NegaScout/MTD(f)/PVS Algorithms : Các thuật toán tìm kiếm

Những thuật ngữ trên có 1 mớ đã giới thiệu, mớ còn lại sẽ đuợc giới thiệu ở những bài kế tiếp ...