Trước hết mình sẽ đưa ra lí do của Topic này bằng các bài toán đặt ra như sau:
1. Giả sử từ một Website thương mại nào đó, bạn cần tìm một sản phẩm thỏa mãn một số điều kiện nào đó của bạn. Ví dụ: bạn muốn mua một máy tính xách tay có các điều kiện như sau: CPU >2.0 GhZ, Main của hãng Asus, Cảd đồ họa >=128MB, màn hình >14inch, ..., Giá <900$. Có lẽ cách duy nhất hiện giờ mà bạn muốn là bạn phải duyệt qua tất cả các máy rồi chọn một cái ưng ý nhất.
Mở rộng ra là không chỉ ở 1 Website mà tất cả các site bán máy tính xác tay.
Giải quyết: tại sao bạn không tạo ra một dịch vụ tự động phân tách thông tin tự động với các yêu cầu đầu vào do người dùng nhập, hệ thống sẽ tự động phân tách từ các website thương mại với các từ khóa đã nhập và tự động tích hợp thông tin vào CSDL, sau đó xử lí so sánh điều kiện và đưa ra sản phẩm mà hợp ý với người dùng nhất.
Hoặc giả như đưa ra một cấu hình hợp thức nhất cho người dùng.
2. So sánh shopping, đó là so sánh giá cả cùng một sản phẩm hay một lớp sản phẩm từ các website khác nhau để đưa ra sản phẩm có giá rẻ nhất hay tốt nhất từ các Website cho người dùng một cách hoàn toàn tự động.
3. Web có ngữ nghĩa, nghĩa là ta biết rằng cùng một vấn đề nhưng các ngôn ngữ khác nhau thì mô tả khác nhau, đồng thời trong cùng ngôn ngữ nhưng cách diễn đạt cũng khác nhau.
Ví dụ một cơ quan nhà nước cần tập hợp tất cả các thông tin và các bài báo liên quan tới dịch SARS tại đông Á. Vấn đề là mỗi nước có một ngôn ngữ khác nhau, làm sao đây.
4. Vấn đề về cú pháp: Ví dụ 12.000$ hay 12,000$ tuy cách viết khác nhau, nhưng một số quốc gia thì ý nghĩa lại giống nhau.
5. Điển hình thì các dịch vụ tìm kiếm của Google sao lại hiểu quả như vây?
6...
còn rất nhiều vấn đề mà mình không muốn nói hết.