Tải bản đầy đủ
2 Một số giao diện của hệ thống

2 Một số giao diện của hệ thống

Tải bản đầy đủ

http://www.ictu.edu.vn
55

Hình 4.3 dưới đây là bảng lưu trữ ngôn ngữ lựa chọn để tra cứu.

Hình 4.3 Bảng lưu trữ thông tin ngôn ngữ.
Hình 4.4 dưới đây mô tả nội dung của bảng lưu trữ thông tin của các danh từ
thuộc chủ đề nhất định.

Hình 4.4. Bảng thông tin từ chủ đề.
4.2.2 Giao diện của hệ thống
4.2.2.1 Phương pháp xây dựng kho dữ liệu
Hệ thống tra cứu thông tin được xây dựng mô phỏng hệ thống tra cứu thông
tin google. Do đó, giao diện của hệ thống được xây dựng bằng công nghệ web
asp.net. Kho dữ liệu được thu thập từ nhiều trang tin trực tuyến khác nhau như
http://vnexpress.net, http://vietnamnet.vn, http://pcworld.com, http://google.com, …
Xây dựng đặc trưng riêng cho từng nhóm văn bản như sau:
- Sử dụng công cụ tách từ tiếng Việt.
Để tách từ tiếng Việt, dùng công cụ tách từ Tiếng Việt vlsp (nhánh đề tài
"Xử lí văn bản" là một phần của đề tài KC01.01/06-10 "Nghiên cứu phát triển một
số sản phẩm thiết yếu về xử lí tiếng nói và văn bản tiếng Việt" (VLSP)
http://vlsp.vietlp.org:8080/demo/)

http://www.ictu.edu.vn
56

- Sử dụng tập luật rút gọn để loại bỏ đi các từ không cần thiết (sử dụng phụ
lục danh sách các từ dừng).
- Phân cụm văn bản phục vụ mục đích tra cứu nhanh [19].
- Rút gọn tập thuật ngữ một lần nữa nhằm mục đích tra cứu nhanh như các từ
khóa (key word) đại diện cho từng nhóm văn bản.
4.2.2.2 Một số giao diện
Dưới đây là một số hình ảnh giao diện của hệ thống.
Giao diện trang chủ được mô tả như hình 4.5 dưới đây. Tra cứu dựa trên 2
ngôn ngữ chính là tiếng Anh và tiếng Việt.

Hình 4.5 Giao diện trang chủ hệ thống tra cứu.
Hình 4.6 dưới đây là hình ảnh sau khi nhập một chuỗi vào ô tra cứu.

http://www.ictu.edu.vn
57

Hình 4.6. Kết quả tra cứu của hệ thống.
4.3 Kết luận chương 4
Dựa trên phương pháp đã đề xuất ở chương 3, trong chương này chúng tôi đã
xây dựng thành công hệ thống. Vấn đề tra cứu thông tin chủ yếu tập trung ở tra cứu
thông tin văn bản và web mang lại hiệu quả tương đối cao. Tuy nhiên, kho dữ liệu
chuẩn tiếng Việt phục vụ cho tra cứu thông tin chưa có, chúng tôi phải tự xây dựng.
Do đó, kho dữ liệu phục vụ luận văn còn hạn chế về số lượng và chủ đề.

http://www.ictu.edu.vn
58

KẾT LUẬN
Tra cứu thông tin ngày nay đang là một yêu cầu cấp thiết, trong khi lượng dữ
liệu trên Internet ngày càng lớn. Từ tra cứu thông tin, chúng ta có thể thu được
những thông tin quan trọng hữu ích nhất bằng cách truy vấn một hệ thống tra cứu
thông tin trực tuyến. Hệ thống tra cứu thông tin thông minh có thể là tiền đề để xây
dựng các hệ thống Q&A hoàn hảo, từ đó máy tính sẽ chủ động làm các công việc
bán hàng qua mạng thay con người.
Trong luận văn này, chúng tôi sử dụng lý thuyết tập thô để xây dựng hệ thống
tra cứu thông tin bằng cách rút gọn tập thuật ngữ, từ đó rút gọn được tập các đặc
trưng, hữu ích hơn trong quá trình tra cứu nhanh.
Trong tương lai, chúng tôi hướng tới xây dựng một hệ thống tra cứu thông tin
theo ngữ nghĩa của chuỗi ký tự đưa vào bằng cách làm cho hệ thống đó thông minh
hơn dựa trên các kỹ thuật máy học. Nâng cao tốc độ tìm kiếm và xây dựng kho dữ
liệu tiêu chuẩn và đầy đủ dùng cho tra cứu thông tin ngữ nghĩa.