Tải bản đầy đủ
3 Kết luận chương 4

3 Kết luận chương 4

Tải bản đầy đủ

http://www.ictu.edu.vn
58

KẾT LUẬN
Tra cứu thông tin ngày nay đang là một yêu cầu cấp thiết, trong khi lượng dữ
liệu trên Internet ngày càng lớn. Từ tra cứu thông tin, chúng ta có thể thu được
những thông tin quan trọng hữu ích nhất bằng cách truy vấn một hệ thống tra cứu
thông tin trực tuyến. Hệ thống tra cứu thông tin thông minh có thể là tiền đề để xây
dựng các hệ thống Q&A hoàn hảo, từ đó máy tính sẽ chủ động làm các công việc
bán hàng qua mạng thay con người.
Trong luận văn này, chúng tôi sử dụng lý thuyết tập thô để xây dựng hệ thống
tra cứu thông tin bằng cách rút gọn tập thuật ngữ, từ đó rút gọn được tập các đặc
trưng, hữu ích hơn trong quá trình tra cứu nhanh.
Trong tương lai, chúng tôi hướng tới xây dựng một hệ thống tra cứu thông tin
theo ngữ nghĩa của chuỗi ký tự đưa vào bằng cách làm cho hệ thống đó thông minh
hơn dựa trên các kỹ thuật máy học. Nâng cao tốc độ tìm kiếm và xây dựng kho dữ
liệu tiêu chuẩn và đầy đủ dùng cho tra cứu thông tin ngữ nghĩa.

http://www.ictu.edu.vn
59

TÀI LIỆU THAM KHẢO
Tiếng Việt
[1] Lê Bích Liên, Khai phá dữ liệu bằng lý thuyết tập Thô, Luận văn Thạc sĩ
năm 2007.
[2] Vũ Đức Thi (1997), Cơ sở dữ liệu - Kiến thức và thực hành, NXB Thống

[3] Nguyễn Thanh Thủy (2001), Cơ sở dữ liệu – Kỹ thuật và ứng dụng, NXB
Khoa học kỹ thuật.
[4]. Jeffrey D. Ullman (1998), Nguyên lý các hệ cơ sở dữ liệu và cơ sở tri
thức, NXB Thống kê.
[5]. Louis Rigand, Dunod (1984), Thiết lập hệ thống thông tin quản lý của các
tổ chức, Bản dịch tiếng Việt 1988.
[6]. Roger S.Pressman (1999), Kỹ nghệ phần mềm, NXB Giáo dục.
[7]. Đoàn Sơn (2002) Phương pháp biểu diễn văn bản sử dụng tập mờ và ứng
dụng trong khai phá dữ liệu văn bản Luận văn thạc sỹ Khoa Công Nghệ,
ĐHQGHN, năm 2002.
[8]. Hà Quang Thụy (1996). Một số vấn đề về không gian xấp xỉ, tập thô đối
với hệ thông tin. Luận án Phó tiến sĩ Khoa học Toán Lý. ĐHKHTN, 1996
[9]. Vũ Huy Hiên (2006), Khai phá dữ liệu văn bản theo cách tiếp cận lý
thuyết tập thô.
Tiếng Anh
[1] Jiawei Han and Micheline Kamber (2001). Data Mining: Concepts and
Techniques. Academic Press 2001.
[2] Alan Rea (1995), Data Mining-An Introduction, The Paralel Computer
Centre, The Queen’s University Belfast.
[3] Ho Tu Bao, Introduction to Knowledge Discovery and Data Mining,
National Center for Natural Scienee and Technology.

http://www.ictu.edu.vn
60

[4] C.J.Matheus and P.K.Chan and G.Piatetsky-Shapiro (1993), System for
knowledge discovery in database, Ieee Trans. On Knowledge and Data Engineering,
vol 5, pp 903-913,1993
[5] Jan Komorowski, Zdzislaw Pawlak, Lech Polkowski, Andrzej Skowron
(2000). Rough sets: A tutorial.
[6] Andrzej Skowron, Ning Zong (2000), Ruogh Sets in KDD. Tutorial Notes.
[7]. Tu Bao Ho, Saori Kawasaki, Ngoc Binh Nguyen, “Cluster – based
Information Retrieval with Tolerance Rough Set Model”, 2nd International
Symposium on Advanced Intelligent Systems Conference Proceedings, 2001.
[8]. Jiawei Han and Micheline Kamber (2001): Data Mining: Concepts
and Techniques. Academic Press 2001.
[9]. Hearst, M. What Is Text Mining? 2003
[10]. Fayyad, Piatetsky-Shapiro, Smyth, “From Data Mining to Knowledge
Discovery: An Overiew”, in Fayyad, Piatetsky-Shapiro, Smyth, Uthurusamy,
Advances in Knowl\ledge Discovery and Data Mining, AAAI Press/ The MIT
Press, Menlo Park, CA, 1996, pp,1-34
[11]. Ricardo Baeza-Yates, Berthier Ribeiro-Neto, Modern Information
Retrieval, Addison Wesley, 1999
[12]. Wojciech P.Ziarko (Ed.,1994).Rough Sets, Fuzzy Sets and Knowledge
Discovery. Proceedings of the Inrnational Workshop on Rough Sets and Knowledge
Discovery (RSKD’93), Banff, Alberta, canada, 12-15 October 1993. SpringerVerlag.
[13]. Eui-Hong

Han, Text

Categorization

Using Weight

Adjusted

k-Nearest Neighbor Classification . PhD thesis, University of Minnesota, October
1999.
[14]. T. Joachims, Text categorization with Support Vector Machines:
Learning with many relevant features. In Machine Learning: ECML-98, Tenth
European Conference on Machine Learning, pp. 137-142

http://www.ictu.edu.vn
61

[15] Ronald J.Branchman and Tej Anand. The Process of Knowledge
Discoery inDatabases, 1996
[16]. Andrzej Skowron, Ning Zong (2000). Rough Sets in KDD. Tutorial
Notes
[17]. Sinh

Nguyen

Hoa,

Andrzej Skowron,

Piotr

Synak

(1998).

Discovery of Data Patterns with Application to Decomposition and Classification
Problems.
[18]. Nguyen
Hyperplanes

Hung

Son,

Nguyen

Sinh

Hoa.

From

Optimal

to Optimal Decision Trees: Rough Set and Boolean Reasoning

Approaches, Institute of Computer Sciences Warsaw University 02-097, Banacha 2,
Warsaw, Poland
[19]. Ho Tu Bao (1996). Introduction

to Knowledge

Discovery and

Data mining. Institute of Information Technology National Center for Natural
Science and Technology.
[20]. Ricardo Baeza-Yates, Berthier Ribeiro-Neto, Modern Information
Retrieval.
[21] Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze,
Introduction to Information Retrieval, Cambridge University Press. 2008.
Website
[1] http://Irc-tnu.edu.vn
[2] http://www.ebooks.edu.vn
[3] http://www.ioit.ac.vn

http://www.ictu.edu.vn
62

PHỤ LỤC : DANH SÁCH CÁC TỪ DỪNG, TỪ TẦM THƯỜNG
Ai

trên

Hay

tuy nhiên

bạn

trong

hoặc

tuy vậy

họ

dưới

cần

tuy

mày

ngoài

đã

mặc dù

tôi

sau

vừa

trời ơi



trước

cùng

ôi

anh

trái

gồm



chị

phải

bao gồm

bất chấp

cái

bên

cái gì

không

cuộc

bên trái



chẳng

anh ta

bên phải

bởi vì

những

cô ấy

mặc dù

do vì

các

chính anh

của

đồng thời

hỡi

chính chị

bởi



hầu hết

chính là

vài

cụ thể

mỗi

của tôi

ít

vẫn là

mọi

của mày

sau

sẽ

tuy

của bạn

đằng sau

tuy rằng

từ

bạn

đằng trước

tuy là

đang

của

bên trên

tuy vậy

bất

chúng

bên dưới

nên

bằng

chúng tôi

nhiều

tám

hãy

chúng tao

thậm chí

chín

liên tiếp

chúng ta

ngay khi

mặc kệ

bất kì

chúng mày

trong lúc

nữa

mãi

chúng nó

lúc

riêng

mặc dù

chính tôi

lúc ấy

rồi

một

tao

vào lúc

thật ra

hai

mày

trong khi

thật là

ba

http://www.ictu.edu.vn
63

mầy



theo

bốn

tớ

mặc dù

chiếc

số

mi

dù là

đủ

về mặt

vâng

dù cho

lúc trước

tự

dạ

dù thế

trước lúc

mọi

thì

thuộc

trước khi

như



khoảng

nhất

nhau



khoảng chừng

qúa

hơn

bị

cỡ chừng

chính

sự

được

ngay cả

hiện nay

rất

nếu



hoàn toàn

rằng

khi

với

ví dụ

thế mà

này

tại

vân vân

thế đấy thế

nọ

một



đó

nhiều

còn



đây

do

bao giờ

mặt khác

vì thế

do vậy

cái

đều

vì vậy

vậy nên

làm

liên tục

lại

cho

lên

sẵn sàng

phải chăng

cho nên

tức

bất cứ



cho là

tức là

tại

vẫn

cho rằng

nữa

đâu

vậy

rằng là

luôn

đó

vậy thì

năm

luôn luôn

đây

giữa

sáu

ối trời

vậy thì

cuối

bảy

ối

thôi thì

cuối cùng

nãy

ơ

vậy thôi

trừ khi

hồi nãy

ơ kìa

vân vân

khi



mười

tiếp theo

để

tức thì



tiếp đến

thế

ngay

cũng

kế tiếp

nên

http://www.ictu.edu.vn
64

thế nhưng

tức khắc

vậy

tiếp tục

thế mà

thì ra

do đó

mãi mãi

vậy mà

thì

lại

nghĩa là

vậy thế

ấy

lẫn

thôi thì

thế thì

chưa

vậy là

thế là

thế nhưng

về phía
nhưng mà