Tải bản đầy đủ
CHƯƠNG 3. XÂY DỰNG ỨNG DỤNG

CHƯƠNG 3. XÂY DỰNG ỨNG DỤNG

Tải bản đầy đủ

73
3.3. PHÁT TRIỂN CÁC MODUL
3.3.1. Modul biểu diễn dữ liệu mờ
Cơ sở dữ liệu sau khi được mờ hóa sẽ được lưu trữ trong một file xml có cấu trúc
như sau:

Hình 3: Cấu trúc một cơ sở dữ liệu mờ lylich đã được mờ hóa
3.3.2. Modul biểu diễn truy vấn mờ
Để thực hiện các truy vấn trên cơ sở dữ liệu mờ thì câu truy vấn ở dạng SQL
phải được chuyển đổi thành file xml hoặc chuỗi theo cấu trúc của file xml. Công
việc này sẽ được thực hiện thông qua phương thức ReadSQLXML trong lớp SQL.
Phương thức này cho phép chuyển đổi một câu lệnh SQL thành một file truy vấn
biểu diễn bằng XML để có thể thực hiện truy vấn dễ dàng trên cơ sở dữ liệu mờ.

74

Hình 4: Cấu trúc file lưu trữ câu truy vấn mờ bằng XML
3.4. GIAO DIỆN CHƯƠNG TRÌNH
Dựa trên những phân tích và thiết kế về cơ sở dữ liệu mờ theo lý thuyết về đại
số gia tử, chúng tôi đã xây dựng hệ thống “Quản lý thông tin nhân sự” trong đó có
thêm các chức năng ứng dụng logic mờ dựa trên lý thuyết về đại số gia tử.
Đầu tiên khi khởi động chương trình thì màn hình giao diện chương trình như
sau:

75

Hình 5: Giao diện chính của chương trình
Từ giao diện chính, người dùng phải thực hiện đăng nhập với tài khoản admin
mới có thể thực hiện các chức năng như: phân quyền, cập nhật lý lịch, cập nhật lý
lịch khoa học, cập nhật bảng lương, cập nhật bảng chấm công. Ngoài ra những chức
năng như thống kê nhân viên theo độ tuổi, theo mức lương, … có thể thực hiện mà
không cần phải đăng nhập tài khoản.
Sau khi nhập đầy đủ các thông tin cho nhân viên thì người dùng có thể thực hiện
chức năng mờ hóa cơ sở dữ liệu.
Giao diện này cho phép lựa chọn các trường thuộc tính cần được mờ hóa, với
mỗi trường thuộc tính mờ cần phải xác định các đại lượng như miền giá trị tham
chiếu, miền giá trị ngôn ngữ thông qua hai đại lượng là LDom(H) và LDom(E). Chỉ
những trường được đánh dấu là is Fuzzy mới cho phép lựa chọn các đại lượng trên
và những trường này sẽ được mờ hóa bằng đại số gia tử. Giao diện lựa chọn các
trường cần thực hiện mờ hóa như sau:

76

Hình 6: Giao diện chức năng lựa chọn các trường thuộc tính mờ
Thông qua chức năng này người dùng có thể lựa chọn các thông tin về tập các
phần tử sinh, tập các gia tử cùng với độ thuộc của nó sao cho phù hợp với ý kiến
của chuyên gia.

Hình 7: Giao diện chức năng cập nhật tập gia tử

77
Sau khi lựa chọn các trường cần được mờ hóa thì kết quả thực hiện việc mờ
hóa sẽ cho như sau:
Chúng ta cũng có thể thực hiện việc mờ hóa với dữ liệu nguồn là kết quả truy
vấn bằng câu lệnh SQL chuẩn, từ dữ liệu nguồn này chúng ta có thể thực hiện lựa
chọn các trường thuộc tính mờ và thực hiện việc mờ hóa tương tự như trên.
Sau khi đã thực hiện việc mờ hóa cơ sở dữ liệu sẵn có, người dùng có thể lưu trữ
thành file xml để thực hiện việc khai phá dữ liệu hoặc thực hiện các truy vấn mờ.
Ngoài ra hệ thống còn cho phép người dùng tự tạo cho mình một cơ sở dữ liệu mờ
dựa trên lý thuyết về đại số gia tử, cơ sở dữ liệu mờ này cũng được lưu trữ bằng file
xml và giống như cấu trúc của file xml đã được mờ hóa do đó nó có thể dùng để
truy xuất và khai phá dữ liệu.
Dữ liệu sau khi được mờ hóa có thể được dùng cho các chức năng khai phá dữ
liệu tìm ra tri thức có ích, hoặc thực hiện các truy vấn cần thiết để tìm ra những
thông tin có ích cho những dự báo trong tương lai. Người dùng có thể thực hiện các
truy vấn mờ bằng các câu lệnh SQL.
3.5. THỬ NGHIỆM VÀ ĐÁNH GIÁ
- Chọn cơ sở dữ liệu nguồn.

78

Hình 8: Cơ sở dữ liệu nguồn
- Xác định miền giá trị

Hình 9: Xác định miền giá trị của thuộc tính Lương
- Tập các phần tử sinh

Hình 10: Xác định tập phần tử sinh của thuộc tính Lương
- Tập các gia tử

79

Hình 11: Xác định tập gia tử
- Sau khi mờ hóa dữ liệu

Hình 12: Cấu trúc của trường thuộc tính mờ

80
- Thực hiện truy vấn mờ với câu truy vấn
Select SoCM, Hoten, SucKhoe, Tuoi, Luong
From BangLuong
Where Tuoi=2 Hơn Già and SucKhoe=2 Khả năng Tốt
- Kết quả chuyển câu truy vấn trên về dạng XML

81

- Kết quả truy vấn

Hình 13: Kết quả sau khi thực hiện truy vấn.
Dựa trên dạng dữ liệu mờ và dữ liệu rõ chương trình đã thực hiện việc mờ hóa
cơ sở dữ liệu nguồn, cho phép biểu diễn nhiều dạng dữ liệu mờ khác nhau khi cập
nhật. Việc lưu trữ, truy vấn thực hiện nhanh chóng và cho kết quả đúng.
Với kết quả này chúng ta có thể sử dụng cho việc mờ hóa dữ liệu đã có, lưu trữ
dữ liệu mờ trong nhiều hệ thống ứng dụng khác: Hệ thống khai phá dữ liệu tri thức
bằng các luật kết hợp mờ, Hệ thống hỗ trợ quyết định, …
3.6. TỔNG KẾT CHƯƠNG
Chương này ứng dụng các kết quả đã nghiên cứu vào bài toán “Quản lý thông
tin nhân sự”: Biểu diễn CSDL mờ bằng ngôn ngữ XML, cài đặt thuật toán xác định
giá trị chân lý của điều kiện mờ để đánh giá truy vấn. Ngoài ra, trong chương ba
cũng đưa ra kết quả thử nghiệm và đánh giá hệ thống này.

82
KẾT LUẬN
Với mục đích tìm ra một phương pháp biểu diễn cơ sở dữ liệu mờ cho phép mờ
hóa cơ sở dữ liệu sẵn có để thu thập, lưu trữ và xử lý được những thông tin mờ trên
máy tính làm nguồn dữ liệu ứng dụng trong các hệ thống khai phá dữ liệu để đưa ra
các dự báo có tính chiến lược trong tương lai. Với cách tiếp cận dựa trên những lý
thuyết đã có về cơ sở dữ liệu mờ về ngôn ngữ biểu diễn dữ liệu. Luận văn đã trình
bày cách biểu diễn dữ liệu mờ đựa trên cấu trúc định lượng ngữ nghĩa của ĐSGT và
ngôn ngữ XML.
Nội dung cơ bản của luận văn gồm: tập trung nghiên cứu về cơ sở lỹ thuyết về
ĐSGT, cách thức mờ hóa đữ liệu dựa trên lý thuyết của ĐSGT, cách thức biểu diễn
CSDL đã mờ hòa bằng ĐSGT và bằng ngôn ngữ XML. Trên cơ sở đó, luận văn đã
ứng dụng vào bài toán “Quản lý thông tin nhân sự” và thực hiện một số thao tác
khai phá dữ liệu.
Trong quá trình xây dựng hệ thống vẫn còn tồn tại một số vấn đề cần phải được
phát triển: Xây dựng thuật toán xấp xỉ dữ liệu để có thể thực hiện với những câu
truy vấn SQL phức tạp, cần đưa ra các thuật toán để thực hiện truy vấn CSDL
nhanh hơn.
Với phương pháp này, bước đầu chúng tôi đã cài đặt dữ liệu mờ dựa trên lý
thuyết về đại số gia tử, cho phép mờ hóa cơ sở dữ liệu đã có, thu thập thông tin, cập
nhật thông tin và thực hiện một số tính toán, cũng như truy vấn mờ trên cơ sở dữ
liệu đó.
Trong quá trình thực hiện khoá luận, tôi đã cố gắng tập trung tìm hiểu và tham
khảo các tài liệu liên quan. Tuy nhiên, với thời gian và trình độ có hạn nên không
tránh khỏi những hạn chế và thiếu sót. Tôi rất mong được sự nhận xét và góp ý của
các thầy cô giáo và bạn bè, đồng nghiệp và những người cùng quan tâm để hoàn
thiện hơn các kết quả nghiên cứu của mình.
Cuối cùng, một lần nữa tôi xin chân thành bày tỏ lòng biết hơn sâu sắc đến thầy
giáo hướng dẫn PGS.TS. Đoàn Văn Ban, các thầy giáo, cô giáo Viện Công nghệ
thông tin, Đại học Công nghệ Thông tin và Truyền Thông – Đại học Thái Nguyên,
trường Đại học Khoa học - Đại học Thái Nguyên và các đồng nghiệp đã giúp đỡ tôi
hoàn thành luận văn này.

83
TÀI LIỆU THAM KHẢO
[1].

N.C. Ho (2003), “Quantifying Hedge Algebras and Interpolation Methods in

Approximate Reasoning”, Proc. of the 5th Inter. Conf. on Fuzzy Information
Processing, tr. 105-112.
[2]. N.C. Ho, W. Wechler (1990),

“Hedge algebras:An algebraic approach to

structure of sets of linguistic truth values”, Fuzzy Set and Systems, 35, tr. 281-293.
[3]. N.C. Ho, W. Wechler (1992), “Extended Hedge algebras and their application to
fuzzy logic”, Fuzzy Set and Systems, 52, tr. 259-281.
[4]. N.C. Ho, H.V.Nam (2002), “An algebraic approach to linguistic hedge in
Zadeh’s fuzzy logic”, Fuzzy Set and Systems, 129, tr. 229-254.
[5]. Z. M. MA and LI YAN (2008), “A Literature Overview of Fuzzy Database
Models”, Journal Of Information Science And Engineering, 24, tr. 189-202.
[6]. Hồ Thuần, Hồ Cẩm Hà, An approach to extending the relational database model
for handing incomplete information and data dependencies, Tạp trí Tin học và Điều
khiển học 17 (3) (2001) 41-47.
[7]. E. Petry and P. Bosc (1996), Fuzzy Databases Principles and Applications,
Kluwer Academic Publishers.
[8]. Nguyễn Cát Hồ, Nguyễn Công Hào, Một cách tiếp cận để xấp xỉ dữ liệu trong cơ
sở dữ liệu mờ, Tạp chí Tin học và Điều khiển học, T.23, S.2 (2007), 109-120.
[9]. H. Thuan, T. T. Thanh (2001), “On the Functional Dependencies and
Multivalued Dependencies in Fuzzy relational database”, Tạp chí Tin học và Điều
khiển học, 17 (2), tr. 13-19.
[10]. H. Thuan, T. T. Thanh (2002), “Fuzzy Functional Dependencies with Linguistic
Quantifiers”, Tạp chí Tin học và Điều khiển học, 18 (2), tr. 97-108.
[11]. Kraft D. H., Petry F. E. (2002), “Fuzzy information Systems: managing
uncertainly in databases and information retrieval systems”, Tạp chí Tin học và
Điều khiển học, 18 (3), tr. 237-252.
[12]. N. C. Hồ, T. T. Sơn, T. Đ. Khang, L. X. Việt, Fuzziness Measure (2002),
“Quantified Semantic Mapping And Interpolative Method of Approximate
Reasoning in Medical Expert Systems”, Tạp chí Tin học và Điều khiển học, 18 (3),
tr. 237-252.