Tải bản đầy đủ - 0 (trang)
CHƯƠNG 4 – THIẾT KẾ VÀ XÂY DỰNG HỆ THỐNG

CHƯƠNG 4 – THIẾT KẾ VÀ XÂY DỰNG HỆ THỐNG

Tải bản đầy đủ - 0trang

Hình 20: Kiến trúc hệ thống

Hệ thống gồm các phần sau:

 Dữ liệu phim và đánh giá phim từ Movilens

 Khối Tiền xử lý: làm sạch dữ liệu đầu vào, sử dụng lập trình Java

 Khối Tìm kiếm: cung cấp chức năng tìm kiếm, sử dụng Elasticsearch.

Mỗi một bản ghi đẩy vào Elasticsearch (cụ thể ở đây là bản ghi về

phim và gợi ý phim), chúng sẽ được index, và kết quả là tạo ra bộ từ

điển (dictionary) và bộ thẻ định vị (posting). Khi nhận được một yêu

cầu tìm kiếm, Elasticsearch sử dụng hàm tính điểm để xếp hạng kết

quả phù hợp trả về. Hàm này cũng dựa trên những khái niệm về tf-idf,

mơ hình khơng gian vector, đồng thời có sử dụng thêm một số nhân tố

khác [23]

 Khối Gợi ý: cung cấp chức năng gợi ý phim, sử dụng Apache Mahout.

Danh sách gợi ý phim tương đồng được đẩy vào bảng dữ liệu phim

trong Elasticsearch, tương ứng với từng phim. Danh sách gợi ý phim

cá nhân hóa cho từng người dùng được đẩy vào bảng dữ liệu người

dùng trong Elasticsearch, tương ứng với từng người dùng.51 Khối CSDL: quản lý thông tin người dùng, sử dụng MongoDB. Nếu

người dùng là khách (khơng đăng nhập) thì hệ thống sẽ gợi ý các

phim tương đồng với phim được tìm kiếm. Nếu người dùng là thành

viên (có đăng nhập) thì ngồi gợi ý các phim tương đồng với phim

được tìm kiếm, hệ thống gợi ý thêm các phim được cá nhân hóa cho

người dùng đó.

 Khối Web: cung cấp giao diện với người dùng Web, sử dụng

ExpressJS

4.3. CÁC BIỂU ĐỒ CHỨC NĂNG

4.3.1. Biểu đồ use-case

Tác nhân của hệ thống là người sử dụng, có những tính năng sau:

 Đăng nhập vào hệ thống: người dùng nhập username và password của

mình để đăng nhập vào hệ thống.

 Đăng xuất khỏi hệ thống.

 Đăng ký thành viên: người dùng nhập username và password của

mình để đăng ký thành viên.

 Tìm kiếm phim: người dùng nhập từ khóa vào ơ tìm kiếm, kết quả trả

về danh sách những phim chứa từ khóa liên quan.

 Xem chi tiết phim: cho phép người dùng xem chi tiết mã phim, tên

phim, thể loại phim.

 Gợi ý phim tương đồng: gợi ý danh sách những phim tương đồng với

phim mà người dùng chọn.

 Gợi ý phim cá nhân hóa: nếu người dùng đăng nhập vào hệ thống,

ngồi gợi ý danh sách phim tương đồng, hệ thống sẽ gợi ý thêm danh

sách phim được cá nhân hóa tới ngươi dùng đó.52Hình 21: Biểu đồ use-case534.3.2. Biểu đồ hành độngHình 22: Biểu đồ hành động

1. Người dùng tìm kiếm phim bằng cách gõ vào từ khóa tìm kiếm trên

giao diện web.

2. Hệ thống trả về danh sách các phim liên quan tới từ khóa tìm kiếm.

3. Người dùng chọn bộ phim mà mình cần tìm. Khi đó xảy ra 2 trường

hợp (4) hoặc (5)

4. Nếu người dùng không đăng nhập, hệ thống trả về kết quả chi tiết

phim (ID, tên phim, thể loại) và gợi ý danh sách những phim tương

đồng.545. Nếu người dùng đăng nhập, ngoài gợi ý danh sách phim tương đồng,

hệ thống sẽ trả về thêm danh sách phim được cá nhân hóa tới ngươi

dùng đó.

4.3.3. Biểu đồ tuần tựHình 23: Biểu đồ tuần tự

1. Người dùng tìm kiếm phim bằng cách gõ vào từ khóa tìm kiếm trên

giao diện web.

2. Từ khóa tìm kiếm được chuyển thành câu lệnh query trong Search

Engine.

3. Search Engine trả về kết quả query dạng JSON.

4. Hệ thống hiển thị lại thành giao diện web cho người dùng.555. Người dùng chọn xem chi tiết phim

6. ID của phim được chuyển thành câu lệnh query trong Search Engine.

7. Search Engine kiểm tra thông tin đăng nhập của người dùng.

8. Nếu người dùng không đăng nhập, Search Engine trả về kết quả chi

tiết phim (ID, tên phim, thể loại) và gợi ý danh sách những phim

tương đồng.

9. Nếu người dùng đăng nhập, ngoài gợi ý danh sách phim tương đồng,

Search Engine sẽ trả về thêm danh sách phim được cá nhân hóa tới

ngươi dùng đó.

10. Hệ thống hiển thị lại thành giao diện web cho người dùng.

4.4. GIAO DIỆN HỆ THỐNG

4.4.1. Chức năng tìm kiếm

Giao diện để người dùng nhập từ khóa tìm kiếm. Chẳng hạn người dùng

muốn tìm phim “Iron man 2” và họ nhập từ "iron" vào ơ tìm kiếm như sau:Hình 24: Giao diện tìm kiếm

Giao diện trả về danh sách các bộ phim có chứa từ khóa "iron"56Hình 25: Kết quả tìm kiếm

4.4.2. Chức năng quản lý đăng nhập

Người dùng nhập User và Password để đăng nhập vào hệ thốngHình 26: Giao diện đăng nhập

Tương tự như vậy, người dùng nhập User và Password để đăng ký thành viên57Hình 27: Giao diện đăng kí

4.4.3. Chức năng gợi ý theo sản phẩm tương đồng

Sau khi nhận kết quả tìm kiếm trả về gồm danh sách các bộ phim, chẳng hạn

danh sách các bộ phim có từ khóa "iron", người dùng chọn xem chi tiết bộ phim

"Iron Man 2 (2010)". Kết quả trả về chi tiết phim (ID, tên phim, thể loại) và gợi ý

danh sách các bộ phim tương đồng với phim đó.Hình 28: Gợi ý theo sản phẩm tương đồng584.4.4. Chức năng gợi ý theo người dùng

Tương tự như vậy, nếu người dùng đăng nhập vào hệ thống, kết quả trả về

gồm: chi tiết phim, gợi ý danh sách các bộ phim tương đồng với phim đó và gợi ý

danh sách các bộ phim được cá nhân hóa cho người dùng đó.Hình 29: Gợi ý cho người dùng đăng nhập59CHƯƠNG 5 - KẾT LUẬN, HƯỚNG PHÁT TRIỂN

5.1. KẾT LUẬN

Trong quá trình thực hiện đề tài tốt nghiệp này tôi đã cố gắng tham khảo, học

hỏi những kiến thức, kinh nghiệm từ những thông tin trên sách, báo, internet và

cùng với sự hướng dẫn tận tình của TS. Nguyễn Bình Minh, tơi đã hồn thành luận

văn này.

5.1.1. Kết quả đạt được

Trong luận văn này tơi đã tập trung tìm hiểu, nghiên cứu cơ sở lý thuyết của

một hệ thống tìm kiếm, gợi ý, đồng thời ứng dụng nó để xây dựng một hệ thống tìm

kiếm và gợi ý phim, và đã đạt được một số kết quả ban đầu.

Về lý thuyết:

 Luận văn đã tìm hiểu và nêu ra được cơ sở lý thuyết của các hệ thống

tìm kiếm, gợi ý.

 Luận văn đã tìm hiểu kỹ một số giải thuật gợi ý kinh điển, được sử

dụng rộng rãi ngày nay, so sánh và thực nghiệm chúng.

Về thực nghiệm:

Việc xây dựng thành cơng hệ thống tìm kiếm và gợi ý theo giải pháp đã đề

xuất, chứng minh được nền tảng lý thuyết đã nghiên cứu, kết hợp với các cơng cụ

hỗ trợ và phát triển phần mềm, hồn tồn có thể xây dựng thành cơng các hệ thống

thương mại điện tử, giải trí tốt cho người dùng.

5.1.2. Hạn chế

Mặc dù đã có nhiều cố gắng và nỗ lực tìm hiểu, tuy nhiên do trình độ còn

nhiều hạn chế và thời gian nghiên cứu có hạn, nên luận văn khơng tránh khỏi những

hạn chế như:

 Luận văn chưa so sánh hệ thống của mình với các hệ thống tìm kiếm

và gợi ý phim khác.

 Luận văn mới chỉ tìm hiểu một số thuật toán gợi ý phổ biến, dựa trên

phản hồi rõ (explit feedback), tức là người dùng đánh giá trực tiếp trên60sản phẩm. Tuy nhiên, không phải người dùng lúc nào cũng sẵn sàng

để lại các phản hồi của họ, vì vậy cần nghiên cứu thêm các thuật tốn

gợi ý thông qua phản hồi ẩn (implicit feedbacks).

 Chức năng gợi ý khi người dùng đăng nhập đang được tính offline và

lưu vào khối (module) tìm kiếm. Đối với tập dữ liệu lớn, nếu tính

online trên khối gợi ý thì khá chậm, ảnh hưởng tới trải nghiệm người

dùng.

 Hệ thống mới dừng lại ở dạng trình diễn (demo) để khẳng định tính

khả thi về mặt tích hợp cơng nghệ, còn thiếu nhiều tính năng thực tế

như: chưa có tính năng cho người dùng đánh giá sản phẩm, tính năng

cho quản trị hệ thống (quản lý người dùng, quản lý sản phẩm, bổ sung

và cập nhật dữ liệu mới).

5.1. HƯỚNG PHÁT TRIỂN

Từ những hạn chế trên, tôi xin đề xuất hướng phát triển, nghiên cứu tiếp

theo như sau:

 Nghiên cứu một số phương pháp chuyển phản hồi ẩn về phản hồi rõ

như dựa trên lịch sử mua hàng, lịch sử duyệt web và tìm kiếm, số lần

click chuột,... Chẳng hạn: một người dùng mua rất nhiều sách của

cùng một tác giả thì chứng tỏ anh ta thích tác giả đó. [10]

 Nghiên cứu các thuật toán gợi ý cho phản hồi ẩn, chẳng hạn SVD++

[17]

 Về vấn đề giảm thiểu thời gian khi tính tốn online có thể tiếp cận

theo hướng: Một là nghiên cứu khai triển thuật toán gợi ý trên nền

Hadoop để tận dụng khả năng xử lý song song. (Chẳng hạn thuật tốn

tối ưu ALS khi tính tốn có thể triển khai phân tán [18]). Hai là sử

dụng điện toán đám mây để tận dụng tài nguyên mạnh của các nhà

cung cấp.61Tài liệu bạn tìm kiếm đã sẵn sàng tải về

CHƯƠNG 4 – THIẾT KẾ VÀ XÂY DỰNG HỆ THỐNG

Tải bản đầy đủ ngay(0 tr)

×