Tải bản đầy đủ - 0 (trang)
2 Mô tả bài toán

2 Mô tả bài toán

Tải bản đầy đủ - 0trang

Khóa luận tốt nghiệp



GVHD: Th.S Mai Thu Giang



Đ



ẠI



H





C



KI



N

H



TẾ



H



U







Hình 2 . 1 Trường Đại học Kinh tế Huế



G



Để có thể hỗ trợ cố vấn học tập đưa ra những tư vấn kịp thời đến sinh viên thì đề







N



tài đề xuất áp dụng kĩ thuật khai phá dữ liệu đối với cơ sở dữ liệu điểm của sinh viên



TR



Ư



chuyên ngành Tin học Kinh tế. Cụ thể đề tài sẽ sử dụng cơ sở dữ liệu điểm các môn

đại cương của sinh viên Khoa Hệ thống Thơng tin Kinh tế từ khóa K43 đến K47

chuyên ngành Tin học Kinh tế để dự báo điểm của các mơn chun ngành với mơ hình

phân lớp mạng nơ ron và cây quyết định. Từ đó xây dựng các mơ hình dự báo cho

phép dự báo kết quả học tập của sinh viên đối với từng môn chuyên ngành, hỗ trợ cố

vấn học tập đưa ra tư vấn kịp thời đến mỗi sinh viên, giúp sinh viên thay đổi phương

pháp học tập để có kết quả cao hơn. Bên cạnh đó cũng giúp cho giảng viên bộ môn

chú ý hơn tới những sinh viên được dự báo là có kết quả học tập khơng cao, từ đó có

phương pháp dạy học phù hợp đối với những sinh viên này.



SVTH: Trương Văn Quốc Anh



38



Khóa luận tốt nghiệp



GVHD: Th.S Mai Thu Giang



Trong thí nghiệm này, đề tài sẽ sử dụng điểm 8 học phần đại cương là Toán cao

cấp 1, Toán cao cấp 2, Những nguyên lý cơ bản của chủ nghĩa Mác-Lenin 1, Những

nguyên lý cơ bản của chủ nghĩa Mác-Lenin 2, Lý thuyết xác xuất thống kê tốn, Kinh

tế vi mơ, Pháp luật đại cương, Tin học đại cương để dự báo cho 11 học phần của

chuyên ngành Tin học Kinh tế bao gồm Cơ sở dữ liệu, Cơ sở lập trình, Cấu trúc dữ

liệu giải thuật, Hoạch định nguồn lực doanh nghiệp ERP, Hệ thống thông tin quản lý,

Kiến trúc máy tính và hệ điều hành, Lập trình hướng đối tượng, Lập trình ứng dụng

trong quản lý, Mạng và truyền thông, Phát triển hệ thống thông tin kinh tế và Tốn rời



TR



Ư







N



G



Đ



ẠI



H





C



KI



N

H



TẾ



H



U







rạc.



Hình 2 . 2 Chương trình đào tạo chuyên ngành Tin học Kinh tế.



SVTH: Trương Văn Quốc Anh



39



Khóa luận tốt nghiệp



GVHD: Th.S Mai Thu Giang





C



KI



N

H



TẾ



H



U







2.3 Quy trình nghiên cứu



H



Hình 2 . 3 Sơ đồ quy trình nghiên cứu



ẠI



Từ nguồn cơ sở dữ liệu điểm của sinh viên thuộc tất cả các khoa của Trường



G



Đ



Đại học Kinh tế Huế. Tiến hành trích rút dữ liệu điểm của sinh viên chuyên ngành Tin







N



học Kinh tế thuộc khoa Hệ thống Thơng tin Kinh tế từ khóa K43 đến khóa K47. Bộ dữ



Ư



liệu này sau khi được trích rút sẽ trải qua quá trình tiền xử lý để cho ra bộ dữ liệu



TR



chuẩn hóa cuối cùng. Dữ liệu sau khi đã được chuẩn hóa sẽ được dùng để tiến hành

huấn luyện mơ hình bằng kỹ thuật mạng nơ ron và cây quyết định, mơ hình sẽ được

huấn luyện trên cả dữ liệu đã trích chọn thuộc thích và dữ liệu chưa trích chọn thuộc

tính. Ở bước tiếp theo tiến hành so sánh đối chiếu độ chính xác của hai mơ hình, mơ

hình nào cho ra độ chính xác cao hơn sẽ được lưu lại và sử dụng để dự báo sau này.



SVTH: Trương Văn Quốc Anh



40



Khóa luận tốt nghiệp



GVHD: Th.S Mai Thu Giang



CHƯƠNG 3. ỨNG DỤNG WEKA TRONG DỰ BÁO ĐIỂM

CHUN NGÀNH TIN HỌC KINH TẾ

3.1 Mơ tả thí nghiệm

Trích rút và tiền xử lý dữ liệu

Nguồn dữ liệu ban đầu sẽ được trích xuất từ cơ sở dữ liệu điểm Phòng Đào tạo,

trường Đại học Kinh tế Huế từ khóa K43 đến K47 của sinh viên chuyên ngành Tin học

Kinh tế.

Khi xác định xong khoa và lớp mong muốn thì hệ thống sẽ đưa ra các trường







thơng tin về sinh viên mà người dùng muốn có, chẳng hạn như giới tính, địa chỉ, điểm



H



U



thi các mơn đại học, điểm kết thúc các học phần qua từng kì, … Sau khi xác định xong







N



G



Đ



ẠI



H





C



KI



N

H



TẾ



các trường mong muốn, nhấn vào nút tải để tiến hành trích rút dữ liệu.



Hình 3 . 1 Dữ liệu thơ ban đầu



TR



Ư



Dữ liệu được trích xuất sẽ được lưu lại dưới dạng file excel, mỗi file gồm có

thơng tin dữ liệu về điểm và số tín chỉ tất cả học phần mà sinh viên đăng ký học với số

lượng mẫu ban đầu là 253 bản ghi .



SVTH: Trương Văn Quốc Anh



41



Khóa luận tốt nghiệp



GVHD: Th.S Mai Thu Giang



Để dữ liệu có thể hoạt động trên mơi trường weka thì bắt buộc phải tiến hành

chuẩn hóa. Dữ liệu sau khi gộp sẽ có các trường có dữ liệu bị trống cần được xử lý, ở

đây đề tài sẽ tiến hành xóa các trường bị trống đi bằng cơng cụ có sẵn của Excel. Tại



N

H



TẾ



H



U







mỗi ơ có giá trị trống sẽ có màu nổi bật giúp chúng ta nhận biết, sau đó tiến hành xóa



KI



Hình 3 . 2 Giá trị trống được đánh dấu





C



đi những giá trị trống đó.



H



Tuy nhiên, dữ liệu thu thập sẽ bao gồm cả điểm học lần đầu và điểm học lại của



ẠI



mỗi sinh viên, ở đây đề tài chỉ sử dụng dữ liệu điểm học lần đầu của mỗi sinh viên để



G



Đ



dự báo nên cần phải xóa đi dữ liệu điểm học lại của sinh viên.



N



Do phần mềm weka không hỗ trợ tiếng việt nên ta cần phải thay thế những



Ư







trường chứa tiếng việt có dấu thành khơng dấu



TR



Dữ liệu còn lại sau khi tiến hành xử lý còn lại 232 bản ghi, chứa đầy đủ thông tin

của mỗi sinh viên.



3 . 3 Dữ liệu sau quá trình tiền xử lý

SVTH: Trương VănHình

Quốc

Anh



42



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

2 Mô tả bài toán

Tải bản đầy đủ ngay(0 tr)

×