Tải bản đầy đủ - 0 (trang)
Bảng 4.4 Danh sách thông số quan trong của bộ xây dựng dữ liệu huấn luyện

Bảng 4.4 Danh sách thông số quan trong của bộ xây dựng dữ liệu huấn luyện

Tải bản đầy đủ - 0trang

Chương 4. Cài đặt



Length



Kiểu số nguyên



Kích thước của chuỗi nhị phân tính bằng đơn vị

byte. Giá trị mặc định là 4.



Step size



Kiểu số nguyên



Kích thước bước trích xuất chuỗi mã nhị phân từ

luồng dữ liệu, cũng chính là số bytes chung giữa hai

chuỗi nhị phân liên tiếp. Giá trị mặc định là bằng ½

chiều dài chuỗi nhị phân.



Number



of Kiểu số ngun



Thơng số số nhóm k khi áp dụng thuật tốn KMeans. Ở đây k chỉ mang ý nghĩa tối đa vì số nhóm



clusters



thực tế có thể thấp hơn tùy vào trạng thái của dữ liệu.

Selection



Kiểu Thực



Tỉ lệ xác định các nhóm có mật độ phần tử đơng

nhất được chọn để trở thành các kháng nguyên sử



Rate



dụng trong quá trình huấn luyện.

d



Kiểu số nguyên



Giá trị ngưỡng sử dụng trong luật so khớp

Hamming.



r



Kiểu số nguyên



Giá trị ngưỡng sử dụng trong luật so khớp RContiguous



Khu vực minh họa kết quả của quá trình xây dựng dữ liệu huấn luyện gồm hai

phần. Phần đầu tiên minh họa kết quả đầu ra của việc trích xuất chuỗi nhị phân từ tập

tin cũng như kết quả của giải thuật chọn lọc âm tính. Phần thứ hai minh họa kết quả

gom cụm dữ liệu bằng giải thuật K-means.



86



Chương 4. Cài đặt



4.2.6 Giao diện



87



Chương 4. Cài đặt



Hình 4.11 Giao diện bộ xây dựng dữ liệu huấn luyện

4.3



Xây dựng bộ phân lớp tập tin



4.3.1 Cài đặt các lớp đối tượng

Trong giai đoạn này, ta hiện thực hóa cơ chế sử dụng các bộ phát hiện ANNs để

xác định giá trị mức độ nguy hiểm của một chuỗi, từ đó xác định giá trị mức độ nguy

hiểm của tập tin. Kế tiếp, ta xây dựng dữ liệu huấn luyện cho bộ phân lớp bằng cách

tính mức độ nguy hiểm của các tập tin virus và tập tin sạch cùng giá trị nhãn tương

ứng.

Các lớp đối tượng được xây dựng trong giai đoạn này được trình bài trong bảng

Bảng 4.5 và Hình 4.12

88



Chương 4. Cài đặt



Bảng 4.5 Các lớp đối tượng trong bộ phân lớp tập tin



Tên lớp

AffinityVector



Mô Tả

Lớp đối tượng mơ tả một vector ái lực, với nội dung

chính bao gồm tên tập tin, giá trị nguy hiệm của nó và nhãn

tương ứng (0.5 : virus; -0.5 : sạch)



AffinityVectorGeneration



Lớp đối tượng thực hiện chức năng xây dựng nên một

bộ các vector ái lực được tạo ra từ các tập tin trong thư mục

virus và sạch. Các phương thức của lớp này bao gồm việc

tính giá trị nguy hiểm của một chuỗi, tính giá trị nguy hiểm

của một tập tin, tính giá trị nguy hiểm của các tập tin trong

thư mục.

Lưu trữ thông tin của một tập tin. Các thông tin được



FileInformation



lưu trữ bao gồm tên tập tin, nhãn tập tin và chuỗi mã nhị

phân của nó

Lớp đối tượng lưu trữ một danh sách các thơng tin tập



FileCollection



tin. Phương thức chính được xây dựng bao gồm việc đọc

một danh sách từ dữ liệu hay ghi vào dữ liệu mới danh sách

hiện tại.



89



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Bảng 4.4 Danh sách thông số quan trong của bộ xây dựng dữ liệu huấn luyện

Tải bản đầy đủ ngay(0 tr)

×