Tải bản đầy đủ - 0 (trang)
Bảng 4.4 Danh sách thông số quan trong của bộ xây dựng dữ liệu huấn luyện

Bảng 4.4 Danh sách thông số quan trong của bộ xây dựng dữ liệu huấn luyện

Tải bản đầy đủ - 0trang

Chương 4. Cài đặtLengthKiểu số nguyênKích thước của chuỗi nhị phân tính bằng đơn vị

byte. Giá trị mặc định là 4.Step sizeKiểu số nguyênKích thước bước trích xuất chuỗi mã nhị phân từ

luồng dữ liệu, cũng chính là số bytes chung giữa hai

chuỗi nhị phân liên tiếp. Giá trị mặc định là bằng ½

chiều dài chuỗi nhị phân.Numberof Kiểu số ngunThơng số số nhóm k khi áp dụng thuật tốn KMeans. Ở đây k chỉ mang ý nghĩa tối đa vì số nhómclustersthực tế có thể thấp hơn tùy vào trạng thái của dữ liệu.

SelectionKiểu ThựcTỉ lệ xác định các nhóm có mật độ phần tử đơng

nhất được chọn để trở thành các kháng nguyên sửRatedụng trong quá trình huấn luyện.

dKiểu số nguyênGiá trị ngưỡng sử dụng trong luật so khớp

Hamming.rKiểu số nguyênGiá trị ngưỡng sử dụng trong luật so khớp RContiguousKhu vực minh họa kết quả của quá trình xây dựng dữ liệu huấn luyện gồm hai

phần. Phần đầu tiên minh họa kết quả đầu ra của việc trích xuất chuỗi nhị phân từ tập

tin cũng như kết quả của giải thuật chọn lọc âm tính. Phần thứ hai minh họa kết quả

gom cụm dữ liệu bằng giải thuật K-means.86Chương 4. Cài đặt4.2.6 Giao diện87Chương 4. Cài đặtHình 4.11 Giao diện bộ xây dựng dữ liệu huấn luyện

4.3Xây dựng bộ phân lớp tập tin4.3.1 Cài đặt các lớp đối tượng

Trong giai đoạn này, ta hiện thực hóa cơ chế sử dụng các bộ phát hiện ANNs để

xác định giá trị mức độ nguy hiểm của một chuỗi, từ đó xác định giá trị mức độ nguy

hiểm của tập tin. Kế tiếp, ta xây dựng dữ liệu huấn luyện cho bộ phân lớp bằng cách

tính mức độ nguy hiểm của các tập tin virus và tập tin sạch cùng giá trị nhãn tương

ứng.

Các lớp đối tượng được xây dựng trong giai đoạn này được trình bài trong bảng

Bảng 4.5 và Hình 4.12

88Chương 4. Cài đặtBảng 4.5 Các lớp đối tượng trong bộ phân lớp tập tinTên lớp

AffinityVectorMô Tả

Lớp đối tượng mơ tả một vector ái lực, với nội dung

chính bao gồm tên tập tin, giá trị nguy hiệm của nó và nhãn

tương ứng (0.5 : virus; -0.5 : sạch)AffinityVectorGenerationLớp đối tượng thực hiện chức năng xây dựng nên một

bộ các vector ái lực được tạo ra từ các tập tin trong thư mục

virus và sạch. Các phương thức của lớp này bao gồm việc

tính giá trị nguy hiểm của một chuỗi, tính giá trị nguy hiểm

của một tập tin, tính giá trị nguy hiểm của các tập tin trong

thư mục.

Lưu trữ thông tin của một tập tin. Các thông tin đượcFileInformationlưu trữ bao gồm tên tập tin, nhãn tập tin và chuỗi mã nhị

phân của nó

Lớp đối tượng lưu trữ một danh sách các thơng tin tậpFileCollectiontin. Phương thức chính được xây dựng bao gồm việc đọc

một danh sách từ dữ liệu hay ghi vào dữ liệu mới danh sách

hiện tại.89Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Bảng 4.4 Danh sách thông số quan trong của bộ xây dựng dữ liệu huấn luyện

Tải bản đầy đủ ngay(0 tr)

×