Tải bản đầy đủ - 0 (trang)
Hình 3.7 Giải thuật xác định độ nguy hiểm của một tập tin

Hình 3.7 Giải thuật xác định độ nguy hiểm của một tập tin

Tải bản đầy đủ - 0trang

Chương 3. Hướng tiếp cận mạng miễn dịch nơ-ron nhân tạo trong phát hiện virus máy tính



cho nếu mức độ nguy hiểm của tập tin cao hơn giá trị ngưỡng này thì ta khẳng định đó

là tập tin virus.

Tuy nhiên, việc xác định giá trị ngưỡng này không phải dễ dàng, ta cần thực

nghiệm trên một số lượng tập tin lớn, bao gồm cả virus và chương trình sạch, từ đó lựa

chọn giá trị ngưỡng phù hợp.

Ta thực hiện sử dụng một giải pháp hiệu quả hơn nhiều bằng việc xây dựng một

bộ phân lớp, học từ dữ liệu thực nghiệm từ đó xác định nhãn (virus hoặc sạch) cho các

tập tin mới.

3.3.2.3 Xây dựng dữ liệu huấn luyện cho bộ phân lớp

Quá trình xây dựng dữ liệu huấn luyện cho bộ phân lớp được thực hiện bằng

cách chọn ngẫu nhiên 1 tập tin nào đó trong tập các tập tin mà ta đã biết chính xác là

virus hay chương trình sạch. Tính mức độ nguy hiểm của tập tin này đồng thường gán

nhãn tương ứng cho nó. Mỗi bộ với dl là mức độ nguy hiểm của một tập tin

và label là nhãn của tập tin đó, chính là một bộ dữ liệu huấn luyện.

Điều ta cần làm tiếp theo là xây dựng một tập các bộ huấn luyện như thế.

3.3.2.4 Xây dựng bộ phân lớp

Bởi vì cấu trúc mỗi bộ dữ liệu huấn luyện khá đơn giản nên ta có thể sử dụng

một mạng nơ-ron nhân tạo với giải thuật học lan truyền ngược để học các dữ liệu huấn

luyện này. Tương tự như các mạng nơ-ron có chức năng bộ phát hiện, bộ phân lớp

mạng nơ ron này cũng có 1 nơ ron xuất và hàm kích hoạt là xích ma lưỡng cực. Giá trị

nhãn được gán 0.5 cho virus và -0.5 cho chương trình sạch. Số đơn vị đầu vào là 1 và

khơng có lớp ẩn.

Sau quá trình huấn luyện, để kiểm tra một tập tin thực thi có là virus hay khơng,

ta đưa giá trị mức độ nguy hiểm của tập tin vào bộ phân lớp và tính giá trị xuất ra. Ta

69



Chương 3. Hướng tiếp cận mạng miễn dịch nơ-ron nhân tạo trong phát hiện virus máy tính



sử dụng cơ chế xác định nhãn cho tập tin tương tự như cơ chế xác định nhãn cho chuỗi

nhị phân đã được trình bày ở phần trước.



70



Chương 4. Cài đặt



Chương 4. CÀI ĐẶT

Chương này trình bày phần cài đặt hiện thực hố mơ hình ANIN cũng như cài đặt

các chức năng như xây dựng dữ liệu huấn luyện, xây dựng bộ phân lớp tập tin. Sau quá

trình cài đặt là giai đoạn thử nghiệm, việc xây dựng bộ dữ liệu đầu vào, việc lựa chọn

thông số cũng như so sánh kết quả thực nghiệm giữa ANIN với mơ hình CLONALG

kết hợp ANN cũng sẽ được trình bày.



4.1 Hiện thực hố ANIN

Như đã được trình bày ở chương 3, Mơ hình ANIN bao gồm ba bộ phận cấu

thành chính là dữ liệu huấn luyện, các bộ phát hiện ANN và giải thuật huấn luyện

AiNets. Ở đây, việc cài đặt ANIN cũng được tiến hành từng bước, lần lượt xây

dựng các thành phần con của mô hình, sau đó tiến tới cài đặt một module hồn

chỉnh để phối hợp hoạt động của các thành phần này.

4.1.1 Xây dựng bộ phát hiện ANNs

Mỗi mạng nơ-ron nhân tạo bao gồm một tập các lớp, mỗi lớp lại bao gồm một

tập các nơ-ron cùng các phương thức tính tốn ở mỗi lớp. Cuối cùng, mỗi nơ-ron, đơn

vị cơ bản của mạng nơ-ron có thuộc tính chính là một chuỗi các trọng số từ các nơ-ron

lớp phía trước kết nối đến nó. Việc cài đặt đối tượng mạng nơ-ron nhân tạo có tham

khảo các mơ hình sẵn có từ các bộ thư viện mở trên internet.

Khi cài đặt đối tượng mạng nơ-ron nhân tạo, ta tiến hành cài đặt đơn vị xử lý cơ

bản nơ-ron trước. Một nơ-ron được xây dựng với chức năng chính là tính tốn một giá

trị đầu ra tương ứng với một mảng các giá trị đầu vào. Nơ-ron dạng hàm kích hoạt còn

có thêm thuộc tính ActivationFunction để thực hiện việc xử lý đầu ra theo dạng hàm

kích hoạt tương ứng. (Xem Hình 4.1)



71



Chương 4. Cài đặt



Hình 4.1 Lớp biểu diễn một đối tượng nơ-ron



Sau khi cài đặt xong lớp biễu diễn đối tượng nơ-ron, ta tiến hành cài đặt lớp

biểu diễn một Layer các nơ-ron trong kiểu cấu trúc mạng dẫn tiến. Thuộc tính chính

của lớp Layer này là một tập các nơ-ron. Phương thức chính Compute cho phép tính ra

một mảng các đầu ra, mỗi đầu ra tương ứng với giá trị đầu ra của một nơ-ron trong lớp.

(Xem Hình 4.2)



72



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Hình 3.7 Giải thuật xác định độ nguy hiểm của một tập tin

Tải bản đầy đủ ngay(0 tr)

×