Tải bản đầy đủ - 0 (trang)
6 Cấu trúc luận văn

6 Cấu trúc luận văn

Tải bản đầy đủ - 0trang

Chương 2. Cơ sở lý thuyết



Chương 2. CƠ SỞ LÝ THUYẾT

2.1 Virus máy tính

2.1.1 Định nghĩa

Malware: Malware hay còn gọi là phần mềm độc hại, là một phần mềm được

chèn máy tính hay các hệ thống tin học nhằm gây ra các thiệt hại nào đó (tính bí mật,

tính tồn vẹn hoặc tính sẵn sàng)

Virus: Virus máy tính là một chương trình máy tính mà hai đặc trưng chính bao

gồm việc tự nhân bản và lây nhiễm chính nó trong hệ thống, từ đó gây ra các thiệt hại

theo chủ ý của người lập trình virus.

2.1.2 Lịch sử virus máy tính

 1983 - Ngun lý của trò chơi “Core War” bị tiết lộ

Trong một cuộc so tài giữa hai chương trình máy tính tên là Core War, mỗi

chương trình tên là Organism có khả năng tự tái tạo chính nó và tìm cách tiêu diệt

Organism của đối phương. Chương trình nào với nhiều nhân bản hơn sẽ chiến thắng.

Sau đó, nguyên lý dựa trên trò chơi Core War này bị tiết lộ và dẫn đến sự ra đời của

virus máy tính.

 1986 – Sự ra đời của virus Brain

Brain là tên của virus máy tính đầu tiên trên thế giới, xuất phát từ Pakistan và lây

lan vào nước Mỹ với mục tiêu đầu tiên là trường Đại học Delaware.

 1987 – Virus Lehigh xuất hiện

Virus Lehigh xuất hiện và lây lan đầu tiên trong trường đại học Lehigh. Trong

cùng thời gian này, Virus dạng DOS Jerusalem xuất hiện đầu tiên tại Jerusalem tháng



17



Chương 2. Cơ sở lý thuyết



10/1987 đã chứng minh cho sự lây lan mạnh mẽ của virus máy tính với 500.000 bản

sao trong một giờ.

 1989 – AIDS Trojan xuất hiện

Mặc dù không được xem như một virus máy tính nhưng Trojan ln là khái niệm

đi cùng với khái niệm virus. Năm 1989, Trojan đầu tiên xuất hiện mang tên AIDS. Các

Trojan được tạo ra với mục đích chính đánh cắp thơng tin mật hay phá huỷ dữ liệu máy

tính.

 1991 –Tequila virus – Sự xuất hiện của virus đa hình

Sự xuất hiện của virus Tequila đánh dấu sự xuất hiện của loại virus đa hình. Bằng

việc thay đổi khối mã lệnh sau mỗi lần lây nhiễm, loại virus này khiến cho kiểu nhận

dạng virus dựa trên chuỗi đặc trưng – signature khơng còn tính hiệu quả.

2.1.3 Khả năng lây lan của virus máy tính

Virus máy tính được thiết kế để lây lan trong một hệ thống mạng thông qua nhiều

con đường khác nhau, thường do sự sơ xuất của người sử dụng nhưng đơi khi cũng do

chính từ các lỗ hổng trong các phần mềm, hệ điều hành khiến cho virus dễ dàng xâm

nhập lây nhiễm.

Trong thế giới mà sự tương tác giữa người với người phần lớn thơng qua internet

thì email trở thành một số những phương tiện hỗ trợ sự lây nhiễm virus đắc lực nhất.

Từ một máy tính bị nhiễm virus, một loạt email giả mạo được tạo lập và gửi đi, thao

tác giả mạo này tiếp tục được thực hiện ở máy người nhận khiến cho quá trình lây lan

được gia tăng theo cấp số nhân. Người lập trình tìm cách thiết kế ra những virus có khả

năng thu thập thơng tin về người sử dụng, từ đó tạo ra các email với nội dung “chân

thật”, đánh lừa lòng tin của người nhận.

Bên cạnh việc lây lan qua email, thì USB chính là một phương thức lây lan virus

trực tiếp do chính người sử dụng chủ động tác động. USB là một phương tiện trao đổi

18



Chương 2. Cơ sở lý thuyết



dữ liệu của phần lớn người dùng khi mà dung lượng của email có giới hạn. Khi một

máy tính bị nhiễm, các USB được gán vào máy tính này sẽ có nguy cơ bị lây nhiễm rất

cao, với mỗi USB đã chứa đoạn mã virus máy tính, sau khi được sử dụng cho các máy

tính mới sẽ khiến những máy này cũng gặp phải khả năng bị nhiễm.

Một tỉ lệ không nhỏ các máy tính bị xâm nhập do người sử dụng thiếu các kiến

thức bảo mật cần thiết khi thao tác trên môi trường internet. Khi truy cập vào các

website độc hại được nguỵ trang dưới dạng các trang web giải trí bắt mắt, các đoạn mã

độc được tải xuống mà người dung khơng hề hay biết, từ đó âm thầm lây nhiễm máy

tính của họ và bắt đầu q trình lây nhiễm cho các máy tính trong cùng hệ thống mạng

hay thông qua email, USB…

Một lý do khách quan cũng là một con đường lây lan của virus máy tính khi

những kẻ xấu tìm cách khai tác chính những lỗi bảo mật trong phần mềm, hệ điều

hành. Một số lỗi tồn tại hàng năm trời trước khi có những bản vá để sửa chữa, và cho

đến lúc đó, mức thiệt hại do virus máy tính gây ra đã rất to lớn. Trong trường hợp này,

cho dù bản thân người sử dụng có cảnh giác đến mức nào cũng khơng tránh khỏi việc

bị lây nhiễm.

2.1.4 Một số kĩ thuật nhận dạng virus máy tính

Hai nguyên lí cơ bản thường được các chương trình diệt virus máy tính hiện nay

sử dụng đó là nguyên lí kiểm tra chính xác và nguyên lí kiểm tra tương đối.

2.1.4.1 Nhận dạng chính xác

Trong nguyên lý nhận dạng chính xác, việc nhận dạng một mẫu virus dựa trên

việc kiểm tra các mẫu virus đã có trong cơ sở dữ liệu. Khi một virus mới xuất hiện, các

chuyên gia an ninh mạng sẽ tiến hành thu thập và phân tích mã độc của virus, từ đó xây

dựng một chữ ký đặc trưng của riêng virus đó và lưu trữ vào cơ sở dữ liệu. Kế đó, một

thao tác cập nhật được tiến hành trên toàn hệ thống các máy trạm nhằm bảo vệ những

máy vốn chưa bị lây nhiễm. Đây là kĩ thuật nhận dạng virus chính hiện nay.

19



Chương 2. Cơ sở lý thuyết



Ưu điễm của kĩ thuật này là độ chính cao và ít nhầm lẫn từ đó cho ra kết quả diệt

virus tốt hơn. Tuy nhiên, khuyết điểm chính của kĩ thuật này là việc nhận dạng và phát

hiện virus được tiến hành sau khi virus đã xuất hiện và gây thiệt hại ở mức độ nào đó,

tức là thao tác lúc này chỉ mang tính chất chữa cháy chứ không thể ngăn chặn sự tấn

công của các virus hoàn toàn mới. Một khuyết điểm khác là khả năng nhận dạng các

virus đa hình rất yếu, và khi số lượng virus gia tăng, kéo theo sự gia tăng của cơ sở dữ

liệu chữ kí virus, gây ra sự cồng kềnh và tốn kém thời gian trong việc cập nhật và quét

virus.

Các kĩ thuật nhận dạng chính xác chính được sử dụng bao gồm:

Nhận dạng theo mã hash: Sử dụng các thuật toán MD5, SHA, CRC để tính tốn

đoạn mã hash của một tập tin hay một phần thơng tin quan trọng và dùng đó làm cơ sở

để phát hiện sự vi phạm toàn vẹn của tập tin.

Nhận dạng theo kĩ thuật quét chuỗi (scan string): Là kĩ thuật được sử dụng phổ

biến trong hầu hết các phần mềm diệt virus. Trong kĩ thuật này, một đoạn chương trình

virus được chọn làm đặc trưng cho virus đó, tuy nhiên, đoạn chương trình này phải

phân biệt hồn tồn với tất cả các đoạn mã khác đã tồn tại trong cơ sở dữ liệu. Hai kĩ

thuật con của kiểu nhận dạng này là việc sử dụng các chuỗi có offset tĩnh hồn tồn

hoặc một vị trí tương đối nào đó trong tập tin.

2.1.4.2 Các kĩ thuật nhận dạng tương đối.

Là tập hợp các kĩ thuật nhận dạng mang tính chất tương đối, thay vì xác định

chính xác loại virus và tên virus thì kiểu nhận dạng này tập trung vào việc xác định tính

chất virus của một chương trình, tập tin. Các kĩ thuật chính của kiểu nhận dạng tương

đối bao gồm:



20



Chương 2. Cơ sở lý thuyết



2.1.4.2.1 Kiểu nhận dạng Heuristic

Từ các quy luật được đúc kết thông qua quá trình nghiên cứu quy luật hình thành

của các mã lệnh, các chuyên gia tiến hành xây dựng các dấu hiệu thường thấy ở mã

độc. Kĩ thuật này cho phép nhận dạng ra những loại virus ngay cả khi chưa có mẫu

virus đó thâm chí khi virus đó còn chưa xuất hiện. Nhược điểm chính của kĩ thuật này

là phụ thuộc quá nhiều vào kinh nghiệm của chuyên gia, việc cập nhật đòi hỏi nhiều

thời gian dẫn đến việc nhận dạng nhầm không thể tránh khỏi.

2.1.4.2.2 Cơ chế nhận dạng theo hành vi

Cơ chế nhận dạng này được xây dựng theo kiểu thời gian thực, tức là việc theo

dõi quá trình hoạt động của các chương trình trong hệ thống để từ đó phát hiện ra

những hành vi nghi ngờ và có biện pháp ngăn chặn kịp thời hoặc tham khảo ý kiến của

người dử dụng. Tuy nhiên, không phải tất cả các chương trình đều bị theo dõi mà tập

trung vào các chương trình có sử dụng các chức năng hệ thống. Cơ chế nhận dạng này

cho phép nhận dạng các mẫu virus mới, tuy nhiên việc xây dựng cơ chế này không hể

đơn giản, làm giảm hiệu năng của hệ thống do sự tiêu tốn tài nguyên để duy trì cơ chế

thời gian thực cũng như chưa chặn đứng nguy cơ các mã độc tồn tại tĩnh trong hệ

thống chưa được khởi chạy.

2.1.4.2.3 Cơ chế mô phỏng máy thật.

Trong cơ chế này, một khu vực phần mềm được xây dựng mô tả lại các trạng thái

của hệ thống để đánh lừa các tập tin virus để chúng hoạt động trên môi trường ảo này

và loại ra các nguy cơ xuất hiện. Mặc dù có khả năng nhận dạng nhiều loại virus kể cả

dạng đa hình, nén tuy nhiên chi phí quá lớn khiến việc sử dụng trên máy tính cá nhân

khơng mang tính hiệu quả. Bên cạnh đó, nhiều kĩ thuật lập trình virus mới có thể phát

hiện ra môi trườn ảo là tiến hành bất hoạt các hành vi độc hại, đánh lừa hệ thống bảo

mật này.



21



Chương 2. Cơ sở lý thuyết



2.2 Hệ miễn dịch nhân tạo

2.2.1 Hệ miễn dịch sinh học

Hệ miễn dịch sinh học là một hệ thống thích nghi có khả năng tự nhận dạng và tự

tổ chức, bao gồm nhiều bộ phận phân tán trong cơ thể nhằm giúp cho cơ thể chống lại

những lây nhiễm của các vi sinh vật bên ngoài. Nó bao gồm một kiến trúc phân tầng

với cơ chế tự điều chỉnh và bảo vệ rộng khắp, với hai tầng bảo vệ chính là: hệ thống

miễn dịch bẩm sinh và hệ thống miễn dịch thích nghi.

Chức năng của hệ miễn dịch sinh học là nhận dạng tế bào và phân chia chúng

thành hai nhóm khác nhau: self (những tế bào của cơ thể tạo ra) và non-self (những tế

bào lạ), đồng thời loại bỏ các tế bào thuộc loại non-self. Hệ miễn dịch bẩm sinh chủ

yếu dựa vào bạch cầu hạt và đại thực bào, còn hệ miễn dịch thích nghi dựa vào tế bào

lymphơ (lymphocyte). Các tế bào lymphô được chia làm hai loại là Bcell và T-cell,

chúng có khả năng ghi nhớ, thích nghi, và mang những phần tử thụ cảm trên bề mặt có

khả năng nhận diện kháng ngun (antigen). Vai trò chính của B-cell là sản sinh ra các

kháng thể (antibody) tương ứng với các tác nhân gây bệnh, còn chức năng chính của Tcell là điều chỉnh các tế bào khác và tấn công trực tiếp các tế bào gây ra sự lây nhiễm

trong cơ thể. Khi có kháng nguyên xâm nhập vào cơ thể, các cơ quan thụ cảm trên bề

mặt của lymphô bào được kích hoạt và thực hiện q trình nhân rộng, đột biến và tạo ra

những kháng thể thích hợp có khả năng nhận diện cũng như loại bỏ kháng nguyên. Một

số lymphô bào sẽ trở thành tế bào ghi nhớ và lưu thơng trong cơ thể, sau đó, nếu có

loại kháng ngun tương tự lây nhiễm thì hệ miễn dịch thích nghi có thể nhanh chóng

phát hiện và loại bỏ chúng. Khả năng "tự hoàn thiện" này của hệ miễn dịch giúp cơ thể

không mắc lại những bệnh cũ. Hệ miễn dịch sinh học bao gồm hơn 107 mạng miễn

dịch con (immune sub-network) với các nguyên tắc hoạt động rất phức tạp. Nó thực sự

là một hệ thống hoạt động tin cậy, thống nhất, có khả năng tính tốn song song và phân

tán. Xét theo quan điểm của khoa học máy tính, thì việc xây dựng hệ thống tính tốn

mơ phỏng hệ thống miễn dịch sinh học có rất nhiều ý nghĩa thực tiễn

22



Chương 2. Cơ sở lý thuyết



2.2.2 Cấu trúc cơ bản

AIS có cấu trúc phân tầng, điều này đảm bảo các yếu tố cơ bản của một hệ

thống mô phỏng sinh học:

-



Biểu diễn các thành phần của hệ thống.



-



Cơ chế đánh giá tương tác của các cá thể với môi trường và các cá thể



với nhau. Môi trường thường mơ phỏng bởi một tập kích thích vào, một hoặc nhiều

hàm đo độ thích nghi của cá thể với mơi trường.

-



Các thủ tục thích nghi điều khiển tính động của hệ thống, tức là làm cho



hoạt động của hệ thống thay đổi theo thời gian.



Hình 2.1 Cấu trúc phân tầng của AIS



Tầng đầu tiên là lĩnh vực ứng dụng. Tầng này có vai trò quyết định thành phần hệ

thống, cách biểu diễn và thao tác trên các thành phần. Với lĩnh vực ứng dụng khác

nhau thì các thành phần này cũng khác nhau.

Tầng thứ hai là biểu diễn tương ứng trong AIS. AIS cần phải biểu diễn được hai

thành phần quan trọng: kháng thể và kháng nguyên. Bên cạnh đó là các thành phần

khác nếu có yêu cầu từ các tầng khác trong hệ thống.



23



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

6 Cấu trúc luận văn

Tải bản đầy đủ ngay(0 tr)

×