Tải bản đầy đủ - 0 (trang)
3 Khởi tạo quần thể ban đầu

3 Khởi tạo quần thể ban đầu

Tải bản đầy đủ - 0trang

giữa hai đối tượng x và y. Từ đó, chúng ta xác định hai loại liên kết giữa hai đối

tượng x và y như sau:

x và y có mối liên kết tốt  xTS(y)  d(x) = d(y)

x và y có mối liên kết xấu  xTS(y)  d(x)  d(y)

Với d(x), d(y) là các quyết định tương ứng của hai lớp đối tượng x và y,

chúng sẽ có mối liên kết tốt (hoặc xấu). Hình 3-2 minh hoạ hai loại của mối liên kết

giữa các đối tượng.

d1



d2

d3



Mối liên kết tốt

Mối liên kết xấu



Hình 3-2. Các mối liên kết tốt và mối liên kết xấu



Khi chúng ta chọn hàm thích nghi cho việc xác định ngưỡng tương tự khởi

tạo tối ưu chúng ta cần xem xét hai yêu cầu sau:

 Nếu hai đối tượng x, yU có quan hệ tolerant thì chúng nằm trong

cùng một lớp càng nhiều càng tốt.

 Nếu hai đối tượng cùng nằm trong cùng một lớp thí chúng có quan hệ

tolerant càng nhiều càng tốt.

Đề cập yêu cầu thứ nhất, chúng ta cần xác định một đặc trưng xấp xỉ của sự

phân loại 



 d



A,



nó biểu diễn tỷ lệ của tất cả quan hệ tolerant chính xác ( A-



correctly) phân loại đối tượng.



15



Cho một tập của những đối tượng được chứa trong cùng một lớp Yi={xU /

d(x) = di, i=1, 2, …, r(d)}, với r(d) là số các lớp quyết định. Xét tập thô tolerant

TS(x) được chứa trong cùng lớp di, nghĩa là:

{TS(x) | i TS(x)  Yi}

Sự liên kết trong tập tolerant đối với tất cả các lớp đối tượng U được gọi là

một vùng rõ ràng A của phân hoạch {Yi,i=1,2,…,r(d)} được định nghĩa như sau:

r (d )



POS A , d    TS ( x ) / i TS(x)  Yi    A (Yi )

xU



i 1



Chất lượng xấp xỉ của sự phân loại 



 d



A,



được xác định bởi tỷ số của tất cả



A-corectly phân loại đối tượng từ U như sau:

 A , d 



card ( POS A , d  )

card U



Như vậy, giá trị ngưỡng tương tự tăng lên, chất lượng xấp xỉ của việc phân

loại 



 d



A,



sẽ được tăng lên làm cho kích thước của những tập tolerant giảm xuống.



Do đó, sự thay đổi gồm cả những tập tolerant trong tập được chia {i } trở nên lớn

hơn.

Khi chúng ta chỉ xem xét chất lượng xấp xỉ của việc phân loại 



 d



A,



việc



chúng ta tìm ngưỡng tương tự khởi tạo trở nên lớn hơn, bởi vì điều kiện là các yếu

tố trong tập thô tolerant được chứa trong cùng một lớp do đó kết quả phân loại cho

ra kích thước của các phần được chia trở nên nhỏ hơn. Đôi khi, kết quả phân loại

làm cho phần được chia nhiều nhất chỉ chứa duy nhất một đối tượng đơn.

Vì vậy, để thoả mãn yêu cầu thứ hai là các đối tượng được chứa trong cùng

một lớp có quan hệ tolerant càng nhiều càng tốt. Với yêu cầu này chúng ta xác định

tỷ lệ mối liên kết tốt là  



 d



A,



, xác định tỷ lệ các đối tượng nằm trong cùng một lớp



có quan hệ với nhau trên tổng số các đối tượng trong cùng một lớp:

  A , d  



card  A    x, y  / d ( x) d ( y ) 

card   x, y  / d ( x ) d ( y ) 



16



Bởi vì, giá trị ngưỡng tương tự khởi tạo tăng lên, tỉ lệ của các mối liên kết tốt

  A , d  giảm xuống, cho nên kích thước của các tập tolerant giảm xuống. Do đó, làm



cho số lượng các mối liên kết tốt trở nên nhỏ hơn.

Vì hai hệ số 

dựa trên một tỷ lệ 



 d



A,



 d



A,



và  



 d



A,



làm việc ngược nhau. Nếu hàm thìch nghi chỉ



thì quá trình tiến hố có khuynh hướng làm cho kích thước



các tập tolerant càng nhỏ càng tốt, và 1 là tốt nhất. Từ đó ta gặp phải vấn đề “phân

mảnh lớp”, nghĩa là sẽ có nhiều lớp nhưng mỗi lớp chỉ có một ít đối tượng. Nếu

hàm thích nghi chỉ dựa trên một tỷ lệ  



 d



A,



thì ngược lại ta sẽ được kết quả phân



lớp chỉ tập trung vào một số các lớp nào đó.

Do đó, vấn đề đặt ra là cần phải kết hợp hài hoà hai tỷ lệ này. Hàm thích nghi

dựa trên việc kết hợp hai tỷ lệ này sẽ có dạng như sau:

F   A  d   1    x  A  d 



Với  và ( - 1) là các hằng số trọng lượng có thể được thay đổi theo mục

đích phân loại. Ở đây, giới hạn thứ nhất là tạo một vài đối tượng có quan hệ tolerant

được chứa trong cùng một lớp và giới hạn thứ hai là tạo các đối tượng trong cùng

một lớp trở nên có quan hệ tolerant.



2.5 Các phép tốn di truyền 2

Quần thể khởi tạo của ngưỡng tương tự khởi tạo được suy ra từ mối kết hợp

của các phép toán phát sinh để tìm một tập ngưỡng tương tự khởi tạo tối ưu cho

việc phân loại dữ liệu. Giải thích chi tiết về các phép toán phát sinh được sử dụng

cho việc xác định các giá tri tương tự khởi tạo được đưa ra như sau:

2.5.1 Phép chọn lọc tái sinh 3

Chúng ta sử dụng một sự pha trộn của các phương pháp chọn lọc cho việc

tái sinh các nhiễm sắc thể.

Phương pháp chọn lọc đầu tiên là một nhiễm sắc thể tốt nhất (elitism) có

hàm thích nghi cao nhất sẽ được đưa vào quần thể mới.

2

3



Genetic Operations

Reproduction



17



Phương pháp chọn lọc thứ hai là phương pháp chọn lọc đấu loại k phần tử

(k-tournament). Trong phương pháp này, một nhiễm sắc thể có hàm thích nghi tốt

nhất trong số k nhiễm sắc thể được chọn ngẫu nhiên từ quần thể. Hai nhiễm sắc thể

C1 và C2 có được từ việc lập lại thủ tục ở trên liên tiếp tạo ra một nhiễm sắc thể mới

Cc+m bằng cách sử dụng các phép toán lai ghép và đột biến sẽ được giải thích sau.

Thủ tục tái sinh ở trên được lập lại nhiều lần bằng pSelect  |P|, với |P| là kích thước

quần thể.

Cuối cùng, phần còn lại của tập quần thể mới được làm đầy bằng cách phát

sinh ngẫu nhiên các nhiễm sắc thể. Hình 3-3 cho thấy một phương pháp lai ghép tái

sinh dựa trên một hổn hợp của ba phương pháp tái sinh khác nhau.



Hình 3-3: Lược đồ phương pháp chọn lọc tái sinh.



18



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

3 Khởi tạo quần thể ban đầu

Tải bản đầy đủ ngay(0 tr)

×