Tải bản đầy đủ - 0 (trang)
5 Các phép toán di truyền

5 Các phép toán di truyền

Tải bản đầy đủ - 0trang

Phương pháp chọn lọc thứ hai là phương pháp chọn lọc đấu loại k phần tử

(k-tournament). Trong phương pháp này, một nhiễm sắc thể có hàm thích nghi tốt

nhất trong số k nhiễm sắc thể được chọn ngẫu nhiên từ quần thể. Hai nhiễm sắc thể

C1 và C2 có được từ việc lập lại thủ tục ở trên liên tiếp tạo ra một nhiễm sắc thể mới

Cc+m bằng cách sử dụng các phép toán lai ghép và đột biến sẽ được giải thích sau.

Thủ tục tái sinh ở trên được lập lại nhiều lần bằng pSelect  |P|, với |P| là kích thước

quần thể.

Cuối cùng, phần còn lại của tập quần thể mới được làm đầy bằng cách phát

sinh ngẫu nhiên các nhiễm sắc thể. Hình 3-3 cho thấy một phương pháp lai ghép tái

sinh dựa trên một hổn hợp của ba phương pháp tái sinh khác nhau.



Hình 3-3: Lược đồ phương pháp chọn lọc tái sinh.



18



2.5.2 Phép lai ghép 4

Lai ghép giữa hai nhiễm sắc thể đã chọn C1 và C2 được thực hiện như sau:

Cho các ngưỡng tương tự khởi tạo thứ i của 2 nhiễm sắc thể đã chọn C1 và C2 là

t1(ai) và t2(ai). Hàm thích nghi của 2 nhiễm sắc thể đã chọn C1 và C2 là F1 và F2 .

Ngưỡng tương tự khởi tạo thứ i là tc(ai) của nhiễm sắc thể mới Cc được tạo ra bằng

phép tốn lai ghép được tính bằng một số trung bình:

t c  ai  



F1 t1  ai   F2 t 2  ai 

F1  F2



Phép tốn này được áp dụng cho tồn bộ những ngưỡng tương tự khởi tạo

của hai nhiễm sắc thể đã chọn với xác suất lai ghép Pc.

2.5.3 Phép đột biến 5

Đột biến được thực hiện như sau: Đầu tiên, một nhiễm sắc thể C’ được

chọn ngẫu nhiên từ quần thể với xác suất của sự đột biến Pm. Tiếp theo, giá trị

ngưỡng tương tự khởi tạo t’(ai) của nhiễm sắc thể C’ được chọn ngẫu nhiên và nó

được đột biến theo cách sau:

tm(ai) = 1.5 - t’(ai)

Với t’(ai) và tm(ai) tương ứng là giá trị ngưỡng tương tự khởi tạo đã chọn và

ngưỡng tương tự khởi tạo đột biến. Sự thực hiện liên tiếp của phép toán lai ghép và

đột biến hồn thành phép tốn di truyền và nó tạo ra nhiễm sắc thể mới Cc+m. Dưới

đây là tóm tắt việc xác định giá trị tương tự khởi tạo tối ưu bằng cách sử dụng thuật

toán di truyền.

Thuật toán: (Đầu vào: A=(U, Ad), Sa: Va x Va  [0,1] aA;

Đầu ra: {t{t(a): aA}})

1. Khởi tạo



4

5



-



Đọc thông tin từ bảng.



-



Xác định độ đo tương tự.



Crossover

Mutation



19



-



Phát sinh quần thể khởi tạo: ngưỡng tương tự khởi tạo nằm

trong khoảng [0,1].



-



Đánh giá hàm thích nghi của quần thể khởi tạo.



2. Thực hiện thuật tốn di truyền

while (stop_condition)

{

Reproduction();

Crossover();

Mutation();

Đánh giá hàm thích nghi của quần thể mới;

(Evalute fitness function of new population)

1  A , d   1   1    A , d 



}

3. Xác định ngưỡng tối ưu



Chương 3 PHÂN LOẠI DỮ LIỆU DỰA TRÊN TẬP THƠ

TOLERANT

Cho rằng, đó là một tập của những mẫu huấn luyện được chuẩn bị cho việc

phân loại dữ liệu. Chúng ta xác định tối ưu các giá trị của các ngưỡng tương tự khởi

tạo bằng phương pháp tiến hoá dựa trên thuật toán di truyền sử dụng tập của những

mẫu huấn luyện. Sau khi xác định những ngưỡng tương tự khởi tạo tối ưu, chúng ta

cần phải thu được tập xấp xỉ dưới và tập xấp xỉ trên của các mẫu huấn luyện. Một

thủ tục xác định hai tập xấp xỉ được đưa ra như sau:

Sử dụng các ngưỡng khởi tạo ta có được một tập tolerant TS(x) của mỗi mẫu

x trong tập huấn luyện. Tiếp theo, Ta thu được tập xấp xỉ dưới  A  x  và tập xấp xỉ

trên  A  x  của mỗi mẫu x trong các mẫu huấn luyện. Các tập  A  x  và  A  x  của

mỗi đối tượng trong các mẫu huấn luyện có được bằng cách sử dụng các tập tolerat

tương ứng. Một mẫu x sẽ thuộc vào tập xấp xỉ dưới hoặc tập xấp xỉ trên cho dù tất

cả các mẫu trong tập tolerant TS(x) của mẫu x có cùng một lớp hay khơng.

Khi một mẫu x thuộc vào tập xấp xỉ dưới, các mẫu khác trong tập tolerant

TS(x) của mẫu x có thể có các lớp quyết định khác nhau từ những mẫu khác. Như

vậy, chúng ta cần một kỹ thuật để đo lường sự không chắc chắn của lớp bao phủ của

một mẫu x. Cho một lớp quyết định của một đối tượng y trong tập tolerant TS(x) là

d(y) và lớp quyết định thứ i là di (i=1, 2, …, r(d)), với r(d) là số các lớp quyết định.

Chúng ta cần xác định một hàm thành viên thô di(x) biểu diễn mức độ phổ biến của

mẫu x trong lớp quyết định di như sau:

 di  x  



card  y  TS  x  | d  y  d  i  

card TS  x  



Chúng ta đưa ra một phương pháp phân loại hai giai đoạn dựa trên tập xấp xỉ

dưới và tập xấp xỉ trên được trích từ tập các mẫu huấn luyện . Về cơ bản, phương

pháp được thực hiện theo một cách đó là các mẫu thử sẽ được phân loại bằng cách

sử dụng tập xấp xỉ dưới ở giai đoạn đầu và sau đó những mẫu thử này không thể



21



được phân loại trong giai đoạn 1 sẽ được phân loại bằng cách sử dụng tập xấp xỉ

trên trong giai đoạn 2. Giải thích chi tiết của mỗi giai đoạn sẽ được đưa ra dưới đây.



3.1 Giai đoạn 1: dùng xấp xỉ dưới

Chúng ta thu được một tập tolerant TSl(x) của mẫu thử x, với chỉ số dưới

dòng l chỉ ra là tập xấp xỉ dưới:

TSl(x) = {yTS(x) : i{1, 2, .., r(d)}, di = 1}

Nếu tập tolerant TSl(x) của mẫu x chỉ có chính nó, nghĩa là TSl(x)={x}. Chúng

ta khơng thể phân loại mẫu thử x trong giai đoạn đầu và chúng ta chuyển sự phân

loại một mẫu thử như vậy sang giai đoạn 2.

Nếu tập tolerant TS(x) của mẫu thử x bao gồm nhiều mẫu huấn luyện, ta thu

được tần số quan hệ trong cùng một lớp của các mẫu huấn luyện trong tập tolerant

TS(x). Khi các mẫu huấn luyện trong tập tolerant TS(x) phân hoá các quyết định,

chúng ta quy cho mẫu thử x trong lớp có giá trị tần số quan hệ lớn nhất. Khi sự khác

nhau giữa các giá trị lớn nhất và giá trị tần số quan hệ lớn thứ hai không nhiều,

nghĩa là:

freq 1  freq 2

1



freq 1

r (d )



Với freq1 = card({yTSl(x )| d(y)=d(x)})

freq1 = card({yTSl(x )| d(y)=d(i), i{1, 2, …, r(d)})

r(d) là số các lớp quyết định.

Chúng ta cũng chuyển sự phân loại của mẫu thử như vậy sang giai đoạn 2 bởi

vì lớp bao phủ là không chắc chắn (mờ) căn cứ vào tập xấp xỉ dưới.



3.2 Giai đoạn 2: dùng xấp xỉ trên

Bởi vì tập xấp xỉ trên bao gồm tất cả các mẫu thử trong tập xấp xỉ dưới và các

mẫu thử trong tập xấp xỉ dưới đã được xem xét trong giai đoạn 1. Chúng ta sử dụng

các mẫu huấn luyện trong vùng biên (the boundary region) , không phải tất cả các

mẫu trong tập xấp xỉ trên, trong giai đoạn 2 của việc phân loại. Vì vậy, thời gian

ước lượng cho việc phân loại trong giai đoạn 2 là không lâu vì chỉ có các mẫu trong



22



vùng biên mới được lấy và số các mẫu trong vùng biên là không quá nhiều. Tương

tự trong giai đoạn đầu, chúng ta thu được một tập tolerant TSb(x) của dữ liệu thử

chưa phân loại x, với chỉ số dưới dòng b có nghĩa là vùng biên.

TSb(x) = {yTS(x) : i{1, 2, .., r(d)}, di < 1}

Sau đó, chúng ta xác định hàm thành viên thô của tất cả các mẫu trong tập

tolerant TSb(x) của mẫu thử x chưa phân loại đối với các lớp quyết định. Cho tập

tolerant TSb(x) của mẫu thử chưa phân loại x là {1,2,…,M}, với M là số các mẫu

thử trong vùng biên có quan hệ tolerant đối với mẫu thử x và thừa nhận mỗi mẫu j

có hàm thành viên thơ {di(i)|i=1,2,…,r(d)}. Ta có cơng thức tính hàm thành viên

thơ trung bình của mẫu thử x đối với mỗi lớp quyết định như sau:

 di  x  



1

M



M



   ,

di



j



i 1,2,..., r (d )



j 1



Chúng ta quy mẫu chưa phân loại x vào lớp có hàm thành viên thơ trung bình

lớn nhất. Khi sự khác nhau giữa các hàm thành viên thơ trung bình lớn nhất và hàm

thành viên thơ trung bình lớn thứ hai khơng nhiều, nghĩa là:







dmaz1



  dmaz 2



 d max 1



  1 / r (d )



Với  d max 1 là hàm thành viên thơ trung bình lớn nhất và  d max 2 là hàm thành

viên thơ trung bình lớn thứ hai và r(d) là số các lớp quyết định thì chúng ta loại bỏ

mẫu thử x trong xử lý phân loại. Hình 4-1 minh hoạ cho phương pháp phân loại 2

giai đoạn.



23



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

5 Các phép toán di truyền

Tải bản đầy đủ ngay(0 tr)

×