Tải bản đầy đủ - 0 (trang)
Hình 1.1: Phép tập trung

Hình 1.1: Phép tập trung

Tải bản đầy đủ - 0trang

1.4. MỜ HĨA VÀ KHỬ MỜ

1.4.1. Phương pháp mờ hóa

Việc mờ hóa có hai bài tốn:

(i)



Tìm tập mờ biểu thị một tập kinh điển hay, một cách tổng quát

hơn, hãy mờ hóa một tập mờ đã cho ;



(ii)



Tìm độ thuộc của giá trị ngôn ngữ của một biến ngôn ngữ tương

ứng với một dữ liệu đầu vào là thực hoặc mờ.



Theo nghĩa thứ nhất ta định nghĩa phép mờ hóa như sau:

Phép mờ hóa F của một tập mờ trên tập vũ trụ U sẽ cho ta một tập mờ

được xác định theo cơng thức sau:

.Trong đó là một tập mờ trên , , được gọi là nhân (kernel) của F.

Nếu là hàm thuộc của tập kinh điển 1-phần tử {u}, chỉ bằng 1 tại phần tử u

còn lại là bằng 0 hay ta có tập “mờ” {1/u}, thì ta có:

=

Nếu là tập kinh điển A, trên A và bằng 0 ngồi A, thì mờ hóa của A với

nhân sẽ là tập mờ sau:

.

Bài tốn mờ hóa thứ 2 được giới hạn trong trường hợp tập vũ trụ là tập

hữu hạn các giá trị ngơn ngữ

Cụ thể bài tốn mờ hóa trong trường hợp này như sau: Giả sử T là tập các

giá trị ngôn ngữ của một biến ngôn ngữ X nào đó với miền cơ sở U. Cho một tập

kinh điển hoặc tập mờ trên U. Hãy tìm tập mờ trên miền T biểu thị tập mờ hay,

một cách tương đương, hãy tìm độ thuộc của giá trị trong T tương ứng với dữ

liệu đầu vào .

1.4.2. Phương pháp khử mờ

Về trực quan chúng ta có thể đưa ra những yêu cầu để một phương pháp

12



khử mờ được xem là tốt. Hellendoorn, H. and C. Thomas năm 1993 đã đưa ra 5

tiêu chuẩn trực quan sau.

(i) Tính liên tục, nghĩa là một sự thay đổi nhỏ của dữ liệu đầu vào của

phương pháp nó cũng chỉ tạo ra những thay đổi nhỏ ở dữ liệu đầu ra;

(ii) Tính không nhập nhằng (disambiguity), nghĩa là phương pháp chỉ sinh

ra một giá trị đầu ra duy nhất;

(iii) Tính hợp lý (plausibility) đòi hỏi rằng giá trị đầu ra phải nằm ở vùng

trung tâm của tập mờ và độ thuộc hay giá trị hàm thuộc tại đó phải lớn (khơng

nhất thiết lớn nhất);

(iv) Độ phức tạp tính đơn giản (computational simplicity), một đòi hỏi tự nhiên.

(v) Tính trọng số của phương pháp (weighting method) đòi hỏi phương

pháp tính đến trọng số hay “sự ưu tiên” của các tập mờ kết quả đầu ra (đối với

trường hợp bài toán cho nhiều kết quả đầu ra như đối với một số phương pháp lập

luận mờ đa điều kiện).

Nói chung, chúng ta có thể hiểu các tiêu chuẩn cần bảo đảm giá trị khử mờ

của tập mờ là phần tử thực đại diện một cách hợp lý của .

Sau đây chúng ta nghiên cứu một vài phương pháp khử mờ.

1.4.2.1. Phương pháp cực đại trung bình (average maximum)

Cho tập mờ với hàm thuộc . Gọi tương ứng là hai giá trị nhỏ nhất và lớn

nhất của miền cơ sở U mà tại đó hàm thuộc nhận giá trị lớn nhất (cực đại toàn

phần). Ký hiệu giá trị khử ở của theo phương pháp cực đại trung bình là . Khi đó

được định nghĩa như sau:



Ý tưởng của phương pháp này là chúng ta chỉ quan tâm đến các giá trị của U

mà tại đó nó phù hợp hay tương thích với ngữ nghĩa của tập mờ nhất, tại đó độ thuộc

là cực đại tồn phần. Những giá trị khác của U mà tại đó độ thuộc nhỏ hơn 1 đều bị

bỏ qua. Vì vậy, một khả năng lựa chọn giá trị khử mờ là giá trị trung bình của giá trị

nhỏ nhất và giá trị lớn nhất tại đó độ thuộc vào tập mờ là lớn nhất. Đó chính là lý do

13



người ta gọi phương pháp khử mờ này là phương pháp cực đại trung bình.

1.4.2.2. Phương pháp cực đại trung bình có trọng số

Ý tưởng của phương pháp này là tìm những đoạn tại đó hàm thuộc đạt cực

đại địa phương. Nghĩa là tại các giá trị của miền cơ sở mờ độ thuộc của chúng đạt

cực đại địa phương. Nói khác đi các giá trị đó của U thuộc về tập mờ với độ tin cậy

có độ trội nhất. Các giá trị như vậy cần được tham gia “đóng góp” vào việc xác định

giá trị khử mở của tập với trọng số đóng góp chính là độ thuộc của chúng vào tập .

Chúng ta chọn cách đóng góp như vậy bằng phương pháp lấy trung bình có trọng số

(weighted average maxima method). Vì vậy cách tính giá trị khử mờ của tập mờ

như sau:

Xác định các giá trị của U mà tại đó hàm thuộc đạt giá trị cực đại địa

phương. Ký hiệu là giá trị lớn nhất và nhỏ nhất trong các giá trị của U mà tại đó

hàm thuộc đạt cực đại địa phương. Giá trị trung bình cộng của sẽ được ký hiệu là ,

trong đó, chỉ số i chỉ nó là giá trị tương ứng với giá trị cực đại địa phương thứ i.

Giả sử hàm thuộc có m giá trị cực đại địa phương, i = 1, 2, …, m. Khi đó giá

trị khử mờ của tập mờ được tính theo cơng thức trung bình cộng có trọng số như

sau:



1.4.2.3. Phương pháp trọng tâm

Theo nghĩa thông thường của trọng tâm, cơng thức tính giá trị khử mờ có

dạng sau:



1.5. TIỂU KẾT CHƯƠNG 1

Như vậy qua chương 1 luận văn đã trình bày cơ sở lý thuyết tập mờ, các

phép tốn trên tập mờ. Tập mờ đóng vai trò quan trọng trong việc phân cụm. Trong

cách biểu diễn tập mờ sử dụng đến một hàm thuộc để biểu thị tính thuộc (thành

viên) của đối tượng vào một tập. Trong chương tiếp theo luận văn sẽ trình bày đến

tổng quan về phân cụm và một số thuật toán phân cụm mờ.

14



Chương 2: MỘT SỐ PHƯƠNG PHÁP PHÂN CỤM MỜ

2.1. TỔNG QUAN VỀ PHÂN CỤM

2.1.1. Khái niệm phân cụm dữ liệu

Định nghĩa 2.1:

Cho X là một tập dữ liệu:



(2.1)



Ta định nghĩa m–phân cụm của X như một sự phân chia X thành m tập

(cụm): sao cho thoả 3 điều kiện:

(i) .

(ii) .

(iii)

Thêm vào đó, các vector trong một cụm là “tương tự” nhau hơn so với các

vector thuộc một cụm khác. Lượng hố thuật ngữ “tương tự” và “khơng tương tự”

phụ thuộc rất nhiều vào loại của cụm (xem hình 2.1). Với định nghĩa trên, mỗi

vector chỉ thuộc về một cụm riêng nên loại phân cụm này thỉnh thoảng còn được gọi

là chặt hay rõ (hard or crisp).



Các tập chặc



Các tập dài và mỏng



Các tập dạng cầu và

ellipsoid

Hình 2.1: Hình dạng các loại cụm



Dựa vào khái niệm tập mờ ta có thể định nghĩa như sau:



15



Định nghĩa 2.2:

Một sự phân cụm mờ tập X thành m cụm được mô tả bởi m hàm

thuộc sao cho:



(2.2)





(2.3)



Mỗi cụm trong trường hợp này có thể khơng được định nghĩa chính xác.

Nghĩa là mỗi vector x thuộc về nhiều hơn một cụm, với mỗi cụm nó lại thuộc về với

độ thuộc :

 gần 1: mức độ thuộc của x vào cụm thứ j cao;

 gần 0: mức độ thuộc của x vào cụm thứ j thấp.

Nếu một hàm thuộc có giá trị gần 1 với hai vector thì hai vector này được coi

là tương tự nhau. Điều kiện (2.3) đảm bảo rằng không tồn tại một cụm mà không

chứa bất kỳ vector nào. Định nghĩa 2.1 là một trường hợp riêng của định nghĩa 2.2

khi hàm thuộc chỉ nhận hai giá trị 0 và 1, lúc này nó được gọi là hàm đặc trưng.

Để tối ưu hóa, các thuật giải phân cụm, dữ liệu yêu cầu phải được chuẩn hóa.

Có 2 dạng chuẩn hóa dữ liệu phổ biến:

(i)



Min-max normalization: khi muốn giá trị chuẩn hóa nằm trong đoạn 0..1



(ii)



Z-score standardization: Giá trị chuẩn hóa trong đoạn -3…3



Ngoài phương pháp sử dụng khoảng cách để tính độ “tương tự”, phân cụm

dữ liệu còn tính độ “tương tự” dựa vào khái niệm: hai hay nhiều đối tượng thuộc

cùng nhóm nếu có một định nghĩa khái niệm chung cho tất cả các đối tượng trong

đó. Nói cách khác, đối tượng của nhóm phải phù hợp với nhau theo miêu tả các khái

niệm đã được định nghĩa, không phải theo những biện pháp đơn giản tương tự.

2.1.2. Mục tiêu của phân cụm dữ liệu

Mục tiêu của phân cụm dữ liệu là để xác định các nhóm nội tại bên trong một

16



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Hình 1.1: Phép tập trung

Tải bản đầy đủ ngay(0 tr)

×