Tải bản đầy đủ - 0 (trang)
- Tồn tại điểm P3 mà P3 là lân cận bốn của P2 và P3 là lân cận bốn của P1. Hai điểm P1, P2 được gọi là liên thông tám với nhau nếu có một trong hai điều kiện:

- Tồn tại điểm P3 mà P3 là lân cận bốn của P2 và P3 là lân cận bốn của P1. Hai điểm P1, P2 được gọi là liên thông tám với nhau nếu có một trong hai điều kiện:

Tải bản đầy đủ - 0trang

Ý tưởng cơ bản của đối sánh mềm là đối sánh một cách tối ưu mẫu chưa biết

với tất cả các mẫu có thể mà các mẫu này có thể kéo giãn ra hoặc co lại. Chỉ một

không gian đặc trưng được thành lập, các vectơ chưa biết được đối sánh bằng cách

sử dụng quy hoạch động và một hàm biến dạng.

Đối sánh giảm nhẹ: Đây là một kỹ thuật đối sánh ảnh ở mức độ tượng trưng,

kỹ thuật này sử dụng hình dáng đặc trưng cơ bản của ảnh ký tự. Thứ nhất các vùng

đối sánh đã được nhận biết, trên cơ sở một số vùng đối sánh đã được nhận biết. Sau

đó một số vùng đối sánh được đánh giá tốt, các phần tử của ảnh được so sánh với

các vùng đối sánh này. Cơng việc này đòi hỏi một kỹ thuật tìm kiếm trong một

khơng gian đa chiều để tìm cực đại tồn cục của một số hàm.



1.3.2. Phương pháp tiếp cận cấu trúc

Cách tiếp cận của phương pháp này dựa vào việc mô tả đối tượng nhờ một số

khái niệm biểu diễn đối tượng cơ sở trong ngôn ngữ tự nhiên. Để mô tả đối tượng

người ta dùng một số dạng nguyên thuỷ như đoạn thẳng, cung… Mỗi đối tượng

được mô tả như một sự kết hợp của các dạng nguyên thuỷ.

Các quy tắc kết hợp các dạng nguyên thuỷ được xây dựng giống như việc

nghiên cứu văn phạm trong một ngơn ngữ, do đó q trình quyết định nhận dạng là

q trình phân tích cú pháp. Phương pháp này đặt vấn đề để giải quyết bài toán

nhận dạng chữ tổng quát. Tuy nhiên cho đến nay vẫn còn nhiều vấn đề liên quan

đến hệ nhận dạng cú pháp chưa được giải quyết độc lập và chưa xây dựng được các

thuật toán khả dụng. Hiện nay, nhận dạng theo cấu trúc phổ biến là trích chọn các

đặc trưng của mẫu học, phân hoạch bảng ký tự dựa trên các đặc trưng này, sau đó

ảnh cần nhận dạng sẽ được trích chọn đặc trưng, so sánh trên bảng phân hoạch để

tìm ra ký tự có các đặc trưng phù hợp.



1.3.3. Kỹ thuật đối sánh từng điểm xuất phát từ tâm

Chữ sau khi được tách khỏi từ, tâm nó được tính tốn và tọa độ được xác

định. Chữ được đối sánh với chữ chuẩn từng điểm một, từ tâm ra biên. Các hình



15



vành khăn lồng nhau có trọng tâm tạo thành lớp các điểm ảnh có cùng trọng số.

Khoảng cách giữa 2 điểm ảnh x và x’ được tính:

DIST( x,x’) =



 0 nêu x x



 Wx là trong so cua lop x



(1.1)



- Khoảng cách giữa 2 ký tự X và X’

DIST ( x, x ')

DIST ( X,X’) = x�X�

, x '�X '



(1.2)



Nếu DIST (X,X’) <  thì ký tự X được coi là X’,  là giá trị ngưỡng định trước.

Thuật toán trên thực hiện khá nhanh, song nếu chất lượng quét tồi, các điểm

chữ bị mất nhiều, trọng tâm bị lệch do đó sẽ ảnh hưởng đến chất lượng nhận dạng.



1.3.4. Kỹ thuật nhận dạng dựa vào đối sánh

Phương pháp này là sự cải tiến của phương pháp trên. Trong phương pháp

này người ta tính xem trên từng hàng, mỗi hàng cắt chữ tại bao nhiêu điểm, các giá

trị này được lưu vào một vector và loại bỏ giá trị 0 ở đầu và cuối. Đối với các cột

cũng thực hiện tương tự, sau đó vector này được coi là mẫu chuẩn nếu vector đó là

tập con của vector chuẩn và ngược lại. Phương pháp này đơn giản, cho tốc độ cao,

kết quả không bị ảnh hưởng bởi mất các điểm ở biên chữ, xong nhược điểm đòi hỏi

một phơng chữ chuẩn.



1.3.5. Kỹ thuật nhận dạng dựa vào hình chiếu

Kỹ thuật này là cải tiến của kỹ thuật trên, nhằm áp dụng cho nhiều kiểu font.

Giả sử mẫu nhận dạng có kích thước n x n gọi i là vector bậc n gồm các phần tử 0

và 1tương ứng với hàng i ( hay cột i) gọi  (i ) là tổng số các phần tử 1 trong vector

i và  (i ) ) là số giao điểm của i với ảnh mẫu. Khi đó một hàng hay một cột được



gọi là dài nếu:

 (i ) ) = 1



(1.3)



16



 (i ) �    với  là độ rộng cuả ký tự và  là ngưỡng cho trước (*).



Ý nghĩa của hàng, cột dài là chúng thể hiện chiều ngang hay chiều cao của ký tự.

Đặt i*  i �i 1 nếu thỏa mãn các điều kiện (*), tức là:

 (i* )  1



(1.4)



 (i ) �   



Khi đó ta có thể viết  (i* )  1 . Để trích ra các đặc trưng của mẫu, ảnh được

duyệt theo chiều ngang hay đứng như phương pháp trên. Tuy nhiên, ta có:

H i   (i* ) và Vi   (i* )



(1.5)



Tiếp đó trong các chuỗi H và V nếu H i  H i  1 và Vi  Vi  1 thì phâng tử

H i  H i  1 hoặc Vi  Vi  1 bị xóa khỏi chuỗi. cuối cung ta thu được các chuỗi H’ và



V’ đặc trưng cho ký tự. Kỹ thuật nhận dạng này có ưu điểm là có thể áp dụng cho

nhiều font. Xong nếu chất lượng quá tồi, ảnh có nhiều răng cưa giả thì chuỗi đặc

trưng sẽ lệch nhiều so với chuỗi chuẩn.



1.3.6. Phương pháp mặt nạ đối sánh

Phương pháp này được phát triển từ những năm 1960, nội dung chủ yếu là

mẫu cần nhận dạng, được chia nhỏ thành các vùng khác nhau. Tại mỗi vùng tổng số

điểm đen được tính tốn nếu giá trị của chúng lớn hơn một ngưỡng nào đó thì vùng

đó gọi là vùng đen, ngược lại vùng dưới ngưỡng lá vùng trắng quá trình nhận dạng

nhờ một cây quyết định, mỗi nút, phải trả lời một câu hỏi vùng tương ứng có phải là

vùng đen khơng? Phương pháp này khá đơn giản, nếu số lượng các vùng lớn, độ

phức tạp xử lý sẽ tăng nhiều lần đến kém hiệu quả khi thay đổi kiểu chữ.



1.3.7. Phương pháp thống kê giao điểm

Phương pháp này gần giống như phương pháp mặt nạ đối sánh với các điểm cắt

dọc và cắt ngang, ở đây người ta xây dựng bốn vector, ngồi hai vector thẳng đứng và

nằm ngang còn có hai vector chéo 45 0 và 1350. Trê mỗi hướng chỉ cần xét những

đường quét cắt ký tự từ một đến bốn điểm, cuối cùng ta thu được vector đặc trưng,

chứa tham số cho cả vector trước, quá trình nhận dạng dựa vào một tập quyết định.



17



1.4. Kết luận chương 1

Trong chương 1 chúng ta thấy được một cách khái quát một số chương trình

nhận dạng trên thế giới và trong nước, chương này đưa ra các vấn đề chính trong xử

lý ảnh. Đồng thời giúp ta hiểu khái quát hơn các phương pháp kỹ thuật xử lý ảnh cơ

bản. Từ đó phần nào định hướng phương pháp và cách giải quyết bài tốn ở các

chương sau.



CHƯƠNG 2

NGHIÊN CỨU, TÌM HIỂU MẠNG NƠRON NHÂN TẠO



2.1. Nơron sinh học và nơron nhân tạo

Mạng nơron nhân tạo được thiết kế dựa trên mô hình mạng nơron thần kinh

với các phần tử nơron nhân tạo của nó là sự mơ phỏng nơron sinh học. Các mức tổ

chức bộ não và cấu trúc mạng nơron sinh vật có thể được tham khảo trong tài liệu.

Trong phần này chúng ta chỉ tập trung tìm hiểu cấu tạo của nơron sinh học và nơron

nhân tạo để thấy được sự tương quan giữa chúng.



2.1.1. Nơron sinh học

Nơron sinh học có nhiều dạng khác nhau như dạng hình tháp, dạng tổ ong,

dạng rễ cây tuy nhiên chúng có chung một cấu trúc và nguyên lý hoạt động. Hình

sau đây mơ phỏng một nơron sinh học:



18



Hình 2.1: Minh họa nơron sinh học

Một tế bào nơron gồm các phần cơ bản:

- Nhánh và rễ: Là bộ phận tiếp nhận thông tin của tế bào nơron. Các đầu nhạy

hoặc các đầu ra của các nơron khác bám vào rễ hoặc nhánh của một nơron. Khi các

đầu vào từ ngồi này có sự chênh lệch về nồng độ K +, Na+ hay Cl- so với nồng độ bên

trong của nó thì xảy ra hiện tượng thấm từ ngồi vào trong thơng qua cơ chế màng

thấm đặc biệt. Hiện tượng thẩm thấu như vậy tạo nên một cơ chế truyền đạt thông tin

với hàng ngàn hàng vạn lối vào trên một nơron sinh học ứng với hàng nghìn hàng vạn

liên kết khác nhau. Mức độ thẩm thấu của các ion có thể coi là một đại lượng thay đổi

tùy thuộc vào nồng độ gọi là tỷ trọng hay đơn giản là trọng.

- Thân thần kinh: Thân thần kinh chứa các nhân và cơ quan tổng hợp protein.

Trong quá trình các ion vào được tổng hợp và biến đổi khi nồng độ các ion đạt đến

một giá trị nhất định, xảy ra quá trình phát xung (hay kích thích). Xung đó được

phát ở đầu ra của nơron. Dây dẫn đầu ra xung được gọi là dây thần kinh.



19



- Dây thần kinh: Là phương tiện truyền dẫn tín hiệu của giữa các nơron. Dây

thần kinh được cấu tạo gồm các đốt và có thể dài từ vài micro mét đến vài mét tùy

từng kết cấu cụ thể.

- Khớp thần kinh: Là bộ phận tiếp xúc của đầu ra nơron với nhánh, rễ của các

nơron khác. Chúng có cấu trúc màng đặc biệt để tiếp nhận các tín hiệu khi có sự

chênh lệch về nồng độ ion giữa bên trong và bên ngoài. Nếu độ lệch càng lớn thì

việc truyền các ion càng nhiều và ngược lại.



2.1.2. Nơron nhân tạo

Trên cơ sở cấu trúc của nơron sinh học tổng qt người ta đề xuất mơ hình

nơron nhân tạo gồm 3 phần chính: Bộ tổng liên kết đầu vào, bộ động học tuyến tính

và bộ phi tuyến, được minh họa cụ thể qua hình vẽ dưới đây:



x1



-1

w1



θ

x2



w2



v(t)



u(t)

H(.)



Σ



f(.)



y(t)



….

xm



wm



Hình 2.2: Mơ hình nơron nhân tạo

Với bộ tổng liên kết đầu vào: Là bộ tổng hợp các liên kết tại đầu vào của một

phần tử nơron, mô tả như sau:

m



v(t )  wk x k (t )  

k 1



Trong đó:



20



(2.1)



v(t): Tổng tất cả các đầu vào mơ tả tồn bộ thế năng tác động ở thân nơron .

xk(t): Các đầu vào ngoài; với k là chỉ số chạy, k=1,2…m.

m: Số lượng đầu vào mơ tả tín hiệu vào từ các đầu nhạy thần kinh hoặc các

nơron khác.

wk: Trọng liên kết ngoài giữa các đầu vào k tới nơron hiện tại.

y(t): Tín hiệu đầu ra nơron.

θ: Ngưỡng (là hằng số), xác định ngưỡng kích thích hay ức chế.

Bộ động học tuyến tính: Đầu vào của phần động học tuyến tính là v(t), đầu ra

của nó là u(t) gọi là đầu ra tương tự. Hàm truyền tương ứng của phần động học

tuyến tính có thể mơ tả dưới dạng:

U ( s)  H ( s )V ( s ) hay H ( s ) 



U (s)

V ( s)



(2.2)



Các hàm H(s) thường dùng được liệt kê trong bảng dưới đây:

Bảng 2.1: Các hàm truyền H(s) thường dùng



H(s)



1



1

s



Quan hệ vào ra



u (t )  v (t )



du (t )

v(t )

dt



T



1

1  sT



Exp( sT )



du (t )

 u (t ) v (t )

dt



u (t ) v(t  T )



Bộ phi tuyến: Phần này sử dụng hàm quan hệ phi tuyến f(.) cho đầu ra y, để

chặn tính hiệu ở đầu ra. Các hàm đầu ra thơng thường là các hàm có giới hạn

ngưỡng phù hợp với đặc điểm đầu ra của nơron sinh học. Hàm dạng này thường

được gọi là hàm kích hoạt (activation) thể hiện đặc điểm kích hoạt hay ức chế của

một nơron.



21



m



y  f (u (t ))  f ( xi (t ) wi   )



(2.3)



i 1



Hàm phi tuyến ở đây có thể chia thành hai nhóm: Nhóm hàm bước nhảy và

nhóm hàm liên tục. Đặc điểm chung của các hàm này thường tiến tới một giá trị cố

định với các giá trị được gán [0, 1] hoặc [-1, 1]. Bảng dưới đây liệt kê một số hàm

phi tuyến thường được dùng trong các mơ hình nơron:



Bảng 2.2: Một số hàm phi tuyến thường dùng trong mơ hình nơron



Tên hàm



Cơng thức

1

0



Bước nhảy đơn vị



f(x)= 



Hàm dấu (sgn)



f(x)= 



Hàm tuyến tính



f(x)= x



Hàm tuyến tính bão

hòa đối xứng



if x  0

if x  0



if x 0

1

  1 if x  0



if x  1

1



f(x)=  x if  1  x 1

  1 if x  0





22



Đặc tính



Hàm Sigmoid lưỡng

cực



f(x)=



2

1

1  e  x



Còn một số hàm khác cũng được sử dụng ngoài các hàm trên (Bảng 2.2) như

dạng hàm Gauss, hàm logarit, hàm mũ, hàm arctg.



2.2. Cấu tạo và phương thức làm việc của mạng nơron

2.2.1. Mạng nơron một lớp

Mỗi một nơron có thể phối hợp với các nơron khác tạo thành một lớp các

trọng số. Mạng một lớp truyền thẳng (Hình 2.3). Một lớp nơron là một nhóm các

nơron mà chúng đều có cùng trọng số, nhận cùng một tín hiệu đầu vào đồng thời.

Trong ma trận trọng số, các hàng là thể hiện nơron, hàng thứ j có thể đặt nhãn như

một vector wj của nơron thứ j gồm m trọng số wji. Các trọng số trong cùng một cột

thứ j (j=1,2,...,n) đồng thời cùng nhận một tín hiệu đầu vào xj.

wj = [wj1, wj2, ..., wjm]



(2.4)



Tại cùng một thời điểm, vector đầu vào x = [x1, x2,..., xn] có thể là một nguồn

bên ngồi là cảm biến hoặc thiết bị đo lường đưa tới mạng.



23



Hình 2.3: Mơ hình nơron một lớp



2.2.2. Mạng nơron truyền thẳng nhiều lớp

Mạng nơron nhiều lớp có các lớp được phân chia thành 3 loại:

Lớp vào là lớp nơron đầu tiên nhận tín hiệu vào xi (i = 1, 2, ..., n). Mỗi tín hiệu

xi được đưa đến tất cả các nơron của lớp vào. Thông thường, các nơron đầu vào không

làm biến đổi các tín hiệu vào xi, tức là chúng khơng có các trọng số hoặc khơng có các

loại hàm chuyển đổi nào, chúng chỉ đóng vai trò phân phối các tín hiệu.

Lớp ẩn là lớp nơron sau lớp vào, chúng khơng trực tiếp liên hệ với thế giới

bên ngồi như các lớp nơron vào/ra.

Lớp ra là lớp nơron tạo ra các tín hiệu ra cuối cùng.



24



Hình 2.4: Mơ hình mạng nơ ron truyền thẳng nhiều lớp



2.2.3. Mạng nơron phản hồi

Mạng nơron phản hồi là mạng mà đầu ra của mỗi nơron được quay trở lại nối

với đầu vào của các nơron cùng lớp được gọi là mạng Laeral



Hình 2.5: Mơ hình mạng nơron phản hồi



2.2.4. Mạng nơron hồi quy

Mạng nơron phản hồi có thể thực hiện đóng vòng được gọi là mạng nơron

hồi quy. Mạng nơron hồi quy có trọng số liên kết đối xứng.



25



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

- Tồn tại điểm P3 mà P3 là lân cận bốn của P2 và P3 là lân cận bốn của P1. Hai điểm P1, P2 được gọi là liên thông tám với nhau nếu có một trong hai điều kiện:

Tải bản đầy đủ ngay(0 tr)

×