Tải bản đầy đủ - 0 (trang)
CHƯƠNG II: TỔNG QUAN VỀ HỆ THỐNG XỬ LÝ ẢNH

CHƯƠNG II: TỔNG QUAN VỀ HỆ THỐNG XỬ LÝ ẢNH

Tải bản đầy đủ - 0trang





Khối nhận dạng: dựa vào các đặc trưng đã thu nhận từ q trình phân tích ảnh

trước đó thực hiện quá trình nhận dạng, đưa ra các quy ết định ứng v ới các ứng



dụng cụ thể.

2.1.1 Một số khái niệm và các vấn đề cơ bản trong xử lý ảnh

2.1.1.1 Một số khái niệm cơ bản:

a) Phần tử ảnh (Pixel – Picture Element):

Ảnh trong thực tế là một ảnh liên tục về không gian và giá trị độ sáng. Để có

thể xử lý ảnh bằng máy tính cần thiết phải số hóa ảnh. Trong q trình số hóa,

người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thơng qua q trình l ấy

mẫu (rời rạc hóa về khơng gian) và lượng hóa thành phần giá trị. Trong quá trình

này người ta sử dụng khái niệm Pixel để biểu diễn các phần tử của bức ảnh. Ở

đây, cũng cần phân biệt khái niệm pixel hay đề cập đến trong các hệ thống đồ

họa máy tính. Để tránh nhầm lẫn ta tạm thời gọi khái niệm pixel này là pixel

thiết bị.

Khái niệm pixel thiết bị có thể xem xét như sau: khi ta quan sát màn hình

(trong chế độ đồ họa), màn hình khơng liên tục mà gồm nhiều đi ểm nh ỏ, g ọi là

pixel. Mỗi pixel bao gồm một cặp tọa độ x, y và màu. Cặp tọa đ ộ x, y t ạo nên đ ộ

phân giải (resolution). Như màn hình máy tính có nhiều độ phân gi ải khác nhau,

hiện tại phổ biến là màn hình VGA có độ phân giải 640x480 hay XSGA độ phân

giải 1024x768.



Hình 2.1.1.1a: Hình ảnh thể hiện một điểm ảnh

b) Ảnh màu (Color Image):



Ảnh màu chứa thông tin màu cho mỗi phần tử ảnh. Thông th ường giá tr ị

màu này dựa trên các không gian màu (color space) trong đó khơng gian màu

SVTH: Hồ Xn Hiền

Lớp: KT ĐT-TT K37A



Page 10



thườngđược dùng là RGB tương ứng với ba kênh màu đỏ (Red) – xanh lá cây

(Green) – xanh da trời (Blue). Tùy thuộc vào số bit, được sử dụng để lưư trữ màu

ta có số lượng màu khác nhau, ví dụ 8 bit, 16 bit, 24 bit (True Color). N ếu ta s ử

dụng nhỏ hơn 24 bit để lưu trữ màu thì ta phải có 1 bảng Palette màu, nó tương

tự như một bảng Lookup Table cho phép ánh xạ giữa một vị trí trong bảng với

một tổ hợp của khơng gian màu RGB. Ví dụ như sử dụng 8 bit tương ứng với 256

màu thì ta phải có bảng ánh xạ 256 màu đó tương ứng với 256 tổ hợp Red –

Green – Blue.



Hình 2.1.1.1b: ảnh màu RGB

c) Mức xám của ảnh:



Mức xám (Gray level) là kết quả sự mã hóa tương ứng m ột cường độ sáng

của mỗi điểm ảnh với một giá trị số - kết quả của q trình lượng tử hóa. Ảnh đa

mức xám là ảnh có sự chuyển dần mức xám từ trắng sang đen. Th ực t ế, m ột giá

trị mức xám chính là sự tổ hợp của ba giá trị RGB (Red- Green – Blue). Thông

thường mỗi điểm ảnh trong bức ảnh đa xám thường được mã hóa 8 bit, tương

ứng với 256 mức xám.



SVTH: Hồ Xuân Hiền

Lớp: KT ĐT-TT K37A



Page 11



Hình 2.1.1.1c:: Hình ảnh được chuyển sang mức xám



d) Ảnh nhị phân:



Ảnh nhị phân chỉ có 2 mức đen trắng phân biệt tức là dùng 1 bit mô tả 21



mức khác nhau. Nói cách khác: mỗi đi ểm ảnh của ảnh nhị phân ch ỉ có th ể là 0

hoặc 1.



Hình 2.1.1.1d: Ảnh được nhị phân

e) Lược đồ mức xám:



Lược đồ này (Hình 2.1.1.1e) đơn giản cho ta biết tần suất xuất hiện của



mỗi điểm ảnh ( pixel ) trong một bức ảnh ứng với mức xám tương ứng. Ví dụ,

một ảnh đa mức xám sử dụng 8 bit, có 256 mức xám từ o tới 255. L ược đồ mức

xám sẽ có trục hồnh chạy từ 0 tới 255 và trục tung chính là tổng số điểm ảnh có

mức xám tương ứng. Biểu đồ này tuy đơn giản nhưng có nhiều ứng dụng trong

các bài tốn giãn độ tương phản và phân ngưỡng ảnh ( biến từ ảnh mức xám

sang ảnh nhị phân).



Hình 2.1.1.1e:: Lượt đồ mức xám của ảnh xám tương ứng

SVTH: Hồ Xuân Hiền

Lớp: KT ĐT-TT K37A



Page 12



2.1.1.2



Biểu diễn ảnh:

Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của ảnh

là pixel. Nhìn chung có thể xem một hàm hai biến chứa thơng tin như bi ểu diễn

một ảnh. Các mơ hình biểu diễn ảnh cho ta một mô tả logic hay định lượng các

tính chất của hàm này. Trong biểu diễn ảnh cần chú ý tới đặc tính trung thực của

ảnh hoặc các tiêu chuẩn “thông minh” để đo chất lượng của ảnh hoặc tính hi ệu

quả của các kỹ thuật xử lý.

Một số mơ hình thường được dùng để biểu diễn ảnh như: mơ hình tốn

học, mơ hình thống kê,v.v.... Trong mơ hình tốn học, ảnh hai chi ều bi ểu di ễn nh ờ

các hàm hai biến trực giao gọi là hàm cơ sở. Với mơ hình th ống kê, m ột ảnh được

coi như một phần tử của một tập hợp đặc trưng bởi các đại l ượng như: kỳ v ọng

toán học, hiệp biến, phương sai và mômen.



2.1.1.3



2.1.1.4



Tăng cường ảnh - Khôi phục ảnh:

Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Nó gồm m ột

loạt các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu…

Khôi phục ảnh nhằm loại bỏ các suy giảm trong ảnh.

Biến đổi ảnh:

Trong xử lý ảnh do số điểm ảnh lớn các tính tốn nhiều (độ phức tạp tính

tốn cao) đòi hỏi dung lượng bộ nhớ lớn, thời gian tính tốn lâu. Các ph ương

pháp khoa học kinh điển áp dụng cho xử lý ảnh hầu hết khó khả thi. Người ta s ử

dụng các phép toán tương đương hoặc biến đổi sang mi ền x ử lý khác đ ể d ễ tính

tốn. Sau khi xử lý dễ dàng hơn được thực hiện, dùng bi ến đổi ngược đ ể đưa v ề



miền xác định ban đầu, các biến đổi thường gặp trong xử lý ảnh gồm:

• Biến đổi Fourier, Cosin, Sin

• Biến đổi (mơ tả) ảnh bằng tích chập, tích Kronecker

• Các biến đổi khác như KL (Karhumen Loeve), Hadamard

2.1.1.5 Phân tích ảnh:

Phân tích ảnh liên quan đến việc xác định các độ đo đ ịnh l ượng c ủa ảnh đ ể

đưa ra một mô tả đầy đủ về ảnh. Một số kỹ thuật hay dùng là dò biên, dán nhãn

vùng liên thơng, phân vùng ảnh…

2.1.1.6



Nhận dạng ảnh:

Nhận dạng là q trình liên quan đến các mô tả đối tượng mà ng ười ta

muốn đặc tả nó. Q trình nhận dạng thường đi sau q trình trích chọn các đặc

tính chủ yếu của đối tượng. Có hai kiểu mơ tả đối tượng:

SVTH: Hồ Xn Hiền

Lớp: KT ĐT-TT K37A



Page 13









Mơ tả tham số (Nhận dạng theo tham số)

Mô tả theo cấu trúc (Nhận dạng theo cấu trúc)

Trên thực tế, người ta đã áp dụng kỹ thuật này để nhận dạng khá thành

công nhiều đối tượng khác nhau như: nhận dạng vân tay, nhân dạng chữ (ch ữ

cái, chữ sỗ có dấu…).



2.2 Thu nhận ảnh:

2.2.1 Các thiết bị thu nhận ảnh:

Hai thành phần cho công đoạn này là linh kiện nhạy với phổ năng lượng

điện từ trường, loại thứ nhất tạo tín hiệu điện ở đầu ra tỷ lệ với mức năng

2.2.1.1



lượng mà bộ cảm biến (đại diện là camera); loại thứ hai là bộ số hố.

Lý thuyết về camera:



Hình 2.2.1.1: Hình ảnh CCD camera

Tổng quát có hai kiểu camera: ki ểu camera dùng đèn chân không và ki ểu

camera chỉ dùng bán dẫn. Đặc biệt là trong lĩnh vực này, camera bán d ẫn th ường

hay được dùng hơn camera đèn chân không. Camera bán dẫn cũng được g ọi là

CCD camera do dùng các thanh ghi dịch đặc bi ệt gọi là thi ết b ị g ộp (ChargeCoupled Devices- CCDs). Các CCD này chuy ển các tín hi ệu ảnh sang từ b ộ c ảm

nhận ánh sáng bổ trợ ở phía trước camera thành các tín hiệu đi ện mà sau đó

được mã hóa thành tín hiệu TV. Loại camera chất l ượng cao cho tín hi ệu ít nhi ễu

và có độ nhậy cao với ánh sáng. Khi chọn camera cần chú ý đ ến các th ấu kính t ừ



-



18 đến 108 mm.

Sau đây là danh sách các nhà sản xuất:

Pulnix America Inc, 770 Lucerne Drive, Sunnyvale, CA 84086. Tel. 408-773-1550;



-



fax 408-737-2966.

Sony Corp. of America, Component Products Co., 10833 Valley View St., Cypress,



-



CA 90630. Fax 714-737-4285.

Parasonic, industrial camera division: 201-329-6674.

JVC Professional: 1-800-JVC-5825.

SVTH: Hồ Xuân Hiền

Lớp: KT ĐT-TT K37A



Page 14



2.2.1.2



Bộ cảm biến ảnh:

Máy chụp ảnh, camera có thể ghi lại hình ảnh (phim trong máy ch ụp,

vidicon trong camera truyền hình). Có nhiều loại máy cảm bi ến (Sensor) làm

việc với ánh sáng nhìn thấy và hồng ngoại như: Micro Densitometers, Image

Dissector, Camera Divicon, linh kiện quang điện bằng bán dẫn. Các loại c ảm bi ến

bằng chụp ảnh phải số hoá là phim âm bản hoặc chụp ảnh. Camera divicon và

linh kiện bán dẫn quang điện có thể cho ảnh ghi trên băng từ có th ể s ố hoá.

Trong Micro Densitometer phim và ảnh chụp được gắn trên mặt phẳng hoặc

cuốn quang trống. Việc quét ảnh thông qua tia sáng (ví dụ tia Laser) trên ảnh

đồng thời dịch chuyển mặt phim hoặc quang tr ống tương đối theo tia sáng.

Trường hợp dùng phim, tia sáng đi qua phim.

Bây giờ chúng ta đề cập đến tất cả các khối trong hệ thống:



a) Thiết bị nhận ảnh:



Chức năng của thiết bị này là số hóa một băng tần s ố cơ bản của t ớn hi ệu



truyền hình cung cấp từ một camera, hoặc từ một đầu máy VCR. Ảnh s ố sau đó

được lưu trữ trong bộ đệm chính. Bộ đệm này có khả năng được địa ch ỉ hóa

(nhờ một PC) đến từng điểm bằng phần mềm. Thơng thường thi ết b ị này có

nhiều chương trình con điều khiển để có thể lập trình được thơng qua ngôn ngữ

C. Khi mua một thiết cần chú ý cácc điểm sau:



 Thiết bị có khả năng số hóa ảnh ít nhất 8 bit (256 mức x ỏm) và ảnh thu đ ược



phải có kích thước ít nhất là 512×512 điểm hoặc hơn.

 Thiết bị phải chứa một bộ đệm ảnh để lưu trữ một hoặc nhi ều ảnh có đ ộ phân

giải 512×512 điểm ảnh.

 Thiết bị phải được kèm một bộ đầy đủ thư viện các chương trình con có kh ả

năng giao diện với các chương trình C viết bằng Turbo C hoặc Microsoft C.



 Sổ tay hướng dẫn sử dụng phải được kèm theo, gồm cả dạng chứa trên đĩa và



khi in.

 Một số thiết bị cho phép tuỳ chọn sử dụng cả hai chế đ ộ văn bản và đ ồ ho ạ trên

cùng một màn hình hoặc hai màn hình riêng biệt. Mặc dù chi ti ết này là khơng

cần thiết, nhưng nó sẽ rất có giá trị trong trường hợp bị gi ới hạn v ề không gian

lắp đặt hoặc khả năng tài chính.



SVTH: Hồ Xuân Hiền

Lớp: KT ĐT-TT K37A



Page 15



b) Màn hình video:



Hình 2.2.1.2b: Hình ảnh màn hình video

Một số nhà sản xuất (như Sony) sản xuất các loại màn hình đen tr ắng ch ất

lượng cao. Nên sử dụng loại màn hình chất lượng cao, vì màn hình ch ất l ượng

thấp có thể làm bạn nhầm lẫn kết quả. Một màn hình 9 inch là đủ cho yêu c ầu

làm việc. Để hiển thị ảnh màu, nên dùng một màn hình đa hệ.



c) Máy tính:



Hình 2.2.1.2c: Hình ảnh máy tính

Cần có một máy tính P entium 4 hoặc cấu hình cao hơn. Để chắc chắn, các

máy này phải có sẵn các khe cắm cho phần xử lý ảnh. Các ch ương trình thi ết k ế

và lọc ảnh có thể chạy trên bất kỳ hệ thống nào. Các chương trình con hi ển th ị

ảnh dựng vỉ mạch VGA và có sẵn trên đĩa kèm theo. Các chương trình con hi ển

thị ảnh cũng hỗ trợ cho hầu hết các vỉ mạch SVGA.

Kết quả nhận dạng được lưu dưới dạng chuỗi các ký tự (character string)

được đưa vào chương trình quản lý cơ sở dữ liệu bi ển số xe máy. Tại đây cán b ộ

trông xe sẽ tiến hành các thao tác nghiệp vụ như: in vé xe, thu ti ền, lưu vào c ơ s ở

dữ liệu. Tuỳ

SVTH: Hồ Xuân Hiền

Lớp: KT ĐT-TT K37A



Page 16



thuộc vào kết quả xử lý của chương trình quản lý hệ thống Barrier sẽ được ti ến

hành đóng mở tương ứng.

2.2.2 Hệ tọa độ màu:

2.2.2.1

Khái niệm:

Tổ chức quốc tế về chuẩn hóa màu CIE (Commission Internationale

d’Eclairage) đưa ra một số chuẩn để biểu diễn màu. Các hệ này có các chu ẩn

riêng. Hệ chuẩn màu CIE-RGB dùng 3 màu cơ bản R, G, B và ký hi ệu đ ể phân bi ệt

với các chuẩn khác. Như đã nêu trên, một màu là tổ h ợp của các màu c ơ b ản theo

một tỷ lệ nào đó. Như vậy, mỗi pixel ảnh màu ký hiệu , được viết:

=(T: ký hiệu chuyển vị)

Người ta dùng hệ tọa độ ba màu R-G-B (tương ứng với hệ tọa độ x-y-z) đ ể

biểu diễn màu như sau:

Z



Y



X



Hình 2.22.1: Hệ tọa độ RGB



Trong cách biểu diễn này ta có cơng thức:

đỏ + lục + lơ =1

Cơng thức này gọi là cơng thức Maxwell. Trong hình trên, tam giác t ạo b ởi ba

đường đứt đoạn gọi là tam giác Maxwell. Màu trắng trong h ệ tọa đ ộ này đ ược

tính bởi:



SVTH: Hồ Xuân Hiền

Lớp: KT ĐT-TT K37A



=(++ ) = 1



Page 17



2.2.2.2



Biến đổi hệ tọa độ màu:

Hệ tọa độ màu do CIE đề xuất có tác dụng như một hệ quy chiếu và không

biểu diễn hết các màu. Trên thực tế, phụ thuộc vào các ứng dụng khác nhau



người ta đưa ra các hệ biểu diễn màu khác nhau. Thí dụ:

• Hệ NTSC: dùng 3 màu R, G, B áp dụng cho màn hình màu, ký hi ệu .

• Hệ CMY (Cyan Magenta Yellow): thường dùng cho in ảnh màu .

• Hệ YIQ: cho truyền hình màu.

Việc chuyển đổi giữa các không gian biểu diễn màu được thực hi ện theo

nguyên tắc sau: Nếu gọi X là không gian biểu diễn các màu ban đầu; X’ không

gian biểu diễn màu mới A là ma trận biểu diễn phép biến đổi. Ta có quan hệ sau:

X’ = A.X

2.2.3 Lấy mẫu và lượng tử hóa:

2.2.3.1 Giới thiệu:

Một ảnh g(x, y) ghi được từ Camera là ảnh liên tục tạo nên mặt phẳng hai

chiều. Ảnh cần chuyển sang dạng thích hợp để xử lí bằng máy tính. Phương

pháp biến đổi một ảnh (hay một hàm) liên tục trong không gian cũng như theo

giá trị thành dạng số rời rạc được gọi là số hoá ảnh. Vi ệc biến đổi này có thể

gồm hai bước:

Bước 1: Đo giá trị trên các khoảng không gian gọi là lấy mẫu

Bước 2: Ánh xạ cường độ (hoặc giá trị) đo được thành một số hữu hạn các

mức rời rạc gọi là lượng tử hố.

2.2.3.2



Lấy Mẫu:

Lấy mẫu là một q trình, qua đó ảnh được tạo nên trên một vùng có tính

liên tục được chuyển thành các giá trị rời rạc theo tọa độ nguyên. Quá trình này

gồm 2 lựa chọn:

- Một là: khoảng lấy mẫu.

- Hai là: cách thể hiện dạng mẫu.

Lựa chọn thứ nhất được đảm bảo nhờ lý thuyết lấy mẫu của Shannon. Lựa chọn

thứ hai liên quan đến độ đo (Metric) được dùng trong miền rời rạc.



a) Khoảng lấy mẫu (Sampling Interval):



Ảnh lấy mẫu có thể được mơ tả như việc lựa chọn một tập các vị trí lấy

mẫu trong không gian hai chiều liên tục. Đầu tiên mô tả qua quá trình l ấy mẫu

một chiều với việc sử dụng hàm delta:

SVTH: Hồ Xuân Hiền

Lớp: KT ĐT-TT K37A



Page 18



Tiếp theo chúng ta định nghĩa hàm răng lược với các khoảng Δx như sau:



với r là số nguyên, Δx : khoảng lấy mẫu

Như vậy, hàm răng lược là chuỗi các xung răng lược từ (-∞ đ ến +∞). Gi ả s ử hàm

một chiều g(x) được mô tả (gần đúng) bằng g(r Δx ) tức là:

g(x)≈g(rΔx)

Khi đó tín hiệu lấy mẫu được mơ hình hố:



Trong thực tế, r khơng thể tính được trong khoảng vơ hạn (từ − ∞ đến +∞)

mà là một số lượng NΔx mẫu lớn cụ thể. Như vậy, để đơn giản có thể nói hàm

liên tục g(x) có thể biểu diễn trên một miền với độ dài NΔx mẫu thành chuỗi

như sau:



Điều kiện khôi phục ảnh lấy mẫu về ảnh thật được phát biểu từ định lý lẫy

mẫu của Shannon.

b) Định lý lấy mẫu Shannon:



Giả sử g(x) là một hàm giới hạn giải (Band Limited Function) và bi ến đổi



Fourier của nó là G=0 đối với các giá trị > . Khi đó g(x) có thể được khôi phục lại

từ các mẫu được tạo tại các khoảng Δx đều đặn. Tức là



Δx

Định lý lẫy mẫu của Shannon có thể mở rộng cho khơng gian hai chi ều.

Hàm răng lược hai chiều khi đó được xác định:



Hàm lấy mẫu hai chiều thu được:

SVTH: Hồ Xuân Hiền

Lớp: KT ĐT-TT K37A



Page 19



Và Δx, Δy được chọn thoả mãn các điều kiện tương ứng theo định lý lấy mẫu của

Shannon khi đó sẽ:



Δx ; Δy



c) Các dạng lấy mẫu (Tesselation):



Dạng lẫy mẫu (Tesselation) điểm ảnh là cách bài trí các đi ểm m ẫu trong

không gian hai chiều. Một số dạng mẫu điểm ảnh được cho là dạng chữ nhật,

tam giác, lục giác. Mỗi một mẫu, ngoài việc thể hiện hình dáng còn cho biết đặc

điểm liên thơng của chúng. Ví dụ, mẫu chữ nhật có liên thơng 4 hoặc 8 (nói về

các mẫu liền kề); mẫu lục giác có liên thơng 6; mẫu tam giác có liên thơng 3 hoặc

6.



a) Mẫu điểm ảnh chữ nhật



b) Mẫu điểm ảnh tam giác



c) Mẫu



điểm ảnh luc giác

Hình 2.2.3.2c: Các dạng mẫu điểm ảnh

Trong trường hợp này ta chỉ xét các mẫu điểm ảnh hình chữ nhật, đặc bi ệt

là dạng hình vng. Nhiều trường hợp ứng dụng có dùng đến các các mẫu tam

giác hoặc lục giác.

2.2.3.3



Lượng tử hóa:

Lượng tử hố là một q trình lượng hố tín hiệu thật dùng chung cho các

loại xử lý tín hiệu trên cơ sở máy tính. Vấn đề này đã được nghiên cứu kỹ l ưỡng

và có nhiều lời giải lý thuyết dưới nhiều giả định của các nhà nghiên cứu như

Panter và Dite (1951), Max (1960), Panter (1965).

Các giá trị lấy mẫu Z là một tập các số thực từ giá trị Zmin đến lớn nhất

Zmax. Mỗi một số trong các giá trị mẫu Z cần phải biến đổi thành một tập hữu

hạn số bit để máy tính lưu trữ hoặc xử lý.

SVTH: Hồ Xuân Hiền

Lớp: KT ĐT-TT K37A



Page 20



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

CHƯƠNG II: TỔNG QUAN VỀ HỆ THỐNG XỬ LÝ ẢNH

Tải bản đầy đủ ngay(0 tr)

×