Tải bản đầy đủ - 0 (trang)
Chương 2 CƠ SỞ LÝ THUYẾT

Chương 2 CƠ SỞ LÝ THUYẾT

Tải bản đầy đủ - 0trang

Những ứng dụng của lý giải ảnh bao gồm thị giác máy tính, rơbốt và nhận

dạng mục tiêu. Lý giải ảnh khác với các lĩnh vực khác của xử lý ảnh ở một khía

cạnh chính. Trong cải tiến, phục hồi và số hóa, mã hóa ảnh cả đầu vào và đầu ra đều

là ảnh, và khâu xử lý tín hiệu là phần then chốt trong các hệ thống đã thành cơng

trên lĩnh vực đó. Trong lý giải ảnh, đầu vào là ảnh nhưng đầu ra là một biểu diễn

bằng một ký hiệu nội dung của ảnh đầu vào. Sự phát triển thành công của hệ thống

trong lĩnh vực này cần đến cả xử lý tín hiệu và những khái niệm trí tuệ nhân tạo.

Trong hệ lý giải ảnh điển hình, xử lý ảnh được dùng cho công việc ở mức thấp như

làm giảm sự xuống cấp và trích ra những đường biên (extraction of edges) hoặc các

đặc tính ảnh khác, còn trí tuệ nhân tạo được dùng cho những cơng việc xử lý ở mức

cao như thao tác ký hiệu và quản lý tri thức [14].

Phân đoạn và mô tả ảnh là lý thuyết quan trọng trong việc thực hiện đề tài

‘Ứng dụng xử lý ảnh để nhận dạng làn đường cho ô tô chạy tự động’

2.1.2. Biểu diễn một ảnh số.

2.1.2.1. Ảnh là gì ?

Một bức ảnh là hình ảnh tượng trưng (hình ảnh ảo) của một đối tượng, người

hoặc phong cảnh được tạo bởi một thiết bị quang học như một tấm gương, một ống

kính hoặc một máy ảnh. Hình ảnh tượng trưng đó là hai chiều (2D) phản ánh thế

giới thực ba chiều (3D) của đối tượng hay cảnh vật.



Hình 2.1: Ảnh tương tự và ảnh số hóa [15]



10



2.1.2.2. Ảnh số là gì ?

Một ảnh kỹ thuật số (Ảnh số) là một biểu diễn hai chiều của một hình ảnh sử

dụng một số hữu hạn các điểm điểm ảnh, hay còn gọi là phần tử ảnh, pels hoặc

pixels.

Thông thường, ảnh số được biểu diễn bởi ma trận hai chiều (2D) của các số

thực. Các phần tử của nó là biểu diễn cho các pixel số hóa. Ta qui ước một ảnh số

hóa là f(x,y) cho một ảnh đơn sắc có kích thước MxN, trong đó x là số hàng (từ 0

đến M-1) và y là số cột (từ 0 đến N-1).

(2.1)



Hình 2.2: Điểm qui chiếu khơng gian của điểm ảnh (0,0).

Giá trị của hàm f(x,y) tại tọa độ (xo,yo) là f(xo,yo) được gọi là cường độ hay

mức xám của ảnh tại điểm ảnh đó. Giá trị cực đại và cực tiểu của mỗi điểm ảnh phụ

thuộc vào kiểu dữ liệu và qui ước được sử dụng. Phạm vi thông thường từ 0.0 (đen)

đến 1.0 (trắng) cho kiểu double và 0 (đen) đến 255 (trắng) cho kiểu dữ liệu

uint8.



11



Một ảnh số có 3 thuộc tính cơ bản: Độ phân giải của ảnh, độ nét và số lượng

lớp. Trong đó, số lớp trong ảnh tương ứng với số mảng điểm ảnh chứa trong ảnh.

Một ảnh đen trắng có một lớp.

Trong Matlab, và các công cụ xử lý ảnh của nó định nghĩa các điểm ảnh bắt

đầu từ chỉ số 1. Ta qui ước f(p,q) để chỉ ảnh f(x,y) trong Matlab, biểu diễn ảnh trên

trở thành:

2.1.2.3. Ảnh nhị phân (1-Bit).

Ảnh nhị phân được mã hóa như một mảng hai chiều (2D), thường sử dụng

1bit trên mỗi pixel, trong đó 0 là đen và 1 là trắng.



Hình 2.3: Ảnh nhị phân [16]

2.1.2.4. Ảnh xám .

Ảnh xám cũng được mã hóa như một mảng 2D của các điểm ảnh. Thường sử

dụng 8 bít cho mỗi pixel, trong đó điểm ảnh có giá trị 0 thể hiện màu đen và 255 thể

hiện màu trắng và các giá trị trung gian hiển thị các sắc thái khác nhau của màu

xám.



12



Hình 2.4: Ảnh xám hóa [16]

Trong Matlab, ảnh cường độ (ảnh xám) có thể được sử dụng dựa trên nhiều

kiểu dữ liệu khác nhau. Ví dụ, ảnh đơn sắc thuộc kiểu dữ liệu uint8 và uint16 thì giá

trị mỗi điểm ảnh nằm trong đoạn [0,255] và [0, 65535], ảnh đơn sắc thuộc kiểu

double thì giá trị mỗi pixel nằm trong đoạn [0.0,1.0].

2.1.2.5. Ảnh màu.

Một ảnh màu thật có 3 lớp – mỗi lớp thay cho thành phần màu đỏ là Red,

màu xanh lục là Green, và màu xanh lơ là Blue.

Trong ảnh màu thật, cường độ thành phần màu của điểm ảnh được mã hóa

trong ba giá trị khác nhau. Một ảnh màu là sự kết hợp của ba mảng điểm ảnh tương

ứng với các thành phần màu Red, Green, Blue trong anh RGB. Ảnh HSL được định

rỏ bởi các giá trị màu sắc là Hue, sự bảo hòa là Saturation và cường độ sáng là

Luminance.

Trong Matlab, ảnh màu RGB tương ứng với một mảng 3 chiều (3D) MxNx3,

trong đó M và N là số hàng và số cột, còn 3 thể hiện 2 lớp màu.



13



Hình 2.5: Ảnh màu RGB trong Matlab. [16]

Mỗi pixel bao gồm 3 giá trị màu R,G,B như Hình 2.5. Ảnh RGB thuộc lớp dữ

liệu double, thang giá trị nằm trong khoảng [0.0,1.0]. Trong khi đó, lớp dữ liệu

unit8 và uint16 có thang giá trị là [0,255] và [0,65535]. Mỗi pixel của ảnh RGB có

giá trị là 24 bit (8 bit cho mỗi lớp).

2.1.2.6. Các thuật ngữ và mối quan hệ giữa các điểm ảnh.

Ảnh Tô pô (Image Topology): Liên quan đến việc điều tra các thuộc tính cơ

bản của ảnh, thường thực hiện trên ảnh nhị phân với sự trợ giúp của các tốn tử hình

thái. Chẳng hạn như số lần xuất hiện của một đối tượng cụ thể, số lổ hỏng của một

đối tượng…

Hàng xóm (Neighborhood) : Gồm các điểm ảnh xung quanh một điểm ảnh

khảo sát tạo thành vùng lân cận, có thể xem như là một ma trận nhỏ hơn chứa điểm

ảnh cần xem xét. Hầu hết các miền lân cận được sử dụng trong thuật toán xử lý ảnh

là ma trận vuông nhỏ với một số lẽ điểm ảnh, ví dụ 3x3



14



Hình 2.6: Điểm ảnh ở trong một miền lân cận. [16]

Cho điểm ảnh p (x,y) : 4 tọa độ hàng xóm với cột và hàng có tọa độ lần lượt

là (x+1, y), (x-1, y), (x, y+1), (x, y-1) ký hiệu là tập N4(p) (Hình 2.7a). 4 điểm ảnh

hàng xóm theo đường chéo có tọa độ lần lượt là (x+1, y+1), (x+1, y-1), (x-1, y+1),

(x-1, y-1) ký hiệu là tập ND(p) (Hình 2.7b). Tập 8 điểm ảnh hàng xóm là hợp của 2

tập trên: N8(p) = N4(p) + ND(p) (Hình 2.7c).



Hình 2.7: Lấy mẫu hình chữ nhật liên thông. [16]

Lân cận (Adjacency) : Khi các điểm ảnh hàng xóm có xét thêm một vài yếu

tố khác ví dụ như phù hợp với cường độ điểm. Để có căn cứ kiểm tra quan hệ mới

này người ta định ra một tập giá trị tham chiếu mà các điểm ảnh gọi là lân cận phải

có giá trị cùng thuộc về tập đó. Ví dụ với một ảnh nhị phân ta có thể đặt V={1}, có

nghĩa là ta xét các điểm lân cận với giá trị tham chiếu là 1 (cường độ điểm ảnh đã

gọi là lân cận với nhau thì phải cùng có giá trị 1). Trong ảnh đa mức xám, ta có thể

đặt V chứa nhiều giá trị hơn như V={ a >= 200 & a <= 255 }. Cho p có tọa độ (x, y)

-



Lân cận 4 (4 - adjacency): hai điểm ảnh p và q có giá trị thuộc về tập V được



-



gọi là lân cận 4 của nhau nếu q thuộc về tập N4(p) (đã trình bày ở trên).

Lân cận 8 (8 - adjacency): hai điểm ảnh p và q có giá trị thuộc về tập V được

gọi là lân cận 8 của nhau nếu q thuộc về tập N8(p) (đã trình bày ở trên)



15



-



Lân cận M (M - adjacency hay Mixed - Adjacency): hai điểm ảnh p và q có

giá trị thuộc về tập V được gọi là lân cận M của nhau nếu thõa 1 trong 2 điều

kiện sau:

o q thuộc về tập N4(p).

o q thuộc về tập ND(p) và giao của hai tập N4(p), N4(q) khơng chứa điểm

ảnh nào có giá trị thuộc V.

Sự khác biệt giữa lân cận M và lân cận 8 là lân cận M chính là lân cận 8 sau



khi đã loại bỏ những liên kết phát sinh vòng.

Đường (Paths) : một đường nối 2 điểm p(x0, y0) với điểm q(xn, yn) là một tập

tuần tự các điểm ảnh có tọa độ lần lượt là (x0, y0), (x1, y1), (x2, y2),..., (xn, yn) trong

đó hai điểm liền kề (xi, yi), (xi-1, yi-1) với (1 ≤ i ≤ n) có quan hệ lân cận, tùy theo

loại quan hệ lân cận được xem xét mà ta có các loại đường 4 (4 Path), đường 8 (8

Path) hay đường M (M Path).

-



n được gọi là độ dài của đường.

Nếu hai điểm đầu và cuối của đường trùng nhau, (x 0, y0) = (xn, yn) thì ta gọi

đó là đường khép kín (Closed Path).

Kết nối (Connectivity) : Gọi S là một nhóm, tập các điểm ảnh nào đó trong



một hình (S có thể là tồn bộ ảnh).

-



Hai điểm ảnh p và q được gọi là kết nối với nhau qua S nếu tồn tại đường



-



giữa chúng được thiết lập bởi các điểm ảnh thuộc S.

p nằm trong S, tập các điểm ảnh kết nối với p và thuộc S được gọi là thành



-



phần được kết nối (connected component).

Nếu S chỉ có 1 thành phần kết nối, có nghĩa là mỗi điểm ảnh thuộc S thì kết

nối với tất cả các điểm ảnh còn lại. ta gọi S là tập kết nối (Connected Set).

Vùng (Region of Image): Gọi R là một tập điểm ảnh nào đó trong hình, R



được gọi là vùng ảnh nếu nó là một tập kết nối thỏa định nghĩa ở trên.

-



Hai vùng Ri và Rj được coi là lân cận (Adjacency) nếu hợp của chúng là một



-



tập kết nối.

Các vùng khơng lân cận (not adjacent) thì gọi là disjoint.

Cũng tương tự như với điểm ảnh việc xét vùng lân cận cũng cần sự chỉ định

kiểu 4, 8 hay M.



16



Đường bao (boundary):

-



Là tập các điểm có quan hệ liên kết với điểm nằm trong tập bù của vùng R.

Sự khác biệt giữa đường bao và cạnh (edge) nằm ở chổ, trong khi đường bao

là đường khép kín (closed path) bao quanh vùng (region) với một ý nghĩa

tồn cục thì viền hay cạnh lại được xem xét là tập hợp những điểm ảnh mà

tại đó xảy ra sự biến động về giá trị cường độ, mang tính cục bộ.



2.1.2.7. Khoảng cách giữa các điểm ảnh :

Có nhiều ứng dụng yêu cầu đo khoảng cách giữa các điểm ảnh. Các phương

pháp đo khoảng cách phổ biến nhất giữa pixel p và q có tọa độ (x o,yo) và (x1,y1) như

sau:

 Khoảng cách Euclide:

 Khoảng cách D4 (còn gọi là Manhattan):

 Khoảng cách D8 (còn được gọi là bàn cờ):

Chú ý rằng, khoảng cách giữa các pixel chỉ phụ thuộc vào tọa độ mà khơng

phụ thuộc vào giá trí của chúng. [14]

2.1.2.8. Hệ thống xử lý ảnh số

Sơ đồ tổng quát của một hệ thống xử lý ảnh:



Hình 2.8: Các bước cơ bản trong một hệ thống xử lý ảnh [15]

Thu nhận ảnh:

-



Qua các camera (Tương tự, số).



17



-



Từ vệ tinh qua các bộ cảm biến (Sensors).

Qua máy quét ảnh (Scaners).

Số hóa ảnh: Biến đổi ảnh tương tự thành ảnh rời rác để xử lý bằng máy tính:



Thơng qua q trình lấy mẫu (rời rạc về mặt khơng gian) và lượng tử hóa (rời rạc về

mặt biên độ).

Xử lý số: Là một tiến trình gồm nhiều cơng đoạn nhỏ: Cải thiện ảnh

(Enhancement), khơi phục ảnh (Restoration), phát hiện biên (Egde Detection), phân

vùng ảnh (Segmentation), trích chọn các đặc tính (Feature Extraction)…

Hệ quyết định: Tùy mục đích của ứng dụng mà chuyển sang giai đoạn khác

là hiển thị, nhận dạng, phân lớp, truyền thông…

2.1.3. Các vấn đề cơ bản trong xử lý ảnh.

2.1.3.1. Biểu diễn ảnh và mơ hình hóa ảnh.

Biểu diễn ảnh: Ảnh có thể xem là một hàm 2 biến chứa các thơng tin như

biểu diễn của một ảnh. Các mơ hình biểu diễn ảnh cho ta một mô tả logic hay định

lượng của hàm này. Dựa vào phần tử đặc trưng của ảnh đó là pixel. Giá trị pixel có

thể là một giá trị vô hướng, hoặc là 1 vector (3 thành phần trong trường hợp ảnh

màu).

Ta có thể biểu diễn ảnh bằng hàm toán học, hoặc các ma trận điểm. Trong

mơ hình tốn học ảnh hai chiều được biểu diễn nhờ các hàm hai biến S(m,n).



Biểu diễn bằng hàm toán:

-



S: ảnh

(m,n): tọa độ pixel trong miền không gian 2D.

s(m,n): độ sáng (mức xám) của pixel (m,n).

[0,Lmax]: thang mức xám – vùng các mức xám được phép sử dụng. L max

thường là 255, nghĩa là sử dụng mức xám 8 bít. 0 ≤ s(m,n) ≤ 255.

Với 0 ≤ m ≤ M-1, 0 ≤ n ≤ N-1, ta gọi ảnh số MxN.

Biểu diễn bằng ma trận điểm:



18



Hình 2.9: Biểu diễn ảnh bằng ma trận điểm

a, ảnh thật; b, ảnh được Zoom; c, Mơ tả ảnh bằng ma trận điểm [16]

Mơ hình hóa ảnh:

-



Mơ hình cảm nhận ảnh: Là mơ hình biểu diễn thơng qua các thuộc tính cảm

nhận ảnh (màu sắc, cường độ sáng), các thuộc tính về thời gian, các cảm



-



nhận về phối cảnh, bố cục.

Mơ hình bố cục: Là mơ hình biểu diễn thể hiện mối tương quan cục bộ của

các phần tử ảnh (ứng dụng cho các bài toán xử lý và nâng cao chất lượng



-



ảnh).

Mơ hình tổng thể: Là mơ hình biểu diễn ảnh xem ảnh như là một tập hợp các

đối tượng, và các đối tượng này có mối quan hệ khơng gian với nhau (ứng

dụng cho các bài tốn phân nhóm và nhận dạng ảnh).



2.1.3.2. Cải tiến ảnh.

Tăng cường các thuộc tính cảm nhận, làm cho ảnh tốt lên theo một ý nghĩa

nào đó, tiện phục vụ cho các xử lý tiếp theo. Với các thao tác: thay đổi độ tương

phản, thay đổi màu sắc, cường độ sáng, lọc nhiễu, nội suy, làm trơn ảnh. Thực hiện

bằng các phương pháp: Thao tác trên điểm (Point Operation), thao tác không gian

(Spatial Operation)…

2.1.3.3. Khôi phục ảnh.

Khôi phục lại ảnh ban đầu, loại bỏ các biến dạng ra khỏi ảnh tùy theo nguyên

nhân gây ra biến dạng. Với các thao tác: lọc nhiễu, giảm độ méo… Thực hiện bằng

các phương pháp: Lọc ngược, lọc thích nghi (Wiener), khơi phục ảnh từ các hình

chiếu.



19



2.1.3.4. Biến đởi ảnh.

Là biến đổi thể hiện của ảnh dưới các góc nhìn khác nhau tiện cho việc xử lý,

phân tích ảnh bằng các phương pháp: Biến đổi Fourier, Sin, Cosin, KL,…

2.1.3.5. Phân tích ảnh.

Nhằm mục đích tìm ra các đặc trưng của ảnh, xây dựng quan hệt giữa chúng

dựa vào các đặc trưng cục bộ. Thực hiện bằng các thao tác: tìm biên, tách biên, làm

mảnh đường biên, phân vùng ảnh, phân loại đối tượng. Sử dụng các phương pháp:

phát hiện biên cục bộ, dò biên theo qui hoạch động, phân vùng theo miền đồng

nhất, phân vùng dựa theo đường biên…

2.1.3.6. Nén ảnh.

Với mục đích giảm không gian lưu trữ, thuận tiện truyền thông trên mạng.

Thường được tiến hành theo cả hai cách khuynh hướng là nén có bảo tồn và khơng

bảo tồn thơng tin. Nén khơng bảo tồn thì thường có khả năng nén cao hơn nhưng

khả năng phục hồi thì kém hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ

bản trong nén ảnh:

-



Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện

của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp.



-



Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF

Nén ảnh khơng gian: Kỹ thuật này dựa vào vị trí khơng gian của các điểm

ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh



-



trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX

Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén

không bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn. *.JPG chính là

tiếp cận theo kỹ thuật nén này.



Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự lặp lại

của các chi tiết. Kỹ thuật nén sẽ tính tốn để chỉ cần lưu trữ phần gốc ảnh và quy

luật sinh ra ảnh theo nguyên lý Fractal

2.1.3.7. Nhận dạng.

Nhận dạng tự động (automatic recognition), mơ tả đối tượng, phân loại và

phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng



20



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Chương 2 CƠ SỞ LÝ THUYẾT

Tải bản đầy đủ ngay(0 tr)

×