Tải bản đầy đủ
Ước lượng tần số đường vân

Ước lượng tần số đường vân

Tải bản đầy đủ

42

1 W -1
X [ k ] = ∑ G (u, v), k = 0,1,..., L − 1,
W d =0
u = i + (d −

(2.37)

W
L
)CosO (i, j ) + ( k − ) SinO (i, j ),
2
2

(2.38)
v = j + (d −

W
L
) SinO(i, j ) + ( − k )CosO (i, j )
2
2

(2.39)

• Bước 4:
- Nếu không có điểm đặc trưng hay các điểm đơn trong cửa sổ hướng,
các giá trị X sẽ biến đổi theo quy luật hình Sin và các đường vân và rãnh
trong cửa sổ hướng có cùng tần số, cho nên có thể ước lượng tần số dựa trên
các giá trị X này. Gọi T(i,j) số pixel trung bình giữa hai đỉnh đường vân liên
tiếp, thì tần số đường vân:
F(i,j) =1/T(i,j)

(2.40)

- Nếu cửa sổ hướng có chứa các điểm đặc trưng vân tay thì tần số cục bộ
sẽ không phải là dạng song song hình Sin, lúc này tần số ước lượng sẽ lấy tần
số ước lượng của cửa sổ hướng lân cận

Hình 2.7. Cửa sổ hướng và biểu diễn tần số đường vân cục bộ

43

(2.8a). Ảnh sau khi tách hướng (2.8b). Ảnh sau khi nắn sửa hướng
Hình 2.8. Kết quả của quá trình tách hướng đường vân cục bộ
Với thuật toán này ta có thể tách được trường hướng một cách rất tốt và
mịn. Hình (2.8b) là kết quả nắn sửa của ảnh định hướng sau khi qua biến đổi
của thuật toán này.
2.6. Lọc ảnh bằng kỹ thuật Gabor.
Ảnh vân tay với cấu trúc song song đặc trưng giữa các lằn và thung
lũng vân cộng với việc có thể xác định được hướng và tần số của chúng đã
cung cấp các thông tin rất hữu ích để có thể loại trừ nhiễu trên ảnh. Nếu xét
trên một vùng cục bộ thì ta có thể thấy rằng sự biến đổi dạng sóng hình sin
giữa các lằn và thung lũng vân là khá đều. Điều này đã gợi ý cho chúng ta nếu
sử dụng một bộ lọc băng tần số khớp với hướng cục bộ và tần số cục bộ của
vùng đang xét thì có thể sẽ giảm thiểu các loại nhiễu không mong đợi, đồng
thời cũng có thể bảo vệ tốt cấu trúc thật sự của vân tay. Thật vậy, ta có thể
hình dung thế này, nếu như ảnh vào có chất lượng tốt, nghĩa là không có
nhiễu. Vậy thì xét trong 1 vùng cục bộ, dọc theo hướng vuông góc với lằn vân
thì sự biến đổi cấp xám từ lằn vân -> thung lũng -> lằn vân sẽ là một dạng
hình sin khá đều (xét trong vùng cục bộ thì sẽ không có sự sai khác lắm về
hướng và tần số, bởi nếu ảnh là tốt thì các lằn vân gần như song song nhau và
độ rộng vân gần như là bằng nhau), ta có thể xem minh hoạ ở hình 2.8a. Thế
nhưng, nếu có bất kỳ 1 loại nhiễu nào xuất hiện trong vùng đang xét (kể cả
nhiễu xung hay nhiễu hình học) thì chắc chắn là sóng hình sin sẽ không đều

44

nữa bởi sự sai khác về tần số (xem hình 2.8b). Do đó, nếu như ta áp vào vùng
đang xét đó một biến đổi dạng sin cho trước, với tần số tương ứng của vùng
cũng như hướng là hướng lằn vân trong vùng đó thì ta có thể cắt bỏ một cách
hiệu quả các nhiễu nói trên. Hay nói cách khác, nếu ta có một bộ lọc tần số
thích hợp, thì sẽ khử được các loại nhiễu không mong đợi, đồng thời có thể
làm đều hơn cấu trúc lằn-thung lũng trên ảnh.
Bộ lọc Gabor đã tỏ ra thích hợp với sự kết hợp trong đó cả hai thuộc
tính tần số và hướng, đồng thời khi sử dụng, bộ lọc Gabor cũng có thể điều
chỉnh một cách tối ưu cho cả hai miền không gian và miền tần số.

Hình 2.9a. Một vùng vân tay tốt.
Tần số cục bộ f = 1/T. Dạng hình sin chạy đều.

Hình 2.9b. Một vùng vân tay có nhiễu.
Ta thấy tần số ở các vùng có nhiễu biến đổi rất khác, dạng hình sin
không đều.

45

Một bộ lọc Gabor có công thức toán học cho dưới đây: (tham khảo [5])
h(x,y: φ ,f)

=


 1  ( x cos φ ) 2 ( y sin φ ) 2  

+
  cos(2 π fxcos φ )
exp − 2  δ 2
2
δy


 
x



trong đó, φ là hướng của bộ lọc, f là tần số của hàm sin,

δx

(2.41)

và δ y là các hằng

số không gian của bao Gauss tương ứng theo chiều x và y.
Để áp dụng bộ lọc Gabor vào trong một bức ảnh, ta phải xác định 3
tham số sau đây:
Tần số của dạng sóng hình sin f
Hướng của bộ lọc
Độ lệch chuẩn của bao Gauss
Ba tham số trên là hoàn toàn có thể xác định được:
Uước lượng tần số f: Tham số thứ nhất là tần số f, nếu để xác định f
một cách chính xác nhất thì ta sẽ phải phát triển thêm một thuật toán xác định
tần số cục bộ trong một vùng. Khi xét tới vùng nào thì bộ lọc sẽ sử dụng tần
số riêng của vùng ấy. Tuy nhiên, đây là một thuật toán khó đòi hỏi cài đặt
phức tạp nên chúng tôi đã không đưa vào luận văn. Thay vào đó, chúng tôi sử
dụng tần số vùng xấp xỉ được khuyến sử dụng trên thế giới hiện nay là f =
1/7. Có nhiều lý thuyết đã ra đời nhằm chứng minh rằng, với một vân tay
chuẩn thì tần số sẽ xấp xỉ = 1/7, nói đúng hơn là f sẽ nằm trong khoảng
[1/3,1/25] (tham khảo [13,17]). Trong thời gian làm luận văn, với những dữ
liệu ảnh mà chúng tôi tìm được, chúng tôi cũng đã để ý, so sánh và đếm để
cuối cùng đưa ra kết luận rằng, có thể chọn tần số f = 1/7 là hoàn toàn có thể
được. (Thực chất tần số chính là = 1/chu kỳ. Chu kỳ này chính là một biến đổi
sóng từ lằn vân -> thung lũng -> lằn vân.
Hướng của bộ lọc: Tham số thứ 2 là hướng của bộ lọc thì sẽ được xác
định thông qua ảnh định hướng θ đã được tính toán trong mục (2.2, 2.4).

46

Độ lệch chuẩn của bao Gauss: Tham số thứ 3 là các giá trị

δx

và δ y .

Các giá trị này được chọn một cách phù hợp và phụ thuộc vào tần số đường vân.

δ x = k x F (i, j )

(2.42)

δ y = k y F (i, j )

(2.43)

Các giá trị k x , k y phụ thuộc vào mỗi loại ảnh vân tay. Bằng thực nghiệm quan
sát trên ảnh vân tay. Chúng tôi chọn giá trị

δx =

δ y = 3.0

Cuối cùng, quá trình lọc Gabor được thực hiện theo bước sau:
Bước 1: Chuẩn hoá ảnh đầu vào I, đầu ra là ảnh G, đã làm ở mục (2.2)
Bước 2: Phân vùng ảnh G thành các khối cỡ w*w. Sau đó tính ảnh định
hướng θ trên các khối vừa chia. đã làm ở mục (2.2, 2.4)
Bước 3: Đặt tần số f = 1/7.
Bước 4: Tại mỗi điểm (i,j) trên ảnh, ta tính giá trị hướng của nó áp
dụng công thức:

α(i,j)

= θ [i/w, j/w]

(2.44)

Bước 5: Gọi ảnh đầu ra sau khi qua lọc Gabor là E.
Lặp i,j quét qua toàn bộ ảnh G. Tại mỗi G(i,j) thì:
wg / 2

E(i,j) =

wg / 2

∑ ∑ h(u, v : α (i, j), f )G(i + u, j + v)

u = − wg / 2 v = − wg / 2

(2.45)

với wg là kích thước của bộ lọc được chọn = 16.
2.7. Kỹ thuật tách ngưỡng tự động
Ngưỡng θ trong kỹ thuật tách ngưỡng thường được cho bởi người sử
dụng. Kỹ thuật tách ngưỡng tự động nhằm tìm ra ngưỡng θ một cách tự động
dựa vào histogram theo nguyên lý trong vật lý là vật thể tách làm 2 phần nếu
tổng độ lệnh trong từng phần là tối thiểu(tham khảo [3- Tr18]).
Giả sử, ta có ảnh I ~ kích thước m × n
L ~ là số mức xám của ảnh kể cả khuyết thiếu

47

t(g) ~ số điểm ảnh có mức xám ≤ g
1 g
∑i.h(i ) ~ giá trị trung bình các giá trị mức xám ≤ g (2.46)
m(g) =
t ( g ) i =0

Hàm f:
f(g) =

g

 f(g)

t(g)
[m(g)-m(G-1)]2
m x n − t(g)

(2.47)

Tìm θ sao cho:

{ f ( g )}
F(θ) = 0 max
≤ g 〈 L −1

(2.48)

Ví dụ: Tìm ngưỡng tự động của ảnh sau:

0

0
I = 0

0
0


1 2 3 4 5

0 1 2 3 4
0 0 1 2 3

0 0 0 1 2
0 0 0 0 1 

Ta lập bảng tính ngưỡng tự động
g

G

h(g)

t(g)

g.h(g)

0
1
2
3
4
5

15
5
4
3
2
1

15
20
24
27
29
30

0
5
8
9
8
5

Ngưỡng cần tách θ =1 ứng với f(θ) = 1.66

∑i.h(i)

m(g)

f(g)

0
5
13
22
30
35

0
0.25
0.54
0.81
1.03
1.16

1.35
1.66
1.54
1.10
0.49


i =0

48

Hình 2.10. Kết quả của việc nhị phân hóa của ảnh đã được tăng

cường.
2.8. Làm mảnh đường vân
Thuật toán làm mảnh ảnh số nhị phân là một trong các thuật toán quan
trọng trong xử lý ảnh và nhận dạng. Xương chứa những thông tin bất biến về
cấu trúc của ảnh, giúp cho quá trình nhận dạng hoặc vectơ hoá sau này.
Thuật toán làm mảnh là quá trình lặp duyệt và kiểm tra tất cả các điểm
thuộc đối tượng. Trong mỗi lần lặp tất cả các điểm của đối tượng sẽ được
kiểm tra: nếu như chúng thoả mãn điều kiện xoá nào đó tuỳ thuộc vào mỗi
thuật toán thì nó sẽ bị xoá đi. Quá trình cứ lặp lại cho đến khi không còn điểm
biên nào được xoá. Đối tượng được bóc dần lớp biên cho đến khi nào bị thu
mảnh lại chỉ còn các điểm biên.
Một trong những phương pháp làm mỏng vân tay là phương pháp của
các tác giả A.Rosenfeld và A. Kak (1982). Trong phương pháp này, nhóm tác
giả Rosenfeld và Kak đưa định nghĩa 8-simple để chỉ tính chất của 1 điểm
ảnh P có thể bị xoá mà không làm mất tính liên thông các điểm ảnh trong lân
cận 8 với P, nói cách khác, các điểm ảnh trong lân cận 8 với P vẫn liên thông
với nhau mà không cần có P.

49

Chất lượng của thuật toán làm mảnh được đánh giá theo các tiêu chuẩn
được liệt kê dưới đây nhưng không nhất thiết phải thoả mãn đồng thời tất cả
các tiêu chuẩn(tham khảo[3- Tr45-46]):
• Bảo toàn tính liên thông
• Không tạo ra lỗ hổng
• Bảo toàn các điểm cụt
• Xương chỉ gồm các điểm biên, càng mảnh càng tốt
• Bền vững đối với nhiễu
• Xương cho phép khôi phục ảnh ban đầu của đối tượng
• Xương thu được ở chính giữa đường nét của đối tượng được làm mảnh
• Xương nhận được bất biến với phép quay.
Với các điều kiện trên, ta có thể xoá các điểm P như sau:
A: Các điểm có giá trị bằng P
B: Các điểm có giá trị khác P
*: Các điểm tuỳ ý
AAA*P*BB
B

A*BAPBA*
B

AA*APB*B
B

BBB*P*AA
A

B*ABPAB*
A

BB*BPA*A
A

*AABPABB
*

*BBAPBAA
*

50

Thuật toán trình được trình bày tóm tắt như sau:
Bước 1: Đánh dấu các điểm ảnh 8-simple nằm ở biên và pixel này
không phải là pixel kết thúc (điểm ảnh kết thúc có một pixel duy nhất trong
lân cận 8).
Bước 2: Xoá các điểm ảnh đã đánh dấu.
Bước 3: Lặp lại bước 1 cho đến khi không có pixel bị đánh dấu.
Bước 4: Xóa các chi tiết thừa của xương.

Hình 2.11. Kết quả của việc làm mảnh ảnh của ảnh đã được nhị phân
2.9. Trích chọn đặc trưng
Thông thường việc rút trích đặc trưng minutiae là dựa vào ảnh nhị phân.
Phương pháp dựa vào Crossing Number (CN) được sử dụng phổ biến
nhất. Phương pháp này do hai tác giả Arcelli và Baja giới thiệu vào năm
1984. Phương pháp này tính toán dựa trên sự chuyển tiếp giá trị nhị phân
của các điểm ảnh trong lân cận 8. Công thức tính giá trị CN như sau:
CN ( P) =

1 8
∑ Pi − Pi+1
2 i =1

(2.49)



Nếu CN(P) = 3 : pixel

P

là điểm rẽ nhánh (bifurcation)



Nếu CN(P) = 1 : pixel

P

là điểm kết thúc (ending)

• Nếu CN(P) = 2 hay CN(P) > 3 : pixel

P

không phải là điểm minutiae.

51

P8

P1

P2

1

0

0

1

0

0

1

0

0

P8

P

P2

0

1

0

0

1

0

0

1

0

P6

P5

P4

0

0

1

0

0

0

1

0

1

a)
Pi, i=1,…,8

b)

c)

CN(P)=2

CN(P)=1

d)
CN(P)=3

Thuật toán này cho phép phát hiện ra tất cả các điểm có thể là minutiae
trên ảnh vân tay. Nhưng trong các minutiae này, có thể tồn tại rất nhiều
minutiae giả (xem Hình 2-12a). Do vậy, bước xử lý lọc minutiae giả cần
áp dụng để việc xử lý nhận dạng ở bước sau được chính xác hơn.
Bởi vì ảnh vân tay có nhiễu, nên thuật toán rút trích minutiae sẽ tạo
ra nhiều minutiae giả chẳng hạn như minutiae nằm tại điểm gãy, cầu nối,
tam giác, khuyên, đảo, .. Do vậy, giai đoạn lại bỏ minutiae giả cần phải
thực hiện để việc nhận dạng được chính xác hơn.
Bước đầu tiên là loại bỏ minutiae nằm tại các điểm gãy đứt (break)
trong đoạn ngắn. Nếu điểm kết thúc nằm tại điểm gãy thỏa một trong các
điều kiện sau thì bị loại bỏ.
Khoảng cách giữa hai điểm kết thúc là nhỏ hơn một ngưỡng

(a)
Hình 2.12: (a) Ảnh vân tay trước
khi loại bỏ minutiae giả.

T1

(b)
(b) Ảnh minutiae sau khi loại bỏ
minutiae giả

52

Như vậy, mục này đã trình bày tất cả các bước xử lý cần thiết để rút
trích ra tập minutiae phục vụ cho giai đoạn so khớp ảnh vân tay. Ảnh vân
tay của mỗi giai đoạn xử lý được biểu diễn tóm tắt bởi Hình 2-13

Hình 2.13. Ảnh minh họa các giai đoạn xử lý ảnh vân tay
2.10. Kết quả chương trình
Mục đích của một thuật toán nâng cấp vân tay là nhằm cải thiện hơn độ
trong sáng giữa lằn vân và thung lũng trong ảnh vân tay đầu vào, hay nói cách
khác là làm tách biệt rõ ràng giữa các lằn vân. Thuật ngữ “tách biệt” ở đây
bao hàm cả nâng cao độ tương phản biến đổi giữa lằn vân - thung lũng vân và
tăng độ đồng đều chạy dọc theo các lằn. Mà điều này đồng nghĩa với việc
phải khử nhiễu tốt trong ảnh chất lượng kém đầu vào.
Với mục tiêu như vậy, chúng tôi đã cài đặt thành công phương pháp lọc
khử nhiễu Gabor. Đây là một cách làm hữu hiệu để loại bỏ các nhiễu không
mong đợi, thực chất là áp dụng một ma trận nhân chập theo hướng của đường
vân và “vuốt mượt” đường vân theo một dạng hình sin. Tất cả những điểm
nhiễu sẽ bị cắt bỏ nếu chúng gây những tần số không phù hợp. Kết quả đạt
được sau khi lọc là rất tốt, hầu hết nhiễu đã bị cắt bỏ, hơn nữa, nhờ lọc theo