Tải bản đầy đủ
CHƯƠNG 3. XÂY DỰNG CHƯƠNG TRÌNH VÀ CÀI ĐẶT THỬ NGHIỆM

CHƯƠNG 3. XÂY DỰNG CHƯƠNG TRÌNH VÀ CÀI ĐẶT THỬ NGHIỆM

Tải bản đầy đủ

47

Sơ đồ thuật toán được mô tả trong hình 3.1
MAIN

Ảnh đầu vào

Xác định đường mắt

Tìm kiếm vị trí mắt của
mẫu Matching

Đánh dấu vị trí của mắt

END
Đánh dấu vị trí
mắt của phương pháp
Hình 3.1 Sơcủa
đồ khối

48

Mô tả thuật toán xác định vị trí của mắt cho hình ảnh màu sắc dưới đây.
STT
1

Ảnh

Mô tả quá trình
Định dạng hình ảnh ban đầu IRGB - RGB.
Size M x N x 3.

Chuyển đổi hình ảnh ban đầu quy mô GRAY,
2

size M x N.
Hai chiều đối xứng cửa sổ Hamming cửa sổ cho
tác động của nền và màu sắc không đồng đều.
Nhân nó với hình ảnh ban đầu. Nếu W cửa sổ
đại diện bởi một ma trận kích thước M × N,
phép nhân được thực hiện như sau:

I = I W
- mỗi dòng thứ m (m, :),
m = 1, 2, ..., M,
-

mỗi cột n(:, n),  n = 1, 2, ..., N.

Bây giờ chúng ta tính toán sự khác biệt với các
3

cột:
Dy (m, :) = I (+1 m, :) I (m, :)
Và các dòng,
Dx (:, t) = I (:, t +1) - (, t),
Kích thước ma trận của Dy (M - 1) × N, và Dx

49

ma trận - M × (N - 1).
Bây giờ, để "chia sẻ" kết quả ma trận D
thành hai phần - bên trái và bên phải chiếu cho
mỗi một nửa của trục «X», thêm các dòng có
liên quan:
- chiếu: nửa bên trái và bên phải của ma trận D.
Kết quả được hiển thị ở vị trí 4.
4
Hình ảnh ban đầu được tách ra thành các thành
phần riêng lẻ R - G - B.
Tạo ra một hình ảnh mới của sự khác biệt của
các thành phần R và B
I_RG = IRGB (R) - IRGB (B);
Được phân bổ trong hình ảnh mới có thể nhìn
5

thấy xung quanh mắt, và đặc biệt là ảnh hưởng
của các điểm có thể được gỡ bỏ. Kết quả được
hiển thị ở vị trí 5.
Tiếp theo sử dụng mẫu, và thực hiện các vị trí
mắt tìm kiếm cho mỗi khuôn mặt trái và phải
I_RG sử dụng mẫu Matching.
Quá trình tìm kiếm trên dòng của mắt.
Kết quả tìm kiếm được hiển thị ở vị trí 6.

6

50

Đánh dấu vị trí mắt.

7

Kết quả thuật toán
Kết quả nhận được khi chạy thuật toán được thể hiện trong hình 3.2

51

Hình 3.2 Kết quả thuật toán xác định vị trí mắt người

Hình 3.3 Một số kết quả khác
Một số kết quả khác được thể hiện trong hình 3.3
3.3.

Mô tả các CSDL dùng cho thực nghiệm

Hiện nay hầu hết tất cả các phương pháp xử lý nhận dạng mặt người đều
được thực nghiệm trên các CSDL mặt người như (ORL, BioID và FERET,
AllFaces ). CSDL này không hoàn toàn thỏa mãn các tiêu chuẩn của ảnh
BIOMETRIC tuy nhiên nó lại cho phép kiểm tra được các yêu cầu cần thiết
của các phương pháp như : đánh giá xem các phương pháp có làm việc được
với các CSDL có kích thước cũng như format không chuẩn hay không, có làm
việc chính xác đối với các CSDL ảnh có chất lượng không tốt hay không và
dùng để thống kê độ chính xác. …
Chính vì thế trong luận văn này chúng tôi cũng sẽ sử dụng các CSDL
này để đánh giá phương pháp xác định vị trí mắt người.

52

3.3.1. CSDL ORL.
CSDL ORL chứa ảnh của 40 người, mỗi người 10 ảnh có kích cỡ 92 x
112 px dạng jpg, chế độ GRAY. Ví dụ được biểu diễn dưới hình 3.4

Hình 3.4 CSDL ORL
ORL cơ sở dữ liệu cho người được đặc trưng bởi sự thay đổi:
• Hình ảnh độ sáng của nền xung quanh mặt;
• Kích thước của cá nhân, bao gồm cả những người không tỷ lệ thuận với
X và Y;
• Quay đầu trong không gian 3D trong khoảng (+ - 20) trên trục X ,(+ 30) trên trục Y và (+ - 10) trên trục Z;
• Biểu cảm trên mặt, chi tiết vẽ người (chống răng cưa), con người;


Sự hiện diện (vắng mặt) của những người cùng lớp và cùng một điểm,
mắt đóng hoặc mở rộng…
Sử dụng căn cứ này trong các thí nghiệm thực hiện là những đặc điểm

được liệt kê ở trên. Họ tất cả các kết hợp để xác định chất lượng của hình ảnh
khuôn mặt ban đầu tương đối thấp.

53

Các cơ sở được sử dụng trong ORL kỹ thuật " Định nghĩa dòng đối xứng của
người" và "phương pháp nhanh chóng xác định đối xứng của người". Một số
hình ảnh của cơ sở dữ liệu được hiển thị trong hình 3.4
3.3.2. CSDL FERET.
CSDL FERET được sử dụng rộng dãi trong thử nghiệm các bài toán
nhận dạng mặt người, trong luận văn này chúng tôi sử dụng để thử nghiệm
thuật toán xác định vị trí mắt người, kích cỡ của ảnh 224 x 184 px dạng jpg,
chế độ GRAY và MÀU. Ví dụ được biểu diễn dưới hình 3.5

FERET
COLOR

FERET
GRAY
Hình 3.5 Cơ sở dữ liệu hình ảnh khuôn mặt FERET
Những hình ảnh trong cơ sở dữ liệu FERET được đặc trưng bởi:
• Thay đổi đáng kể trong hợp đồng, độ sáng và hình ảnh nền;
• Thay đổi đáng kể trong kích thước của cá nhân (lên đến 4 lần);
• Thay đổi các biểu thức kiểu tóc và khuôn mặt của người, cũng như định
hướng của người đứng đầu;
• Thay đổi do tuổi tác và thay đổi quần áo;
• Sự hiện diện của kính;
• Địa phương rõ rệt cá nhân phần của khuôn mặt.

54

Obosnovaeiem sử dụng căn cứ này trong các thí nghiệm được thực hiện đặc
điểm năng động nhất của những hình ảnh ban đầu và vùng lãnh thổ của người
trên chúng, thường xuất hiện trong điều kiện thực tế và hệ thống.
FERET cơ sở được sử dụng trong các thí nghiệm người quy định, đối xứng và
xác định các thông số nhân trắc học của hình ảnh khuôn mặt.
Một số hình ảnh của cơ sở dữ liệu được hiển thị trong hình 3.5
3.3.3. CSDL SIMILAR.
CSDL tương tự.
Cơ sở tương tự có chứa 61 hình ảnh màu sắc của lớp . Mỗi hình ảnh được xây
dựng như là các thành phần của phần trên, giữa và dưới của hình ảnh nhiều
nguồn tập trung hoàn toàn là một toàn mặt. Trong trường hợp này, hình ảnh
của các giới tính khác nhau và các diễn viên khác nhau có cùng một thành
phần (mắt, mũi, lông mày, miệng, ...) công nhận phức tạp, so sánh hoặc tương
phản. Tính năng này của các cơ sở tương tự là các lý do cho việc sử dụng nó
hơn trong thử nghiệm so với hình ảnh khuôn mặt của mỗi thực thể tham số
đánh giá và so sánh của họ.
Ví dụ hình ảnh của cơ sở dữ liệu được hiển thị trong hình 3.6

Hình 3.6 Mặt hình ảnh cơ sở dữ liệu tương tự

55

3.3.4. CSDL BIOID.
Dữ liệu thiết lập BIOID bao gồm 1521 hình ảnh màu xám (quy mô
GRAY) kích thước 286 by 384 pixels. Mỗi hình ảnh là một bức chân dung
của một trong 23 chủ đề khác nhau.
• Các nền của hình ảnh được định nghĩa trong hầu hết các nội thất của một
• Chiếu sáng khuôn mặt trong khi chụp ảnh đã không được kiểm soát;
• Các khu vực của khuôn mặt trong ít hơn một nửa kích thước của ảnh
gốc và không ít hơn 1/4 kích thước của hình ảnh ban đầu.
Hình ảnh của cơ sở dữ liệu được hiển thị trong hình 3.7

Hình 3.7 Cơ sở dữ liệu hình ảnh khuôn mặt BIOID
Obosnovaeiem sử dụng căn cứ này trong các thí nghiệm được thực hiện là:
khu vực hiệu suất loa lớn cá nhân hiện diện nền và năng động của độ sáng, là
một diễn giả thường xuyên trong lĩnh vực này. Cơ sở được sử dụng trong các
thí nghiệm liên quan đến định nghĩa của đường đối xứng và định nghĩa của
các tham số khác của cá nhân.
3.4.

Phương pháp đánh giá độ chính xác:

Đánh giá độ chính xác của phương pháp này (so sánh các kết quả của chúng
tôi với kết quả của cơ sở dữ liệu thống kê (BIOD ID) hoặc so sánh với các kết
quả tự xác định vị trí của mắt)

56

Đánh giá tính chính xác của trung tâm của mắt
Hình 3.8 cho thấy một ví dụ so sánh và mắt tọa độ nhận được.

Hình 3.8 Trung tâm phối hợp mắt và mối quan hệ giữa chúng
Ở đây: màu xanh lá cây điểm - vị trí chính xác của mắt, đỏ - tọa độ của mắt
phát hiện. Các công thức gần đúng để ước tính chính xác của nội địa hóa
trung tâm predstalvena mắt dưới đây:
~

d eye =

~

| d (Cl , C l ) | + | d (Cr , C r ) | (4.3)
,
2

trong đó: - Tính toán giá trị của các tọa độ của mắt trái và phải;
- Đúng giá trị của tọa độ của mắt trái và mắt phải,
Kết quả xác định ví trí của mắt được coi là đúng nếu ≤ 3px (kích thước hình
ảnh ít nhất là 320 x 240 pixel).
Ví dụ của việc tìm kiếm các trung tâm mắt trên khuôn mặt cho FERET cơ sở
dữ liệu chân dung và hình ảnh cơ sở dữ liệu BioID được hiển thị trong hình
3.9 và hình 3.10

57

Hình 3.9 Định vị trí của mắt trên CSDL FERET

Hình 3.10 Xác định vị trí của mắt trên CSDL BIOID

Bảng 3. Các kết quả thực nghiệm
Cơ sở

Số lượng hình ảnh và kích thước

Độ sai số

Thời gian

của chúng

chênh lệch

(s)