Tải bản đầy đủ
1 Hướng tiếp cận dựa trên tri thức

1 Hướng tiếp cận dựa trên tri thức

Tải bản đầy đủ

Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

thẳng đứng giữa khuôn mặt và có một mũi một miệng. Các quan hệ đặc trưng có thể là
quan hệ về vị trí và khoảng cách tương đối. Khó khăn của hướng tiếp cận này đó là làm
thế nào để chuyển các tri thức của con người về khuôn mặt sang các luật cho máy tính một
cách hiệu quả. Nếu các luật này quá chi tiết, chặt chẽ thì sẽ có thể xác định thiếu các
khuôn mặt có trong ảnh, nhưng nếu các luật quá tổng quát thì sẽ dẫn đến xác định sai khu
vực không phải là khuôn mặt thành khuôn mặt. Ngoài ra cũng khó để mở rộng phạm vi
của bải toán để xác định các khuôn mặt có nhiều tư thế khác nhau.
2.1.2 Các nghiên cứu liên quan

Có nhiều cách để xây dựng chương trình xác định mặt người theo hướng tiếp cận dựa
trên tri thức. Thông thường chương trình sẽ được xây dựng theo hướng dựa vào một
phương pháp nào đấy chọn ra các ứng viên trong bức ảnh trước, sau đó sẽ áp dụng các luật
để xác định ứng viên nào là khuôn mặt, ứng viên nào không phải là khuôn mặt. Quá trình
này có thể được áp dụng nhiều lần để giảm sai sót. Các luật được xây dựng dựa vào tri
thức của người nghiên cứu về các đặc trưng của khuôn mặt (ví dụ như cường độ phân
phôi và sự khác nhau ) của các vùng trên khuôn mặt.

Hình 2.1: Một phương pháp xác định khuôn mặt điển theo hướng tiếp cận Top-down.

Yang và Huang đã sử dụng hướng tiếp cận dựa trên tri thức để xác định khuôn mặt
[3-4]. Hệ thống của hai tác giả bao gồm ba mức luật. Đầu tiên các ông sử dụng một khung
cửa sổ để quét trên bức ảnh và thông qua một số tập luật để xác định các ứng viên có thể là
mặt người, ví dụ như tìm phần trung tâm của khuôn mặt (phần tối hơn trong hình 2.1).
Tiếp theo, dùng một tập luật để mô tả tổng quát hình dáng khuôn mặt, lọc các ứng viên ở
mức một thành một tập các ứng viên mới có xác xuất là khuôn mặt cao hơn. Cuối cùng,
các ông lại dùng một tập luật khác để xem xét ở mức chi tiết các đặc trưng khuôn mặt (có
thể là đặc trưng về mắt, mũi, miệng…), từ đó lọc ra các ứng viên chính xác nhất. Có thể

Học viên: Lê Thị Phương Anh
11

Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

nói cách làm của hai ông là một cách làm mịn dần để đạt được kết quả tốt nhất, mặc dù tỷ
lệ chính xác chưa cao, nhưng đây là tiền đề cho nhiều nghiên cứu sau này.
Có rất nhiều công trình nghiên cứu sử dụng phương pháp chiếu để xác định khuôn
mặt. Kotropoulos và Pitas [5] đưa ra một phương pháp gần tương tự với Yang và Huang.
Đầu tiên, các vùng của khuôn mặt được định vị bởi phương pháp chiếu (đã được Kanade
sử dụng thành công) để xác định biên của khuôn mặt. Với I(x,y) là giá trị xám của một
điểm trong ảnh có kích thước m x n ở tại vị trí (x,y), các hàm để chiếu ảnh theo phương
ngang và thẳng đứng được định nghĩa như sau:

HI(x) =


VI(y) =

.

Dựa trên biểu đồ hình chiếu ngang, khi xét biểu đồ biến thiên của HI hai ông tìm
được hai cực tiểu địa phương tương ứng với hai đỉnh đầu bên trái và bên phải của khuôn
mặt. Còn theo hình chiếu dọc, xét biến thiên và tìm cực tiểu địa phương của VI cũng cho
ta các vị trí của miệng, đỉnh mũi và hai mắt. Các đặc trưng này đủ để xác định khuôn mặt.
Hình 2.2.a cho một ví dụ về cách xác định như trên. Cách xác định này có tỷ lệ xác định
chính xác là 86.5% cho trường hợp chỉ có một khuôn mặt thẳng trong ảnh và hình nền
không phức tạp. Nếu hình nền phức tạp như hình 2.2.b thì rất khó tìm. Còn nếu ảnh có
nhiều khuôn mặt (hình 2.2.c) thì sẽ không xác định được.

Hình 2.2: Phương pháp chiếu: (a) Ảnh chỉ có một khuôn mặt và hình nền đơn giản;
(b) Ảnh chỉ có một khuôn mặt và hình nền phức tạp;
(c) Ảnh có nhiều khuôn mặt
Học viên: Lê Thị Phương Anh
12

Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

2.2 Hướng tiếp cận dựa trên đặc trưng không thay đổi

Tiếp cận dựa trên các đặc trưng không thay đổi là tiếp cận theo kiểu Bottom-Up. Dựa
trên thực tế, chúng ta cố gắng tìm ra những đặc điểm không thay đổi khi của khuôn mặt
khi ở các tư thế khác nhau và các điều kiện môi trường như ánh sáng khác nhau. Đã có rất
nhiều nghiên cứu về hướng tiếp cận này, các đặc điểm không thay đổi được tìm thấy như
lông mày, mắt, mũi, miệng hay các đường viền trên tóc… Trên cơ sở các đặc trưng này,
các nhà nghiên cứu xây dựng lên một mô hình thống kê mô tả quan hệ của các đặc trưng
và từ đó xác định sự xuất hiện của khuôn mặt trong bức ảnh. Khó khăn của hướng tiếp cận
này đó là phải mô tả các đặc trưng không thay đổi và quan hệ giữa chúng phù hợp với điều
kiện ánh sáng, độ nhiễu hay bị che khuất.
2.2.1 Các đặc trưng của khuôn mặt

Có rất nhiều nghiên cứu về các đặc trưng của khuôn mặt. Có thể dựa vào các đặc
trưng như hai mắt, hai lỗ mũi, miệng, phần nối giữa mũi và miệng…hoặc dựa vào đường
viền của khuôn mặt.
Leung trong [6] đã đề xuất mô hình xác xuất để xác định khuôn mặt trong ảnh có
hình nền phức tạp dựa trên việc tìm kiếm các đặc trưng không thay đổi của khuôn mặt
trong ảnh, sau đó dùng đồ thị ngẫu nhiên để xác định khuôn mặt. Tư tưởng của phương
pháp này đó là xem bài toán xác định khuôn mặt như là bài toán tìm kiếm với mục tiêu là
tìm thứ tự các đặc trưng không thay đổi của khuôn mặt. Dùng năm đặc trưng (hai mắt, hai
lỗ mũi, phần nối giữa mũi và miệng) để mô tả một khuôn mặt. Đồng thời tính quan hệ
khoảng cách cho tất cả các cặp đặc trưng (như mắt trái, mắt phải), sau đấy dùng phân bố
Gauss để mô hình hóa. Một mẫu khuôn mặt được đưa ra thông qua trung bình tương ứng
cho một tập đa hướng, đa tỷ lệ của bộ lọc đạo hàm Gauss. Từ một ảnh, các đặc trưng của
ứng viên được xác định bằng cách so khớp từng điểm ảnh khi lọc tương ứng với vector
mẫu. Hai ứng viên có đặc trưng đứng đầu sẽ được chọn để tìm kiếm cho các đặc trưng
khác của khuôn mặt. Từ các đặc trưng không thay đổi, các đặc trưng khác sẽ được xác
định thông qua sự đánh giá xác xuất khoảng cách giữa các đặc trưng, hơn nữa phương sai
của phép thống kê này có thể được tính toán trước để xác định các đặc trưng với xác xuất
lớn. Tỷ lệ chính xác của phương pháp này là 86%.
Bên cạnh tính khoảng cách liên quan để mô tả quan hệ giữa các đặc trưng như Leung
Kendall [6], Mardia và Dryden [7] dùng lý thuyết xác suất thống kê về hình dáng. Dùng
Học viên: Lê Thị Phương Anh
13

Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

hàm mật độ xác suất (Probility Density Function - PDF) qua N điểm đặc trưng, tương ứng
(xi, yi) là đặc trưng thứ i với giả sử là phân bố Gauss có 2N-chiều. Các tác giả áp dụng
phương thức cực đại khả năng (Maximum-Likelihood - ML) để xác định vị trí khuôn mặt.
Một thuận lợi của phương pháp này là các khuôn mặt bị che khuất vẫn có thể xác định
được. Hạn chế phương pháp này đó là không xác định được nhiều khuôn mặt trong cùng
một ảnh.
Không dùng phương pháp xác suất, Sirohey đưa một phương pháp khác xác định
khuôn mặt từ một ảnh có hình nền phức tạp dựa trên cạnh [8]. Dùng phương pháp Candy
[9] và heuristics loại bỏ các cạnh để còn lại duy nhất một đường bao xung quanh khuôn
mặt. Một hình ellipse dùng để bao khuôn mặt, tách biệt vùng đầu và hình nền. Tỷ lệ chính
xác của thuật toán là 80%.
Graf đưa ra một phương pháp xác định đặc trưng rồi xác định khuôn mặt trong ảnh
xám [10]. Dùng bộ lọc để làm nổi các biên, các phép toán hình thái học (morphology)
được dùng để làm nổi bật các vùng có cường độ cao và hình dáng chắc chắn (như mắt).
Thông qua histogram để tìm các đỉnh nổi bật để xác định các ngưỡng chuyển ảnh xám
thành hai ảnh nhị phân. Các thành phần dính nhau đều xuất hiện trong hai ảnh nhị phân
thì được xem là vùng của ứng viên khuôn mặt rồi phân loại xem có phải là khuôn mặt
không. Phương pháp được kiểm tra trên các ảnh chỉ có đầu và vai của người. Tuy nhiên
phương pháp này còn một vấn đề đấy là sử dụng các phép toán morphology như thế nào
và làm sao xác định khuôn mặt trên các vùng ứng viên.
Trong [11], Girosi dùng Gaze để tìm ứng viên góc mắt, miệng và tâm mắt. Ông xây
dựng SVM (Support Vector Machine) đã được học trước đó để xác định các vị trí ứng viên
có phải là góc mắt, miệng, và tâm mắt hay không để theo vết con mắt người. Juan và
Narciso xây dựng một không gian màu mới YCg’Cr’ để lọc các vùng là ứng viên khuôn
mặt dựa trên sắc thái của màu da người. Sau khi có ứng viên, hai ông dùng các quan hệ về
hình dáng khuôn mặt, mức độ cân đối của các thành phần khuôn mặt để xác định khuôn
mặt người.
Tương tự, Chang và Hwang cũng dùng không gian màu Ycg’Cr’ với tỷ lệ chính xác
hơn 80% trong ảnh xám. Jin xây dựng một bộ lọc để xác định ứng viên khuôn mặt người
theo màu da người. Từ ứng viên này tác giả xác định khuôn mặt người theo hình dáng

Học viên: Lê Thị Phương Anh
14