Tổng quan các phương pháp xác định khuôn mặt người

Tng quan các phương pháp xác định khuôn  
mt người  
Phm Thế Bo, Nguyn Thành Nht, Cao Minh Thnh, Trn Anh Tun, Phan Phúc Doãn  
khuôn mt, … [5, 6, 7, 32, 54, 95, 118,  
I. GII THIU  
130].  
o
Nhn dng người A [29, 38, 46, 55, 56, 58,  
60, 61] có phi là ti phm truy nã hay  
không? Giúp cơ quan an ninh qun lý tt  
con người. Công vic nhn dng có thể ở  
trong môi trường bình thường cũng như  
trong bóng ti (sdng camera hng  
ngoi).  
Hơn mt thp kqua có rt nhiu công trình  
nghiên cu vbài toán xác định khuôn mt người từ  
nh đen trng, xám đến nh màu như ngày hôm nay.  
Các nghiên cu đi tbài toán đơn gin, mi nh chỉ  
có mt khuôn mt người nhìn thng vào thiết bthu  
hình và đầu tư thế thng đứng trong nh đen trng.  
Cho đến ngày hôm nay bài toán mrng cho nh  
màu, có nhiu khuôn mt trong cùng mt nh, có  
nhiu tư thế thay đổi trong nh. Không nhng vy  
mà còn mrng cphm vi tmôi trường xung  
quanh khá đơn gin (trong phòng thí nghim) cho  
đến môi trường xung quanh rt phc tp (như trong  
tnhiên) nhm đáp ng nhu cu tht svà rt nhiu  
ca con người.  
o
o
Hthng quan sát, theo dõi [35, 35, 106] và  
bo v. Các hthng camera sxác định  
đâu là con người và theo dõi con người đó  
xem hcó vi phm gì không, ví dxâm  
phm khu vc không được vào, ….  
Lưu tr(rút tin ATM, để biết ai rút tin  
vào thi đim đó), hin nay có tình trng  
nhng người bngười khác ly mt thẻ  
ATM hay mt mã sPIN và nhng người  
ăn cp này đi rút tin, hoc nhng người  
chthẻ đi rút tin nhưng li báo cho ngân  
hàng là mt thvà mt tin. Các ngân hàng  
có nhu cu khi có giao dch tin skim tra  
hay lưu trkhuôn mt người rút tin để sau  
đó đối chng và xlý [66, 81, 98, 133].  
Thcăn cước, chng minh nhân dân (Face  
Identification) [114].  
1.Định nghĩa bài toán xác định khuôn mt  
người  
Xác định khuôn mt người (Face Detection) là  
mt kthut máy tính để xác định các vtrí và các  
kích thước ca các khuôn mt người trong các nh  
bt k(nh kthut s). Kthut này nhn biết các  
đặc trưng ca khuôn mt và bqua nhng thkhác,  
như: tòa nhà, cây ci, cơ th, … [105].  
o
o
2. ng dng ca phương pháp xác định khuôn  
mt người  
Điu khin vào ra: văn phòng, công ty, trụ  
s, máy tính, Palm, …. Kết hp thêm vân  
tay và mng mt. Cho phép nhân viên được  
ra vào nơi cn thiết, hay mi người sẽ đăng  
nhp máy tính cá nhân ca mình mà không  
cn nhtên đăng nhp cũng như mt khu  
mà chcn xác định thông qua khuôn mt  
[44].  
Có nhiu ng dng đã được và đang thiết kế, tôi  
chxin đưa ra mt sloi ng dng sau:  
o
Hthng tương tác gia người và máy:  
giúp nhng người btt hoc khiếm khuyết  
có thtrao đổi. Nhng người dùng ngôn  
ngtay có thgiao tiếp vi nhng người  
bình thường. Nhng người bbi lit thông  
qua mt ský hiu nháy mt có thbiu lộ  
nhng gì hmun, …. Đó là các bài toán  
điu bca bàn tay (hand gesture), điu bộ  
o
An ninh sân bay, xut nhp cnh (hin nay  
cơ quan xut nhp cnh Mỹ đã áp dng).  
1
Dùng để xác thc người xut nhp cnh và  
kim tra có phi là nhân vt khng bố  
không.  
II. PHƯƠNG PHÁP XÁC ĐỊNH KHUÔN MT  
NGƯỜI  
Có nhiu nghiên cu tìm phương pháp xác định  
khuôn mt người, từ ảnh xám đến ngày nay là nh  
màu. Tôi strình bày mt cách tng quát nht nhng  
hướng gii quyết chính cho bài toán, tnhng  
hướng chính này nhiu tác githay đổi mt sý nhỏ  
bên trong để có kết qumi.  
o
o
Tương lai sphát trin các loi ththông  
minh có tích hp sn đặc trưng ca người  
dùng trên đó, khi bt cngười dùng khác  
dùng để truy cp hay xlý ti các hthng  
sẽ được yêu cu kim tra các đặc trưng  
khuôn mt so vi thẻ để biết nay có phi là  
chthhay không.  
Da vào tính cht ca các phương pháp xác định  
khuôn mt người trên nh. Các phương pháp này  
được chia làm bn [9] hướng tiếp cn chính. Ngoài  
bn hướng này, nhiu nghiên cu có khi liên quan  
đến không nhng mt hướng tiếp cn mà có liên  
quan nhiu hơn mt hướng chính:  
Tìm kiếm và tchc dliu liên quan đến  
con người thông qua khuôn mt người trên  
nhiu hcơ sdliu lưu trtht ln, như  
internet, các hãng truyn hình, …. Ví d:  
tìm các đon video có tng thng Bush phát  
biu, tìm các phim có din viên Lý Liên  
Kit đóng, tìm các trn đá banh có Ronaldo  
đá, … [50, 94, 134].  
o
Hướng tiếp cn da trên tri thc: Mã hóa các  
hiu biết ca con người vcác loi khuôn mt  
người thành các lut. Thông thường các lut  
mô tquan hca các đặc trưng.  
o
Hướng tiếp cn da trên đặc trưng không  
thay đổi: Mc tiêu các thut toán đi tìm các  
đặc trưng mô tcu trúc khuôn mt người mà  
các đặc trưng này skhông thay đổi khi tư thế  
khuôn mt, vtrí đặt thiết bthu hình hoc  
điu kin ánh sáng thay đổi.  
o
Hin nay có nhiu hướng tiếp cn để xác  
định mt nh có phi là nh kha thân hay  
không? Khuôn mt người được xem như  
mt yếu tố để xác định cho mt hướng tiếp  
cn mà được dùng gn đây [271, 272].  
ng dng trong video phone [10].  
o
Hướng tiếp cn da trên so khp mu: Dùng  
các mu chun ca khuôn mt người (các mu  
này được chn la và lưu tr) để mô tcho  
khuôn mt người hay các đặc trưng khuôn mt  
(các mu này phi chn làm sao cho tách bit  
nhau theo tiêu chun mà các tác giả định ra để  
so sánh). Các mi tương quan gia dliu  
nh đưa vào và các mu dùng để xác định  
khuôn mt người.  
o
o
Phân loi trong lưu trhình nh trong đin  
thoi di động. Thông qua bài toán xác định  
khuôn mt người và trích đặc trưng, ri da  
vào đặc trưng này để sp xếp lưu tr, giúp  
người sdng ddàng truy tìm khi cn  
thiết [69, 105].  
o
Kim tra trng thái người lái xe có nggt,  
mt tp trung hay không, và htrthông  
báo khi cn thiết [109].  
o
Hướng tiếp cn da trên din mo: Trái  
ngược hn vi so khp mu, các mô hình (hay  
các mu) được hc tmt tp nh hun luyn  
trước đó. Sau đó hthng (mô hình) sxác  
định khuôn mt người. Hay mt stác gicòn  
gi hướng tiếp cn này là hướng tiếp cn theo  
phương pháp hc.  
o
o
Phân tích cm xúc trên khuôn mt [112].  
Trong lãnh vc thiết kế điu khin robot  
[42, 43, 124, 151, 236].  
o
Hãng máy chp hình Canon đã ng dng  
bài toán xác định khuôn mt người vào máy  
chp hình thế hmi để cho kết quhình  
nh đẹp hơn, nht là khuôn mt người  
[277].  
1. Hướng tiếp cn da trên tri thc  
Trong hướng tiếp cn này, các lut sphthuc  
rt ln vào tri thc ca nhng tác ginghiên cu về  
bài toán xác định khuôn mt người. Đây là hướng  
tiếp cn dng top-down. Ddàng xây dng các lut  
cơ bn để mô tcác đặc trưng ca khuôn mt và các  
quan htương ng. Ví d, mt khuôn mt thường có  
hai mt đối xng nhau qua trc thng đứng gia  
khuôn mt và có mt mũi, mt ming. Các quan hệ  
2
ca các đặc trưng có thể được mô tnhư quan hvbn”, và “mc độ khác nhau gia các giá trxám  
khong cách và vtrí. Thông thường các tác gistrung bình ca phn trung tâm và phn bao bên trên  
trích đặc trưng ca khuôn mt trước tiên để được là đáng k”. Độ phân gii thp nht (mc m) ca  
các ng viên, sau đó các ng viên này sẽ được xác nh dùng để tìm ng viên khuôn mt mà còn tìm ở  
định thông qua các lut để biết ng viên nào là các mc phân gii tt hơn. mc hai, xem xét biu  
khuôn mt và ng viên nào không phi khuôn mt. đồ histogram ca các ng viên để loi bt ng viên  
Thường áp dng quá trình xác định để gim snào không phi là khuôn mt, đồng thi dò ra cnh  
lượng xác định sai.  
bao xung quanh ng viên. mc cui cùng, nhng  
Mt vn đề khá phc tp khi dùng hướng tiếp ng viên nào còn li sẽ được xem xét các đặc trưng  
cn này là làm sao chuyn ttri thc con người sang ca khuôn mt vmt và ming. Hai ông đã dùng  
các lut mt các hiu qu. Nếu các lut này quá chi mt chiến lược “tthô đến mn” hay “làm rõ dn”  
tiết (cht ch) thì khi xác định có thxác định thiếu để gim slượng tính toán trong xlý. Mc dù tlệ  
các khuôn mt có trong nh, vì nhng khuôn mt chính xác chưa cao, nhưng đây là tin đề cho nhiu  
này không ththa mãn tt ccác lut đưa ra. nghiên cu sau này [200].  
Nhưng các lut tng quát quá thì có thchúng ta sẽ  
Kotropoulos và Pitas [200] đưa mt phương  
xác định lm mt vùng nào đó không phi là khuôn pháp tương t[191, 261] dùng trên độ phân gii  
mt mà li xác định là khuôn mt. Và cũng khó khăn thp. Hai ông dùng phương pháp chiếu để xác định  
mrng yêu cu tbài toán để xác định các khuôn các đặc trưng khuôn mt, Kanade đã thành công vi  
mt có nhiu tư thế khác nhau.  
phương pháp chiếu để xác định biên ca khuôn mt  
[191]. Vi I(x,y) là giá trxám ca mt đim trong  
nh có kích thước m x n ti vtrí (x,y), các hàm để  
chiếu nh theo phương ngang và thng đứng được  
n
định nghĩa như sau: HI (x) = y=1I (x,y) và  
Hình 1: (a) nh ban đầu có độ phân gii n=1;  
(b), (c), và (d) nh có độ phân gii n=4, 8, và 16.  
m
VI (y) = x=1I (x,y) . Da trên biu đồ hình chiếu  
ngang, có hai cc tiu địa phương khi hai ông xét  
quá trình thay đổi độ đốc ca HI, đó chính là cnh  
bên trái và phi ca hai bên đầu. Tương tvi hình  
chiếu dc VI, các cc tiu địa phương cũng cho ta  
biết vtrí ming, đỉnh mũi, và hai mt. Các đặc trưng  
này đủ để xác định khuôn mt. Hình 3.a cho mt ví  
dvcách xác định như trên. Cách xác định này có  
tlxác định chính xác là 86.5% cho trường hp chỉ  
có mt khuôn mt thng trong nh và hình nn  
không phc tp. Nếu hình nn phc tp thì rt khó  
tìm, hình 3.b. Nếu nh có nhiu khuôn mt thì sẽ  
không xác định được, hình 3.c.  
Hình 2: Mt lai tri trc ca người nghiên cu phân tích trên khuôn mt.  
Yang và Huang [261] dùng mt phương thc  
theo hướng tiếp cn này để xác các khuôn mt. Hệ  
thng ca hai tác ginày bao gm ba mc lut. Ở  
mc cao nht, dùng mt khung ca squét trên nh  
và thông qua mt tp lut để tìm các ng viên có thể  
là khuôn mt. mc kế tiếp, hai ông dùng mt tp  
lut để mô ttng quát hình dáng khuôn mt. Còn ở  
mc cui cùng li dùng mt tp lut khác để xem xét  
mc chi tiết các đặc trưng khuôn mt. Mt hệ  
thng đa độ phân gii có thtự được dùng để xác  
định, hình 1. Các lut mc cao nht để tìm ng  
viên như: “vùng trung tâm khuôn mt (phn ti hơn  
trong hình 2) có bn phn vi mt mc độ đều cơ  
bn”, “phn xung quanh bên trên ca mt khuôn mt  
(phn sáng hơn trong hình 2) có mt mc độ đều cơ  
Hình 3: Phương pháp chiếu:  
(a) nh chcó mt khuôn mt và hình nn đơn gin;  
(b) nh chcó mt khuôn mt và hình nn phc tp;  
(c) nh có nhiu khuôn mt  
3
Rodrigues và Buf [132] dùng phương pháp chn  
các keypoint trong nhiu tlkhác nhau, đặc bit  
tác gichdùng các keypoint dư tha da trên nhiu  
độ phân gii. Da trên quan hhình hc ca các  
thành phn khuôn mt, hai ông nhóm các keypoint  
li để xác định khuôn mt người.  
Hình 4: Chiếu tng phn ng viên để xác định khuôn mt.  
Fred [1140] dtrên tính cht đối xng ca  
khuôn mt người, ông xem xét các phân btrên  
histogram có tính cht gn đối xng để xác định  
khuôn mt người trong nh xám đơn có khuôn mt  
chp thng.  
Fan [82] phân đon nh màu để tìm cnh thông  
qua thut toán tăng vùng để xác định các ng viên.  
Dùng đặc tính hình ellipse ca khuôn mt người để  
xác định ng viên nào khuôn mt người.  
Kim [65] kết hp thut toán watershed cho các  
nh có nhiu độ phângii cùng mô hình màu da  
người để tìm ng viên, ri xác định khuôn mt  
người trong video. Tlchính xác khong 87-94%.  
Phương pháp chxlý cho các frame nh chcó mt  
khuôn mt và nh này phi chp thng chđầu và  
vai.  
Berbar [279] kết hp mô hình màu da người và  
xác định cnh để tìm ng viên khuôn mt người. Sau  
đó kết hp quan hcác đặc trưng và phương pháp  
chiếu các ng viên khuôn mt xung hai trc: dng  
và ngang để xác định ng viên nào tht slà khuôn  
mt người.  
2. Hướng tiếp cn da trên đặc trưng không  
thay đổi  
Sahbi và Boujemaa [8] sdng mng neural hc  
để ước lượng các tham scho mô hình Gauss, mc  
đích để tìm ng viên trên sc màu da ca người. Sau  
khi có ng viên, hai ông chiếu lên hai trc: đứng và  
ngang để xác định khuôn mt người.  
Đây là hướng tiếp cn theo kiu bottom-up. Các  
tác gicgng tìm các đặc trưng không thay đổi ca  
khuôn mt người để xác định khuôn mt người. Da  
trên nhn xét thc tế, con người ddàng nhn biết  
các khuôn mt và các đối tượng trong các tư thế  
khác nhau và điu kin ánh sáng khác nhau, thì phi  
tn ti các thuc tính hay đặc trưng không thay đổi.  
Có nhiu nghiên cu đầu tiên xác định các đặc trưng  
khuôn mt ri chra có khuôn mt trong nh hay  
không. Các đặc trưng như: lông mày, mt, mũi,  
ming, và đường vin ca tóc được trích bng  
phương pháp xác định cnh. Trên cơ scác đặc  
trưng này, xây dng mt mô hình thng kê để mô tả  
quan hca các đặc trưng này và xác định stn ti  
ca khuôn mt trong nh. Mt vn đề ca các thut  
tóan theo hướng tiếp cân đặc trưng cn phi điu  
chnh cho phù hp điu kin ánh sáng, nhiu, và bị  
che khut. Đôi khi bóng ca khuôn mt sto thêm  
cnh mi, mà cnh này li rõ hơn cnh tht sca  
khuôn mt, vì thế nếu dùng cnh để xác định sgp  
khó khăn.  
Có nhiu nghiên cu sau này sdng phương  
pháp chiếu để xác định khuôn mt người. Min [80]  
dùng mô hình màu da không tham s, Baskan [76],  
Mateos [74], và Nicponski [45] xây dng blc, để  
tìm ng viên khuôn mt, sau đó chiếu lên hai trc để  
xác định các thành phn khuôn mt để xác định ng  
viên đó có phi là khuôn mt hay không. Còn  
Mateos và Chicote [34] dùng kết cu để xác định  
ng viên trong nh màu. Sau đó phân tích hình dáng,  
kích thước, thành phn khuôn mt để xác định  
khuôn mt. Khi tìm được ng viên khuôn mt, hai  
ông trích các ng viên ca tng thành phn khuôn  
mt, sau đó chiếu tng phn này để xác thc đó có  
phi là thành phn khuôn mt hay không, hình 4. Tỷ  
lchính xác hơn 87%.  
Farhad và Abdolhorsein [136] dùng tri thc về  
histogram để xác định khuôn mt trong các frame  
liên tc trong mt đon video. Tương t, Hidekazu  
và Mamoru [100, 139] cũng dùng histogram, nhưng  
hai ông dùng thut gii di truyn (Genetic Algorithm  
– GA) lai như là mt phương pháp tìm kiếm ngu  
nhiên da vào đỉnh ca biu đồ màu ca nh.  
a) Các đặc trưng khuôn mt  
Sirohey đưa mt phương pháp xác định khuôn  
mt tmt nh có hình nn phc tp [240]. Phương  
pháp da trên cnh (dùng phương pháp Candy [155]  
và heuristics để loi bcác cnh để còn li duy nht  
4
mt đường bao xung quanh khuôn mt. Mt hình trưng khác ca khuôn mt. Ging như xây dng mt  
ellipse dùng để bao khuôn mt, tách bit vùng đầu đồ thquan hmi node ca đồ thtương ng như  
và hình nn. Tlchính xác ca thut tóan là 80%. các đặc trưng ca mt khuôn mt, đưa xác sut vào  
Cũng dùng phương pháp cnh như Sirohey, để xác định. Tlxác định chính xác là 86%.  
Chetverikov và Lerch dùng mt phưong pháp da  
Bên cnh tính khang cách liên quan để mô tả  
trên blob và streak (hình dng git nước và sc xen quan hgia các đặc trưng như Leung [154, 206].  
k), để xác định theo hướng các cnh [157]. Hai ông Kendall [195] và [212] dùng lý thuyết xác sut thng  
dùng hai blob ti và ba blob sáng để mô thai mt, kê vhình dáng. Dùng hàm mt độ xác sut  
hai bên gò má, và mũi. Mô hình này dùng các treak (Probility Density Function - PDF) qua N đim đặc  
để mô thình dáng ngoài ca khuôn mt, lông mày, trưng, tương ng (xi, yi) là đặc trưng thi vi gisử  
và môi. Dùng nh có độ phân gii thp theo biến da vào phân bGauss có 2N-chiu. Các tác giáp  
đổi Laplace để xác định khuôn mt thông qua blob.  
dng phương thc cc đại khnăng (Maximum-  
Graf đưa ra mt phương pháp xác định đặc Likelihood - ML) để xác định vtrí khuôn mt. Mt  
trưng ri xác định khuôn mt trong nh xám [180]. thun li ca phương pháp này là các khuôn mt bị  
Dùng blc để làm ni các biên, các phép tóan hình che khut vn có thxác định được. Nhưng phương  
thái hc (morphology) được dùng để làm ni bt các pháp không xác định được đa khuôn mt trong nh.  
vùng có cường độ cao và hình dáng chc chn (như  
Yow và Cipolla [265, 266] trình bày mt  
mt). Thông qua histogram để tìm các đỉnh ni bt phương thc da vào đặc trưng, dùng slượng ln  
để xác định các ngưỡng chuyn nh xám thành hai các du hiu từ ảnh và cdu hiu vngcnh. Đầu  
nh nhphân. Các thành phn dính nhau đều xut tiên dùng blc đạo hàm Gauss thhai, xác định  
hin trong hai nh nhphân thì được xem là vùng các đim mu cht ti cc đại địa phương trong bộ  
ca ng viên khuôn mt ri phân loi xem có phi là lc, ri chra nơi có thđặc trưng. Giai đon hai,  
khuôn mt không. Phương pháp được kim tra trên kim tra các cnh xung quanh đim mu cht và  
các nh chđầu và vai ca người. Tuy nhiên còn nhóm chúng li thành các vùng. Tiêu chun để nhóm  
vn đề, làm sao sdng các phép toán morphology các cnh là gn và tương thướng và cường độ. Đo  
và làm sao xác định khuôn mt trên các vùng ng lường các đặc tính vùng như: chiu dài cnh, cường  
viên.  
độ cnh, và biến thiên cường độ được lưu trong mt  
Leung trình bày mt mô hình xác sut để xác vector đặc trưng. Tdliu đặc trưng khuôn mt đã  
định khuôn mt trong nh có hình nn phc tp được hun luyn, stính được giá trtrung bình và  
trên cơ smt bxác định đặc trưng cc bvà so ma trn hip phương sai ca mi đặc trưng khuôn  
khp đồ thngu nhiên [205]. Ý chính là xem bài mt. Mt vùng là ng viên khuôn mt khi khong  
toán xác định khuôn mt như là bài toán tìm kiếm cách Mahalanobis gia các vector đặc trưng đều  
vi mc tiêu là tìm thtcác đặc trưng chc chn dưới mt ngưỡng. Ri thông qua mng Bayes để xác  
ca khuôn mt để to thành ging nht mt mu định ng viên có phi là khuôn mt không. Tlệ  
khuôn mt. Dùng năm đặc trưng (hai mt, hai lchính xác là 85% [267], tuy nhiên mc độ sai là  
mũi, phn ni gia mũi và ming) để mô tmt 28%, và chhiu quvi hình khuôn mt có kích  
khuôn mt. Luôn tính quan hkhong cách vi các thước 60x60 đim nh. Phương pháp này được dùng  
đặc trưng cp (như mt trái, mt phi), dùng phân bthêm vi mô hình đường vin linh hat [158, 267].  
Gauss để mô hình hóa. Mt mu khuôn mt được  
Takacs và Wechsler trình bày mt phương pháp  
đưa ra thông qua trung bình tương ng cho mt tp da trên tích đặc trưng võng mc và cử động theo  
đa hướng, đa tlca blc đạo hàm Gauss. Tdao động nhca mt [250]. Thut toán hot động  
mt nh, các đặc trưng ng viên được xác định bng trên bn đồ hay vùng ca các mu cht, mô hình hóa  
cách so khp tng đim nh khi lc tương ng vi lưới võng mc. Đầu tiên tính toán ước lượng thô  
vector mu (tương tmi tương quan), chn hai ng vùng khuôn mt trên cơ sblc. Giai đon thhai  
viên đặc trưng đứng đầu để tìm kiếm cho các đặc  
5
tinh chế trên độ phân gii mn hơn. Tlsai là có thcó các tư thế, vtrí, tlkhác nhau. Tlệ  
4.69%.  
Han phát trin mt kthut trên cơ sở  
chính xác là 53%.  
Kruppa [21] dùng sc màu ca da người để tìm  
morphology để trích các đon ging mt (eye- ng viên, nhưng ông không xlý cho tng đim nh  
analogue) để xác định khuôn mt người [182]. Ông theo cách thông thường, mà ông dùng mô hình màu  
nói rng mt và lông mày là đặc trưng ni bt nht da người trên tng phn nhri xlý phân đon  
n định nht ca khuôn mt con người, và nó rt trên đó. Sau khi có ng viên khuôn mt, ông dùng  
hu dng để xác định khuôn mt người. Ông định mt số đặc tính vhình dáng để xác định khuôn mt  
nghĩa các đon ging mt như là các cnh trên người. Tlchính xác là 85%.  
đường vin ca mt. Đầu tiên, các phép tóan  
Park dùng Gaze để tìm ng viên góc mt, ming  
morphology như đóng, ct bsai khác, và phân và tâm mt [27]. Ông xây dng SVM đã được hc  
ngưỡng để trích các đim nh có giá trcường độ trước đó để xác định các vtrí ng viên có phi là  
thay đổi đáng k. Các đim nh này strthành các góc mt, ming, và tâm mt hay không để theo vết  
đim nh ging mt. Sau đó mt tiến trình gán nhãn con mt người.  
để sinh các đon ging mt. Các đon này được  
Sato [67] dùng quan hệ đường vin cm ca  
dùng để chdn tìm kiếm các vùng tim năng có thkhuôn mt. Tác gichia làm hai trường hp: thon  
là khuôn mt qua kết hp các đặc tính hình hc ca dài và tròn để xem xét. Tác gidùng GA để xem xét  
mt, mũi, lông mày, và ming. Các vùng này smi tương quan ca đường cong, hình dáng khuôn  
được mt mng neural xem xét có phi là khuôn mt mt để xác định khuôn mt.  
không, ging [48]. Theo tác gitlchính xác là  
Chai và Ngan [708] xây dng phương pháp xác  
định khuôn mt người da trên đặc trưng v: quan  
94%.  
Amit đưa ra phương thc xác định khuôn mt hhình hc, mt độ, độ chói trong nh màu chcó  
da trên hình dáng và áp dng cho các khuôn mt đầu và vai ca ng viên để xác định. Kim [47] cũng  
chp thng [145]. Có hai giai đon để xác định phân đon để tìm ng viên khuôn mt, nhưng xác  
khuôn mt người: tp trung và phân loi chi tiết. thc khuôn mt thông qua các cu trúc các đặc trưng  
Làm có thtcác mnh cnh, các mnh này được mt, mũi, ming, và đường vin ca ng viên.  
trích tbxác định cnh đơn gin thông qua sự  
Jang [53] dùng phân bmàu da để phân đon  
khác bit cường độ là quá trình tp trung. Khi có các tìm ng viên ri dùng các đặc trưng hình hc để xác  
ng viên tquá trình trên, dùng thut toán CART định khuôn mt.  
[152] để xây dng mt cây phân loi tcác nh để  
hun luyn, để xem xét ng viên nào là khuôn mt trưng mi, đó là đặc trưng về độ cong ca các đường  
người. trên khuôn mt để gii quyết vn đề điu kin ánh  
Christian và Jonh [135] xây dng mt loi đặc  
Jin [90] dùng cu trúc hình hc ca khuôn mt sáng. Từ đặc trưng cong này, hai ông quay li  
người để tìm ng viên khuôn mt trong nh xám và phương pháp PCA để xác định khuôn mt.  
hình nn không phc tp. Mi nh chcó mt khuôn  
Juan và Narciso [111] xây dng mt không gian  
mt người, nhưng tư thế điu kin ánh sáng, không màu mi YCg’Cr’ để lc các vùng là ng viên khuôn  
cố định. Tlchính xác khang 94.25% và thi gian mt da trên sc thái ca màu da người. Sau khi có  
khá nhanh.  
ng viên, hai ông dùng các quan hvhình dáng  
Chan và Lewis [16] dùng kthut lc để loi khuôn mt, mc độ cân đối ca các thành phn  
bt tác động ca ánh sáng, sau đó phân đon để tìm khuôn mt để xác định khuôn mt người. Tương t,  
vtrí các ng viên là con mt. Tcác ng viên này Chang và Hwang [127] cũng dùng mt phương thc  
xây dng mng neural như Rowley [48] để xác định như [111], tlchính xác hơn 80% trong nh xám.  
khuôn mt người. Phương pháp này có thxác định  
Dae và Nam [116] xem xét các đặc trưng không  
nhiu khuôn mt trong mt nh, các khuôn mt này thay đổi khi thay đổi tư thế ca khuôn mt bng  
cách xem xét các quan hhình hc. Sau đó ước  
6
lượng các tư thế ca khuôn mt ri xây dng dliu  
để xác định thông qua PCA. Tlchính xác là 76%.  
Jin [128] xây dng mt blc để xác định ng  
viên khuôn mt người theo màu da người. Từ ứng  
viên này tác gixác định khuôn mt người theo hình  
dáng khuôn mt và các quan hệ đặc trưng vthành  
phn khuôn mt, vi mt phi được chn làm gc  
ta độ để xét quan h. Tlchính xác cho khuôn  
mt chp thng trên 80%.  
c) Sc màu ca da  
Thông thường các nh màu không xác định trc  
tiếp trên toàn bdliu nh mà các tác gidùng  
tính cht sc màu ca da người (khuôn mt người)  
để chn ra được các ng viên có thlà khuôn mt  
người (lúc này dliu đã thu hp đáng k) để xác  
định khuôn mt người. Tôi strình bày chi tiết về  
mô hình hóa màu da người mt bài sau.  
d) Đa đặc trưng  
Gn đây có nhiu nghiên cu sdng các đặc  
trưng toàn cc như: màu da người, kích thước, và  
hình dáng để tìm các ng viên khuôn mt, ri sau đó  
sxác định ng viên nào là khuôn mt thông qua  
dùng các đặc trưng cc b(chi tiết) như: mt, lông  
mày, mũi, ming, và tóc. Tùy mi tác gissdng  
tp đặc trưng khác nhau [70, 186].  
b) Kết cu  
Khuôn mt con người có nhng kết cu riêng  
bit mà có thdùng để phân loi so vi các đối  
tượng khác. Augusteijn và Skufca cho rng hình  
dng ca khuôn mt dùng làm kết cu phân loi  
[147], gi là kết cu ging khuôn mt (face-like  
texture). Tính kết cu qua các đặc trưng thng kê thứ  
tthhai (SGLD) [183] trên vùng có kích thước  
16x16 đim nh. Có ba loi đặc trưng được xem xét:  
màu da, tóc, và nhng thkhác. Hai ông dùng mng  
neural vmi tương quan cascade [170] cho phân  
loi có giám sát các kết cu và mt ánh xạ đặc trưng  
ttchc Kohonen [199] để gom nhóm các lp kết  
cu khác nhau. Hai tác giả đề xut dùng phương  
pháp bu ckhi không quyết định được kết cu đưa  
vào là kết cu ca da hay kết cu ca tóc.  
Yachida đưa ra mt phương pháp xác định  
khuôn mt người trong nh màu bng lý thuyết logic  
m[156, 259, 260]. Ông dùng hai mô hình mờ để  
mô tphân bmàu da người và màu tóc trong không  
gian màu CIE XYZ. Năm mô hình hình dng ca  
đầu (mt thng và bn xoay xung quanh) để mô tả  
hình dáng ca mt trong nh. Mi mô hình hình  
dng là mt mu 2-chiu bao gm các ô vuông có  
kích thước mxn, mi ô có thcha nhiu hơn mt  
đim nh. Hai thuc tính được gán cho mi ô là: tỷ  
lmàu da và tltóc, chra tldin tích vùng da  
(tóc) trong ô so vi din tích ca ô. Mi đim nh sẽ  
được phân loi thành tóc, khuôn mt, tóc/khuôn mt,  
và tóc/nn trên cơ sphân bca mô hình, theo  
cách đó sđược các vùng ging khuôn mt và  
ging tóc. Mô hình hình dáng ca đầu sẽ được so  
sánh vi vùng ging khuôn mt và ging tóc. Nếu  
tương t, vùng đang xét strthành ng viên khuôn  
mt, sau đó dùng các đặc trưng mt-lông mày và  
mũi-ming để xác định ng viên nào slà khuôn  
mt tht s.  
Dai và Nakano dùng mô hình SGLD để xác định  
khuôn mt người [165]. Thông tin màu sc được kết  
hp vi mô hình kết cu khuôn mt. Hai tác gixây  
dng thut gii xác định khuôn mt trong không  
gian màu, vi các phn ta màu cam để xác định các  
vùng có thlà khuôn mt người. Mt thun li ca  
phương pháp này là có thxác định khuôn mt  
không chchp thng và có thcó râu và có kính.  
Mark và Andrew [12] dùng phân bmàu da và  
thut toán DoG (a Difference of Gauss) để tìm các  
ng viên, ri xác thc bng mt hthng hc kết  
cu ca khuôn mt.  
Sobottka và Pitas dùng các đặc trưng vhình  
dáng và màu sc để xác định khuôn mt người [241].  
Dùng mt ngưỡng để phân đon trong không gian  
màu HSV để xác định các vùng có thlà màu da  
người (vùng ging màu da người) [251, 252], các  
tin ng viên. Các thành phn dính nhau sẽ được xác  
định bng thut toán tăng vùng ở độ phân gii thô.  
Xem xét tin ng viên nào va khp hình dng  
Manian và Ross [88] dùng biến đổi wavelet để  
xây dng tp dliu kết cu ca khuôn mt trong  
nh xám thông qua nhiu độ phân gii khác nhau kết  
hp xác sut thông kê để xác định khuôn mt người.  
Mi mu scó chín đặc trưng. Tlchính xác là  
87%, tlxác định sai là 18%.  
7
ellipse sẽ được chn làm ng viên ca khuôn mt. blob. Mi vector đặc trưng bao gm ta độ ảnh và  
Sau đó dùng các đặc trưng bên trong như: mt và sc  
ming, được trích ra trên cơ scác vùng mt và  
màu  
được  
chun  
hóa,  
r
g
X = (x,y,  
,
) [218, 243]. Dùng  
ming sti hơn các vùng khác ca khuôn mt, sau  
cùng phân loi da trên mng neural để biết vùng  
ng viên nào là khuôn mt người và vùng nào không  
phi khuôn mt người. Tlchính xác là 85%.  
Da vào mc độ cân xng ca các mu khuôn  
mt người để xác định khuôn mt người [154]. Mt  
bphân loi màu da/không phi màu da dùng trong  
không gian màu YES cho phép làm mn các vùng kề  
đường cong không mn, sau khi lc các vùng có  
thlà màu da người. Mt mu khuôn mt dng  
ellipse được dùng để xem xét mc độ tương tca  
các vùng có cùng màu da người vi mu này thông  
qua khong cách Hausdorff [188]. Sau cùng, xác  
định tâm mt thông qua các hàm tính giá trda trên  
quan hcân đối ca khuôn mt và vtrí hai mt.  
Đỉnh ca mũi và tâm ca ming được ước lượng qua  
khong cách tâm mt. Mt hn chế ca phương pháp  
này là chxác định trên nh chp thng khuôn mt,  
chcó duy nht mt khuôn mt trong nh, và xác  
định được vtrí ca chai mt. Cũng có tác gidùng  
phương pháp tương tự để gii quyết [245].  
r + g+ b r + g+ b  
mt thut toán to các vùng liên kết li vi nhau để  
tăng kích thước ca blob và xem xét nếu ng viên  
dng blob nào tha mãn hình dáng kích thước khuôn  
mt thì xem đó là khuôn mt.  
Phm vi và màu sc được Kim [197] dùng để  
xác định khuôn mt người. Tính biu đồ chênh lch  
ri phân đon da trên biu đồ histogram vi giả  
thuyết các đim nh là nn scó cùng độ sâu và số  
lượng snhiu hơn các đim nh trong đối tượng.  
Dùng phân bGauss trong không gian màu RGB đã  
được chun hóa, được các ng viên ri dùng phân  
loi để xác định cui cùng ng viên nào là khuôn  
mt người. Cùng các tiếp cn này có Darrell [84].  
Hsu được xem là người khá thành công khi xác  
định khuôn mt người trong nh màu [1, 96]. Ông  
xây dng mt bphân loi để xác định các vtrí ca  
ng viên mt và ming da trên sc màu đặc trưng  
ca mt và ming. Trên quan hvkhong cách ca  
hai mt và ming để xác định ng viên nào slà  
khuôn mt thông qua biến đổi Hough để ng viên  
nào gn ging dng ellipse nht.  
Trái ngược vi phương pháp xlý trên đim  
nh, mt phương pháp được xây dng trên cu trúc,  
màu sc, và liên quan hình hc đã được đề nghị  
[262]. Đầu tiên dùng phân đon đa tl[144] để  
trích các vùng đồng đều trong nh da vào mô hình  
màu da người theo Gauss để được các vùng có  
màu cùng vi màu da người, gom các vùng này vào  
trong các vùng có hình dng ellipse. Mt vùng có  
hình dng ellipse được xác định là mt khuôn mt  
người nếu tn ti mt ming trong vùng đó. Tác giả  
cho biết có thxác định các khuôn mt các hướng  
khác nhau khi có thêm các đặc trưng phnhư: râu,  
mt kính.  
Jesorsky [270] xác định cnh ca các đối tượng  
trong nh ri so sánh hình dáng kết hp dùng  
khong cách Hausdorff để đo mc độ tương tca  
khuôn mt người vi các mu. Sau đó Kirchberg  
[17] ci tiến dùng mô hình Gen (Genetic Model) để  
phát sinh mô hình khuôn mt người tdliu ln  
xn sau khi phân đon trong nh xám kết hp  
khong cách Hausdorff. Mc độ chính xác khang  
85%.  
Yen và Nithianandan [66] dùng GA để trích các  
đặc trưng khuôn mt, như mt (lông mày), mũi, và  
ming. Áp dng hình thái khuôn mt ging hình  
ellipse để xác định khuôn mt bng GA trong nh  
màu. Phương pháp này cho phép gii quyết trong  
điu kin ánh sáng khác nhau, tư thế khuôn mt khác  
nhau.  
Kauth trình bày mt biu din dng blob để trích  
đặc trưng, mà đặc trưng này dùng tô tcó ý nghĩa  
cu trúc ca đa phca nh chp tvtinh [194].  
Mi vector đặc trưng ti mt đim nh bao gm các  
ta độ ca đim nh và liên quan theo các thành  
phn ph(hay các thành phn kết cu). Các đim  
nh này được gom nhóm bng cách dùng vector đặc  
trưng để có các vùng dính lin nhau, hoc có dng  
Chang [89] xem xét tính đa dng vmt ca  
khuôn mt người. Từ đây ông xây dng mng  
wavelet tích cc (Active Wavelet Network) để trích  
các đặc trưng ca khuôn mt ri dùng hai phương  
8
pháp làm gim schiu ca không gian đặc trưng là Sau đó tiếp tc tìm ming và lông mày để xác định  
LLE (Locally Linear Embedding) và LE (Lipschitz ng viên này có phi là khuôn mt người hay không.  
Embedding) và hc cu trúc đa dng này để xác định  
a) Xác định các mu trước  
khuôn mt.  
Sakai đã cgng thxác định khuôn mt người  
Daidi và Irek [117] trích các đặc trưng ca  
chp thng trong nh [232]. Ông dùng vài mu con  
khuôn mt bng sơ đồ phân btham số để xác định  
vmt, mũi, ming, và đường vin khuôn mt để mô  
khuôn mt người. Tlchính xác cho nh xám và  
hình hóa mt khuôn mt. Mi mu con được định  
khuôn mt được chp thng là 91.4%.  
nghĩa trong gii hn ca các đon thng. Các đường  
Ehsan và Jonh [125] dùng tp hsGabor  
thng trong nh được trích bng phương pháp xem  
wavelet các hướng khác nhau để trích các đặc  
xét thay đổi gradient nhiu nht và so khp các mu  
trưng ca khuôn mt. Sau đó dùng entropy cc bộ để  
con. Đầu tiên tìm các ng viên thông qua mi tương  
xác định khuôn mt trong nh xám và khuôn mt  
quan gia các nh con và các mu về đường vin.  
được chp thng hay ta thng nhưng có các vtrí  
Sau đó, so khp vi các mu con khác. Hay nói mt  
khác nhau. Tlchính xác là 94%.  
cách khác, giai đon đầu xem như là giai đon sơ  
Bao [281, 282] dùng sc thái màu da người để  
chế để tìm ng viên, giai đọan thhai là giai đon  
xác định ng viên trong nh màu. Tác giả đã xây  
tinh chế để xác định có tn ti hay không mt khuôn  
dng các lut mda vào hai loi đặc trưng: (1) bên  
mt người. Ý tưởng này được duy trì cho đến các  
ngoài và (2) bên trong. Đặc trưng bên ngoài gm: tỷ  
nghiên cu sau này.  
lchiu cao, din tích, chu vi, mc độ tròn, … Đặc  
Craw đưa ra mt phương pháp xác định khuôn  
trưng bên trong gm: quan hmc độ cân đối ca  
mt người da vào các mu vhình dáng ca các  
hai mt và ming cũng như tlkhong cách vi  
nh được chp thng (dùng vbngoài ca hình  
khuôn mt. Phương pháp này cho phép xác định  
dáng khuôn mt) [163]. Đầu tiên dùng phép lc  
khuôn mt nhiu tư thế, vtrí, mc độ nghiêng  
Sobel để tìm các cnh. Các cnh này sẽ được nhóm  
khác nhau trong môi trường phc tp. Đặc bit, tác  
li theo mt sràng buc. Sau đó, tìm đường vin  
giả đã xây dng bộ điu khin mờ để tách các khuôn  
ca đầu, quá trình tương tự được lp đi lp li vi  
mt dính ln nhau. Tlchính xác khong 87%-  
mi tlkhác nhau để xác định các đặc trưng khác  
89%.  
như: mt, lông mày, và môi. Sau đó Craw mô tmt  
3. Hướng tiếp cn da trên so khp mu  
phương thc xác định dùng mt tp có 40 mu để  
tìm các đặc trưng khuôn mt và điu khin chiến  
lược dò tìm [164].  
Trong so khp mu, các mu chun ca khuôn  
mt (thường là khuôn mt được chp thng) sẽ được  
xác định trước hoc xác định các tham sthông qua  
mt hàm. Tmt nh đưa vào, tính các giá trtương  
quan so vi các mu chun về đường vin khuôn  
mt, mt, mũi và ming. Thông qua các giá trtương  
quan này mà các tác giquyết định có hay không có  
tn ti khuôn mt trong nh. Hướng tiếp cn này có  
li thế là rt dcài đặt, nhưng không hiu qukhi tỷ  
l, tư thế, và hình dáng thay đổi (đã được chng  
minh). Nhiu độ phân gii, đa tl, các mu con, và  
các mu biến dng được xem xét thành bát biến về  
tlvà hình dáng.  
Govindaraju đề nghmt phương thc xác định  
khuôn mt người có hai giai đọan để phát sinh các  
githuyết khuôn mt và kim tra nó [177, 178, 179].  
Mt mô hình khuôn mt được xây dng trong các  
giai đon xác định đặc trưng bng các cnh. Các  
đặc trưng được mô tnhư các đường cong ca phía  
bên trái, đường vin tóc, phía bên phi ca khuôn  
mt được chp thng. Dùng phép toán Marr-Hildreth  
để xác định cnh. Sau đó dùng mt blc để loi bỏ  
các đối tượng không tham gia vào xây dng khuôn  
mt. Liên kết các cp ca các đon đường vin trên  
cơ smc độ kvà các hướng liên quan. Xác định  
các góc để phân đon đường vin thành các đường  
cong đặc trưng. Gán nhãn các đường cong đặc trưng  
bng cách kim tra thuc tính hình hc và các vtrí  
Oh [119] phân đon để tìm ng viên khuôn mt,  
tác gidùng các mu mt có trước để so khp vi  
các vùng quan tâm để tìm vtrí mt trong ng viên.  
9
liên quan trong láng ging ca nó. Ni các cp ca mt (như hai mt, hai má, và trán), quan hvmc  
các đường cong đặc trưng thông qua các cnh nếu độ sáng ca các vùng còn li thay đổi không đáng  
các thuc tính ca nó tương thích. So sánh các tlk. Xác định các cp tsca mc độ sáng ca mt  
ca các cp thuc tính cho mt cnh và n địng mt svùng (mt vùng ti hơn hay sáng hơn) cho ta mt  
giá trtương ng. Nếu giá trca mt nhóm ca ba lượng bt biến khá hiu qu. Các vùng có độ sáng  
đường cong đặc trưng (vi các nhãn khác nhau) thp đều được xem như mt mu tsmà là mu thô  
thì nhóm này strthành mt githuyết. Khi xác trong không gian nh ca mt khuôn mt vi độ  
định khuôn mt trong các bài báo thì thông tin phthích hp ít dùng để chn như các đặc trưng chính  
sẽ được dùng thêm đó là slượng người trong nh ca khuôn mt như hai mt, hai má, và trán. Lưu giữ  
để chn githuyết ti ưu [178] . Tlchính xác ca thay đổi độ sáng ca các vùng trên khuôn mt trong  
phương pháp này là 70%, tuy nhiên các khuôn mt mt tp thích hp vi các cp quan hsáng hơn – ti  
phi được chp thng và không bche khut. hơn gia các vùng nh. Mt khuôn mt được xác  
Venkatranman và Govindaraju dùng cách tiếp cn định khi mt nh tha tt ccác cp sáng hơn – ti  
tương t, nhưng dùng wavelet để trích cnh [257].  
hơn. Ý tưởng này xut phát tskhác bit ca  
Tsukamoto trình bày mt mô hình hiu qukhi cường độ gia các vùng kcc b, sau này được mở  
dùng mu khuôn mt (QMF) [253, 254]. Trong rng trên cơ sbiến đổi wavelet để biu din cho  
QMF , mi nh mu được chia thành nhiu khi, các xác định người đi b, xác định xe hơi, xác định  
đặc trưng hiu quả được ước lượng cho mi khi. khuôn mt [222]. Ý tưởng ca Sinha còn được áp  
Tham shóa mt mu khuôn mt theo: lightness và dng cho hthng thgiác ca robot [151, 236].  
edgeness là các đặc trưng trong mô hình. Sau đó Hình 5 cho thy mu ni bt trong 23 quan hệ được  
dùng các mu (đã được chia thành các khi) để tính định nghĩa. Dùng các quan hnày để phân loi, có  
giá trfaceness (mc độ là khuôn mt) ti mi v11 quan hthiết yếu (các mũi tên màu đen) và 12  
trí ca nh. Mt khuôn mt được xác định khi giá trquan hxác thc (các mũi tên xám). Mi mũi tên là  
faceness vượt mt ngưỡng đã được cho trước.  
mt quan h. Mt quan htha mãn mu khuôn mt  
Hình chiếu được dùng như các mu để xác định khi tlgia hai vùng vượt qua mt ngưỡng và 23  
khuôn mt người [233]. Dùng PCA (phân tích thành quan hnày vượt ngưỡng thì xem như xác định  
phn chính – Principal Component Analysis - PCA) được mt khuôn mt.  
để có mt tp hình chiếu cơ bn tcác mu khuôn  
mt, hình chiếu được mô tnhư mt mng các bit.  
Dùng đặc trưng hình chiếu riêng kết hp biến đổi  
Hough để xác định khuôn mt người. Sau đó mt  
phương pháp xác định da trên đa loi mu để xác  
định các thành phn ca khuôn mt được trình bày  
[244]. Phương pháp này định nghĩa mt sgiả  
Hình 5: Mt mu khuôn mt, có 16 vùng và 23 quan h(các mũi tên).  
thuyết để mô tcác khnăng ca các đặc trưng  
Phương pháp so khp mu theo thtự để xác  
định khuôn mt người do Miao trình bày [214]. Ở  
giai đon đầu tiên, nh sẽ được xoay t-20o đến 20o  
vi mi bước là 5o và theo tht. Xây dng nh đa  
độ phân gii, hình 1, ri dùng phép tóan Laplace để  
xác định các cnh. Mt mu khuôn mt gm các  
cnh mô tsáu thành phn: hai lông mày, hai mt,  
mt mũi, và mt ming. Sau đó áp dng heuristic để  
xác định stn ti ca khuôn mt trong nh, phương  
pháp này cho phép xác nhiu khuôn mt, nhưng kết  
khuôn mt. Vi mt khuôn mt scó mt tp giả  
thuyết, lý thuyết DepsterShafer [166]. Dùng mt  
nhân ttin cy để kim tra stn ti hay không ca  
các đặc trưng ca khuôn mt, và kết hp nhân ttin  
cy này vi mt độ đo để xem xét có hay không có  
khuôn mt trong nh.  
Sinha dùng mt tp nhcác bt biến nh trong  
không gian nh để mô tkhông gian các mu nh  
[238, 239]. Tư tưởng chính ca ông da vào sthay  
đổi mc độ sáng ca các vùng khác nhau ca khuôn  
10  
qukhông tt bng xác định mt khuôn mt (chp  
thng hoc xoay) trong nh xám.  
Iwata [39] xây dng mu mi đặc trưng gm  
bn đặc trưng theo bn hướmg: ngang, bên phi phía  
Wei và Lai [78] dùng blc để phân đon kết trên, đứng, và bên trái phía trên ca khuôn mt chp  
hp thut toán tìm láng ging gn nht xác định ng thng hoc gn thng trong nh xám. Để so khp  
viên khuôn mt, từ ứng viên này sau đó so khp vi tng phn ca mu kết hp xác sut các láng ging.  
các mu đã xác định trước để biết ng viên có phi Tlchính xác ca phương pháp này là gn 99%.  
là khuôn mt hay không. Tlchính xác là 80%.  
Keren [33] xây dng khái nim Antifaces để xác  
Darrell [84] dùng phân đon đề tìm ng viên, định khuôn mt người (tng quát cho các đối tượng  
dùng ng viên này để xác định khuôn mt người da 3-chiu). Da trên nhiu loi mu kết hp githuyết  
vào mu ri theo vết chuyn động ca người.  
phân bxác sut để tìm nhng đối tượng không có  
Dowdall dùng phca màu da người để xác mi tương quan để tìm khuôn mt người. Ông cho  
định ng viên. Sau đó chiếu các ng viên này để so biết, phương pháp này nhanh hơn eigenface và SVM  
sanh vi các mu có trước để xác định ng viên nào và mc độ chính xác gn tương đương.  
là khuôn mt người. Phương pháp này chxác định  
cho khuôn mt chp thng và gn thng, góc quay định ng viên khuôn mt khi so khp vi các mu  
khong t-10o đến 10o [86].  
đã hc trước. Sau đó tác gidùng mng wavelet thứ  
Feris [59] dùng mng wavelet thnht để xác  
Holst xây dng mt hthng tcác mu vi các hai để xác định các thành phn như mt, mũi, và  
đặc trưng kép [92]: (1) thành phn, gm: mt, mũi, ming thông qua các đặc trưng góc cnh. Tcác  
và ming; (2) hình dáng khuôn mt, trên độ phân thành phn này xem xét tính hòa hp để có quyết  
gii thp. Ông dùng hai phương pháp tìm kiếm trong định cui cùng ng viên nào là khuôn mt người.  
không gian dliu ca mình để xác định khuôn mt  
b) Các mu bbiến dng  
Yuille dùng các mu biến dng để mô hình hóa  
người.  
các đặc trưng ca khuôn mt, mô hình này có khả  
năng linh hot cho các đặc trưng khuôn mt [268].  
Trong hướng tiếp cn này, các đặc trưng khuôn mt  
được mô tbng các mu được tham shóa. Mt  
hàm năng lượng (giá tr) được định nghĩa để liên kết  
các cnh, đỉnh, và thung lũng trong nh để tương  
ng vi các tham strong mu. Mô hình này tt  
nht khi ti thiu hàm năng lượng qua các tham s,  
Mc dù kết qutt vi mu biến dng trong theo vết  
đối tượng trên đặc trưng không mô hình theo lưới,  
mt hn chế ca hướng tiếp cn này là các mu biến  
Hình 6: Phân nhóm dliu khuôn mt  
dng phi được khi to trong phm vi gn các đối  
và nhóm dliu không phi khuôn mt.  
tượng để xác định.  
Froba và Zink lc cnh ở độ phân gii thp ri  
Mt hướng tiếp cn da trên dường gp khúc  
dùng biến đổi Hough để so khp mu theo hướng  
(snake) [193, 208] và các mu để xác định khuôn  
cnh để xác định hình dáng khuôn mt dng chp  
mt [202]. Đầu tiên mt nh sẽ được làm xon li  
hình thng dng xám. Tlchính xác trên 91%  
bi mt lc làm mri dùng phép toán morphology  
[25].  
để làm ni bt cnh lên. Dùng mt đường gp khúc  
Shu và Jain xây dng ngnghĩa khuôn mt [85].  
có n đim nh (giá trn nh) để tìm và ước lượng  
Ngnghĩa theo hình dáng và vtrí các thành phn  
các đọan cong nh. Mi khuôn mt được xp xỉ  
khuôn mt. Hai ông tbngnghĩa này xây dng  
bng mt ellipse và biến đổi Hough, ri tìm mt  
mt đồ thquan hệ để ddàng so khp khi xác định  
ellipse ni tri nht. Mt tp có bn tham smô tả  
khuôn mt người.  
nt ellipse được dùng như ứng viên để xác định  
11  
khuôn mt. Vi mi ng viên, mt phương thc  
tương tnhư phương thc mu biến dng [268]  
dùng để xác định các đặc trưng mc chi tiết. Nếu  
tìm thy slượng đáng kcác đặc trưng khuôn mt  
và tha tlcân đối thì xem như đã xác định được  
mt khuôn mt. Lam và Yan cũng dùng đường gp  
khúc để xác định vtrí đầu vi thut toán greedy để  
cc tiu hóa hàm năng lượng [203].  
4. Hướng tiếp cn da trên din mo  
Trái ngược vi các phưong pháp so khp mu  
vi các mu đã được định nghĩa trước bi nhng  
chuyên gia, các mu trong hướng tiếp cn này được  
hc tcác nh mu. Mt các tng quát, các phương  
pháp theo hướng tiếp cn này áp dng các kthut  
theo hướng xác sut thng kê và máy hc để tìm  
nhng đặc tính liên quan ca khuôn mt và không  
phi là khuôn mt. Các đặc tính đã được hc trong  
hình thái các mô hình phân bhay các hàm bit số  
nên dùng có thdùng các đặc tính này để xác định  
khuôn mt người. Đồng thi, bài toán gim schiu  
thường được quan tâm để tăng hiu qutính toán  
cũng như hiu quxác định.  
Thay vì dùng đường gp khúc thì Huang và Su  
[13] dùng lý thuyết dòng chy để xác định đường  
vin khuôn mt da trên đặc tính hình hc. Hai ông  
dùng lý thuyết tp đồng mc (Level Set) để loang từ  
các khi động ban đầu để được các khuôn mt  
người.  
Lanitis mô tmt phương pháp biu din khuôn  
mt người vi chai thông tin: hình dáng và cường  
độ [204]. Bt đầu vi các tp nh được hun luyn  
vi các đường vin mu như đường bao mt, mũi,  
cm/má được gán nhãn. Dùng mt vector các đim  
mu để mô thình dáng. Tác gidùng mt mô hình  
phân bố đim (Point Distribution Model – PDM) để  
mô tvector hình dáng qua toàn bcác cá th. Dùng  
tiếp cn như Kirby và Sirovich [198] để mô tcường  
độ bngòai ca hình dáng đã được chun hóa. Mt  
PDM có hình dáng như khuôn mt dùng để xác định  
khuôn mt bng mô hình hình dáng tích cc (Active  
Shape Model - ASM) để tìm kiếm và ước lượng vị  
trí khuôn mt cũng như các tham svhình dáng.  
Các mnh ca khuôn mt được làm biến dng về  
hình dáng trung bình ri trích các tham scường độ.  
Các tham shình dáng và cường độ được dùng để  
phân loi. Cootes và Taylor áp dng cách tiếp cn  
này để xác định khuôn mt [161]. Đầu tiên, hai ông  
định nghĩa nt vùng hình chnht cha các đặc  
trưng quan tâm. Dùng phân tích nhân t[146] làm  
va các đặc trưng hun luyn để có mt hàm phân  
b. Có đuc các đặc trưng là ng viên nếu độ đo xác  
sut vượt qua mt ngưỡng khi dùng ASM. Sau khi  
hun luyn xong có thxác định khuôn mt người.  
Hướng tiếp cn theo ASM được mrng bng hai  
lc Kalman để ước lượng các tham svhình dáng  
và cường độ dùng để theo vết khuôn mt người  
[169].  
Có nhiu phương pháp áp dng xác sut thng  
để giquyết. Mt nh hay mt vector đặc trưng  
xut phát tmt nh được xem như mt biến ngu  
nhiên x, và biến ngu nhiên có đặc tính là khuôn mt  
hay không phi khuôn mt bi công thc tính theo  
các hàm mt độ phân lp theo điu kin  
và  
.
p(x | khoâng phaûi khuoân maët)  
p(x | khuoân maët)  
Có thdùng phân loi Bayes hoc khnăng cc đại  
để phân loi mt ng viên là khuôn mt hay không  
phi là khuôn mt. Không thcài đặt trc tiếp phân  
loi Bayes bi vì schiu ca x khá cao, bi vì  
và  
p(x | khuoân maët)  
p(x | khoâng phaûi khuoân maët)  
đa phương thc, và chưa thhiu nếu xây dng  
các dng tham shóa mt cách tnhiên cho  
p(x | khuoân maët) và  
.
p(x | khoâng phaûi khuoân maët)  
Có khá nhiu nghiên cu theo hướng tiếp cn này  
quan tâm xp xcó tham shay không có tham số  
cho  
p(x | khuoân maët)  
và  
p(x | khoâng phaûi khuoân maët).  
Các tiếp cn khác trong hướng tiếp cn da trên  
din mo là tìm mt hàm bit s(như: mt phng  
quyết định, siêu phng để tách dliu, hàm ngưỡng)  
để phân bit hai lp dliu: khuôn mt và không  
phi khuôn mt. Bình thường, các mu nh được  
chiếu vào không gian có schiu thp hơn, ri sau  
đó dùng mt hàm bit s(da trên các độ đo khong  
cách) để phân loi [255], hoc xây dng mt quyết  
định phi tuyến bng mng neural đa tng [48]. Hoc  
dùng SVM (Support Vector Machine) và các  
phương thc kernel, chiếu hoàn toàn các mu vào  
12  
không gian có schiu cao hơn để dliu bri rc các nh không có khuôn mt thì xut hin skhác  
hoàn toàn và ta có thdùng mt mt phng quyết nhau cũng không ít. Xác định scó mt ca mt  
định phân loi các mu khuôn mt và không phi khuôn mt trong nh thông qua tt ckhong cách  
khuôn mt [220].  
gia các vtrí trong nh và không gian nh. Khong  
cách này dùng để xem xét có hay không có khuôn  
mt người, kết qukhi tính toán các khong cách sẽ  
cho ta mt bn đồ vkhuôn mt. Có thxác định  
được tcc tiu địa phương ca bn đồ này. Có  
nhiu nghiên cu vxác định khuôn mt, nhn dng,  
và trích đặc trưng tý tưởng vector riêng, phân rã,  
và gom nhóm. Sau đó Kim [23] phát trin cho nh  
màu, bng cách phân đon nh để tìm ng để không  
gian tìm kiếm bt đi.  
a) Eigenface  
Kohonen đã đưa ra phương pháp dùng vector  
riêng để nhn dng khuôn mt [199], ông dùng mt  
mng neural đơn gin để chng tkhnăng ca  
phương pháp này trên các nh đã được chun hóa.  
Mng neural tính mt mô tca khuôn mt bng  
cách xp xcác vector riêng ca ma trn tương quan  
ca nh. Các vector riêng sau này được biết đến vi  
cái tên Eigenface.  
Kirby và Sirovich chng tcác nh có các  
khuôn mt có thể được mã hóa tuyến tính bng mt  
b) Hướng tiếp cn da trên phân bố  
Sung và Poggio phát trin mt hthng xác định  
slượng va phi các nh cơ s[198]. Tính cht khuôn mt người da trên phân b[246, 247], chng  
này da trên biến đổi Karhunen-Lòeve [176, 192, tbng cách dùng phân bcác các mu nh cùng  
211], mà còn được gi dưới mt cái tên khác là PCA mt lp đối tượng có thể được hc tcác mu  
[189] và biến đổi Hotelling [104]. Ý tưởng này được negative và positive. Hthng ca hai ông bao gm  
xem là ca Pearson trình bày đầu tiên vào năm 1901 hai thành phn: mô hình phân bca các mu là  
[223] và sau đó là Hotelling vào năm 1933 [185]. khuôn mt/không phi khuôn mt và mt phân loi  
Cho mt tp các nh hun luyn có kích thước n x đa tng da vào thgiác. Mi mu là khuôn mt và  
m được mô tbi các vector có kích thước m x m, không phi là khuôn mt được chun hóa và xlý  
các vector cscho mt không gian con ti ưu thành nh có kích thước 19 x 19 đim nh và xem  
được xác định thông qua li bình phương trung bình như mt vector hay mu có 361-chiu. Sau đó các  
khi chiếu các nh hun luyn vào không gian con mu được nhóm vào các nhóm, mi nhóm gm sáu  
này. Các tác gigi tp các vector cơ sti ưu này mu cùng loi là khuôn mt hoc nhóm không phi  
nh riêng sau đó gi cho đơn gin là vector riêng là khuôn mt bng thut toán k-trung bình (k-mean),  
ca ma trn hip phương sai được tính tcác nh hình 6. Mi nhóm sẽ được mô tnhư mt hàm  
khuôn mt đã vector hóa trong tp hun luyn. Nếu Gauss đa chiu vi mt nh trung bình và ma trn  
cho 100 nh, mà mi khuôn mt có kích thước hip phương sai. Hình 7 cho thy cách tính khong  
91x50 thì có thchdùng 50 nh riêng, trong khi cách ca hai ông. Hai độ đo khong cách dùng để  
vn duy trì được mt khnăng ging nhau hp lý tính khong cách gia nh đưa vào và tâm ca  
(giữ được 95% tính cht).  
nhóm. Thành phn khong cách đầu tiên là khong  
Turk và Pentland áp dng PCA để xác định và cách Mahalanobis được chun hóa gia hình chiếu  
nhn dng khuôn mt [255]. Tương t[198], dùng ca mu cn kim tra và tâm ca nhóm, tính trong  
PCA trên tp hun luyn nh các khuôn mt để sinh không gian con có schiu thp hơn, được mô tả  
các nh riêng (còn gi là eigenface) để tìm mt bng 75 vector riêng ln nht. Thành phn khong  
không gian con (không gian khuôn mt) trong không cách thhai là khong cách Euclide gia mu cn  
gian nh. Các nh khuôn mt được chiếu vào không kim tra và hình chiếu ca nó trong không gian con  
gian con này và được gom nhóm li. Tương tcác có 75- chiu này. Dùng hai khong cách này để xác  
nh không có khuôn mt dùng để hun luyn cũng định khong cách tmu cn kim tra đến tâm mt  
được chiếu vào cùng không gian con và gom nhóm nhóm. Tnay chúng ta có thbiết mu cn kim tra  
li. Các nh khi chiếu vào không gian khuôn mt thì gn nhóm nào nht. Bước cui cùng dùng mng đa  
không bthay đổi tính cht cơ bn, trong khi chiếu tng (Multilayer Perceptron Network – MLP) để  
13  
phân loi da vào 12 cp khong cách (có 12 nhóm) này đuc áp dng cho xác định khuôn mt, mã hóa  
khi mng này đã được hun luyn trước đó. Ddàng khuôn mt, và nhn dng. So sánh vi hướng tiếp  
chn mu khuôn mt để hun luyn, nhưng không eigenface cổ đin [255], phương pháp này cho thy  
dễ để chn mu không phi là khuôn mt để hun hiu quhơn trong xác định và nhn dng khuôn  
luyn. Dùng phương pháp bootstrap để gigii mt [196].  
quyết vn đề này. Bt đầu ttp nhkhông phi  
Yang sdng mt hn hp nhiu phân tích hsố  
khuôn mt trong tp mu hun luyn hun luyn làm tiêu chí xác định khuôn mt. Phân tích hsố  
MLP. Dùng bxác định khuôn mt người để xác (Factor Analysis – FA) là mt phương pháp thng  
định mt người trên mt dãy các nh ngu nhiên, sau để mô hình hóa tính hip biến cu trúc ca dữ  
đó chn các mu không phi khuôn mt người mà bliu có schiu cao bng cách dùng mlượng nhỏ  
xác định là khuôn mt người xem như là mu không các biến tim tàng. FA cũng tương tPCA trong vài  
phi khuôn mt người mi để hun luyn tiếp tc. khía cnh. Tuy nhiên, PCA không ging FA, không  
Phương pháp này bqua vn đề chn mu nào trong định nghĩa mt mô hình mt độ thích hp cho dữ  
các mu để tăng tính hiu qu, có nhiu nghiên cu liu. Hơn na, PCA không hiu qukhi có nhiu  
sau này vvn đề này [48, 220].  
độc lp trong các đặc trưng ca dliu. Tng hp từ  
[148, 150, 167, 168] cho thy các mu được chiếu từ  
các lp khác nhau vào không gian con PCA thường  
có thkhông hiu qu. Trong các trường hp khi các  
mu có mt cu trúc chc chn, dùng PCA scho  
kết qukhá tt. Hinton dùng FA để nhn dng các  
con s, ông đã so sánh FA và PCA [184]. Mt mô  
hình hn hp ca các phân tích hsố được mrng  
để nhn dng khuôn mt người [174]. Chai nghiên  
cu đều cho thy FA tt hơn PCA. Ttư thế, hướng,  
cm xúc, và nh hưởng ánh sáng trên din mo ca  
khuôn mt người, phân bcác khuôn mt trong  
không gian nh có thể được biu din tt hơn bng  
mt mô hình mt độ đa phương thc khi mi  
phương thc gicác đặc tính chc chn ca din  
mo chc chn ca khuôn mt. Họ đã trình bày mt  
mô hình theo xác sut khi dùng mt hn hp các  
phân tích hs(Mixture of Factor Analyzer – MFA)  
để xác định khuôn mt người. Dùng thut toán EM  
để ưc lượng các tham strong mô hình hn hp.  
Hình 7: (a) Khong cách gia mu cn kim tra và các nhóm;  
(b) hai thành phn khong cách.  
Moghaddam và Pentland đưa ra mt mô hình hc  
theo xác sut da trên ước lượng mt độ trong không  
gian có schiu cao bng không gian riêng [216].  
Hai ông dùng PCA để tìm không gian con để mô tả  
tt nht mt tp các mu khuôn mt người. Phương  
pháp này vn gili các mi tương quan tuyến tính  
chính trong dliu và loi bcác thyếu khác.  
Phương pháp này phân rã mt không gian vector  
thành hai không gian con mà hai không gian con này  
loi trln nhau và cũng bsung cho nhau: không  
gian con chính (không gian đặc trưng) và phn bù  
trc giao. Vì thế, mc tiêu mt độ được phân rã làm  
hai thành phn: mt độ trong không gian chính (da  
vào các thành phn chính) và phn bù trc giao,  
hình 8. Xây dng hthng hc da vào Gauss nhiu  
biến và Gauss hn hp, hthng này hc da trên  
thng kê các đặc trưng cc bca mt khuôn mt.  
Dùng các mt độ xác sut để xác định khuôn mt  
trên cơ sở ước lượng khnăng cc đại. Phươngpháp  
Hình 8: Phân rã mt nh khuôn mt vào không gian chính F  
và phn bù trc giao -F--.  
Phương pháp thhai [263] dùng bit stuyến  
tính Fisher (Fisher’s Linear Discriminant – FLD) để  
chiếu các mu tkhông gian nh có schiu cao  
sang mt không gian đặc trưng có schiu thp hơn.  
14  
Và trên cơ sphân tích bit stuyến tính, các tác giả  
đã xây dng phương pháp Fisherface [148] và  
nhng phương pháp khác [249, 269] gii quyết tt  
hơn phương pháp Eigenface [255] trong nhn dng  
khuôn mt. Khi dùng FLD để phân loi mu stt  
hơn PCA khi chiếu. Do đó, kết quphân loi trong  
không gian con đã được chiếu có thkhá hơn các  
phương pháp khác ([213] trình bày rõ vkích  
thước tp hun luyn). Trong phương thc thhai,  
các tác giả đã phân rã các mu hun luyn khuôn  
mt và không phi khuôn mt vào trong vài lp con  
bng ánh xttchc Kohonen (Kohonen’s Self  
Organizing Map – SOM) [199]. Hình 9 cho thy mt  
đại din ca mi lp khuôn mt. Tcác mu được  
gán nhãn li, tính các ma trn các giá trri rc về  
tính cht mu trong lp hay gia lp, bng cách  
đó phát sinh phép chiếu ti ưu trên cơ sFLD. Mi  
nhóm con, mô hình ha mt độ như mt phương  
thc Gauss vi các tham strong Gauss được ước  
lượng bng phương pháp cc đại hóa khnăng  
[167]. Quét trên toàn bộ ảnh đưa vào bng mt ca  
sri tính xác sut mc độ phthuc lp. Dùng lut  
quyết định da trên cc đại hóa khnăng để xác  
định có phi là khuôn mt hay không. Chai  
phương pháp trong [263] có tlchính xác là 92.3%  
cho MFA và 93.6% khi dùng FLD.  
c) Mng Neural  
Mng neural được áp dng khá thành công trong  
các bài toán nhn dng mu, như: nhn ký t, đối  
tượng, robot tvn hành. Xác định khuôn mt người  
có thxem là bài toán nhn dng hai loi mu, có  
nhiu kiến trúc mng neural đã được trình bày. Mt  
thun li khi dùng mng neural để xác định khuôn  
mt là tính khthi ca hthng hc khi có sphc  
tp trong lp ca các mu khuôn mt. Tuy nhiên,  
mt điu trngi là các kiến trúc mng đều tng  
quát, khi áp dng thì phi xác định rõ ràng slượng  
tng, slượng node, tlhc, …, cho tng trường  
hp cth, hình 10.  
Hình 10: Mô hình mng Neural theo Rowley  
Agui trình bày mng neural xlý có thtự  
[143]. Gia đon đầu dùng hai mng con song song  
mà dliu vào là các giá trcường độ ca nh ban  
đầu và các giá trcường độ ca nh đã được lc  
bng thut toán lc Sobel vi ca slc 3x3. Đầu  
vào ca mng giai đon hai bao gm dliu đầu ra  
thai mng con và các giá trị đặc trưng đã được  
trích ra, như: đặc trưng độ lch chun ca các giá trị  
đim nh trong mu đưa vào, mt tlca số đim  
nh trng trên tng số đim nh (đã chuyn sang nh  
nhphân) trong mt ca s, và đặc trưng thiết yếu về  
hình hc. Mt giá trxut ti giai đon hai cho biết  
có tn ti hay không khuôn mt người trong vùng  
đưa vào. Qua kinh nghim, tác gichra rng nếu  
các nh cùng mt kích thước thì mi dùng phương  
pháp này được.  
Propp và Samal phát trin mng neural để xác  
định khuôn mt người sm nht [224]. Mng neural  
ca hai ông gm bn tng vi 1,024 đầu vào, 256  
đầu kế tiếp trong tng n thnht, tám đầu kế tiếp  
trong tng n thhai, và hai đầu ra. Tương tnhư  
mng neural xlý theo thtự được đưa ra sau đó  
[251]. Phương pháp ca Soulie [242] duyt mt nh  
đưa vào vi mng neural có thi gian tr[258] (kích  
thước ca slà 20x25 đim nh) để xác định khuôn  
mt. Dùng biến đổi wavelet để phân rã nh các phn  
Hình 9: Đại din ca mi lp khuôn mt.  
Mi đại din tương ng tâm ca mt nhóm.  
Choi [31] xây dng hthng xác định khuôn mt  
người trong nh màu bng đặc trưng ca mt người  
thông qua phân đon để xác định ng viên khuôn  
mt da trên phân bmàu da ca khuôn mt.  
15  
có kích thước khác nhau để xác định khuôn mt.  
Theo đánh giá các phương pháp dùng mng  
Vaillant dùng mng neural dng xon để xác định neural để xác định khuôn mt người ca nhiu tác  
khuôn mt người [256]. Đầu tiên to các nh mu gi, thì nghiên cu ca Rowley [48, 231] được xem  
khuôn mt và không phi khuôn mt có kích thước là tt nht đối vi nh xám. Mt mng đa tng được  
20x20. Dùng mt mng neural, mng này đã được dùng để hc các mu khuôn mt và không phi  
hun luyn, để tìm các vtrí tương đối ca các khuôn tcác nh tương ng (da trên quan hệ  
khuôn mt các tlkhác nhau. Ri dùng mt cường độ, vmt không gian ca các đim nh)  
mng khác để xác định vtrí chính xác ca các trong khi Sung [246] dùng mng neural để xác định  
khuôn mt. Mng đầu tiên dùng để tìm các ng viên mt hàm bit scho mc đích phân loi mu có phi  
khuôn mt, ri dùng mng thhai để xác định ng là khuôn mt hay không da vào độ đo khong cách.  
viên nào that slà khuôn mt. Burel và Carel dùng Hai ông cùng dùng nhiu mng neural và vài  
mng neural đa tng có ít mu hơn vi thut toán phương thc quyết định để ci thin kết qu, trong  
Kohenen’s SOM để hc các mu khuôn mt và hình khi Burel và Carel [153] dùng mt mng đơn, và  
nn, mà các mu này đã được phân loi trước. Giai Vaillant [256] dùng hai mng để phân loi. Có hai  
đon xác định khuôn mt bao gm duyt trên mi thành phn chính để xlý: nhiu mng neural (xác  
nh đã được biến đổi từ ảnh bàn đầu các độ phân định mu nào là khuôn mt) và mt mô đun để quyết  
gii khác nhau. ti mi vtrí và kích thước ca sổ định (đưa ra quyết định cui cùng tnhiu kết quả  
duyt, điu chnh độ sáng. Mi ca sổ đã được xác định). Hình 9, thành phn đầu tiên ca phương  
chun hóa sẽ được phân loi bng MLP.  
pháp này là mt mng neural nhn mt vùng nh có  
Feraud và Bernier dùng mng neural kết hp tkích thước 20x20 đim nh và xut ra mt giá trc  
động [171, 172, 173]. Ý tưởng da trên [201] mng trong khong t-1 đến 1. Khi đưa vào mt nh, nếu  
kết hp tự động có năm tng thì có thbiu din mt kết qugn -1 thì nghĩa là mu này không phi là  
phân tích thành phn chính phi tuyến. Dùng mt khuôn mt người, nhưng nếu kết qugn 1 thì đây  
mng kết hp tự động để xác định các khuôn mt chính là khuôn mt người. Để xác định khuôn mt  
chp thng ri mrng bng cách xoay 60 độ ttrái có kích thước ln hơn 20x20 đim nh, cchn mt  
sang phi khuôn mt chp thng, mng này stn tlri duyt ri xác định, ri li thay đổi tlệ  
dng các trng skhi xây dng vi dliu khuôn (biến thiên tlnày do người xây dng quyết định).  
mt chp thng cho các tư thế mi. Hai ông cho biết Gn 1050 mu khuôn mt có kích thước, hướng, vị  
kết qucũng tương t[231]. Phương pháp này cũng trí, và cường độ khác nhau dùng để hun luyn  
dùng cho LISTEN [159] và MULTRAK [149].  
mng. Sgán nhãn cho mt, đỉnh ca mũi, góc cnh,  
Lin xây dưng mng neural quyết định trên cơ svà tâm ca ming ri dùng để chun hóa khuôn mt  
xác sut (Probabilistic Decision-based Neural vcùng mt tl, hướng, và vtrí. Thành phn thứ  
Network – PDBNN) [209]. Kiến trúc ca PDBNN hai là phương pháp trn các xác định chng chéo  
thì tương tmt mng có hàm trên nn tng tương nhau đưa ra quyết định. Phép toán logic  
ttia (Radial Basis Function – RBF) vi các lut (AND/OR) là mt quyết định đơn gin nht và  
hc được htrxác sut. Thay vì chuyn toàn bphương pháp bu cử được dùng để tăng tính hiu  
nh khuôn mt thành mt vector có các giá trcường qu. Rowley [48] đưa nhiu cách gii quyết bài toán  
độ để hun luyn cho mng neural, ông strích quyết khác nhau nhưng chi phí tính toán ít hơn Sung  
vector đặc trưng da trên cường độ và thông tin và Poggio nhưng tlchính xác cao hơn.  
cnh trong vùng khuôn mt có cha lông mày, mt,  
Mt gii hn ca phương pháp ca Rowley [48]  
và mũi. Hai vector đặc trưng đã được trích thì đưa và Sung [246] là chí có thxác định khuôn mt chp  
vào hai PDBNN và hp nht các kết quả để có kết thng và ta thng (nghiêng đầu). Sau đó Rowley  
quphân loi. Trên cơ s23 nh ca Sung và [49] ci tiến để có thxác định khuôn mt bxoay  
Poggio [248]. Ông đã cho mt skết quso sánh bng mng định hướng (Router Network), hình 11,  
vi các mng khác [48, 248].  
sthêm tiến trình xác định hướng khuôn mt và  
16  
xoay vli tư thế chun (chp thng), tuy nhiên khi Ông dùng 10,000,000 mu có kích thước 19x19  
quay li dliu như trên thì tlchính xác li gim đim nh, hthng ca ông có tlli ít hơn Sung  
đi, chcòn khong 76.9%.  
và Poggio [247], nhưng nhanh hơn gn 30 ln. SVM  
cũng có thdùng xác định khuôn mt người và  
người đi bvi phân tích Wavelet [219, 221, 222].  
Shihong và Masato sdng biến đổi wavelet  
Gabor để trích đặc trưng ca khuôn mt cũng như  
không phi khuôn mt để đưa vào cho SVM hc  
[15].  
Kang và Lee [14] xây dng ng dng cho robot  
đi bvượt qua con người và chướng ngi vt da  
trên xác định khuôn mt. Hai ông dùng phân đon  
ni kết hp SVM để phân loi. Tương tKui và  
Silva [22] cũng xây dng ng dng cho phòng thông  
minh bng cách xác định khuôn mt người da trên  
eigenface để làm dliu cho SVM hc phân loi.  
Bileschi và Heisele [18] dùng độ phân gii thp  
để hc thành phn khuôn mt trong nh xám vi các  
khuôn mt chp thng hoc ta thng cho SVM để  
xác định khuôn mt. Trong khi Terrillon [20] dùng  
tính cht màu da người để tìm ng viên kết hp  
SVM và các mô men Fourier-Mellin trc giao để  
gii quyết. Thay vì lc đơn gin, Shu-Fai và Kwan-  
Yee [72] dùng QuaTree để tìm ng viên khuôn mt  
người trong nh màu. Sau đó kết hp wavelet phân  
tích mu cho SVM hc trong nhiu tl. Đa phn  
khi cho SVM hc, các tác giả đều dùng hai lp  
khuôn mt và không phi khuôn mt để hc. Wang  
[75] chdùng mt lp khuôn mt trong nh màu để  
xác định khuôn mt người. Tlchính xác khong  
81%. Fang và Qiu [83] kết hp SVM và thut toán  
leo đồi để xác định khuôn mt. Zhang và Zhao [51]  
xây dng SVM da trên histogram ca khuôn mt  
và không phi khuôn mt để xác định khuôn mt. Tỷ  
lchính xác khong 92% cho khuôn mt chp thng  
hoc gn thng trong nh màu. Je li xây dng nhiu  
SVM để xác định khuôn mt người theo thtquyết  
định kết hp phương pháp bu ctrong nh màu  
[30].  
Hình 11: Mt ví dcho dliu vào và dliu ra ca mng định hướng.  
Lee [71] phát trin ý tưởng ca Rowley [48] cho  
xác định khuôn mt trong nh màu. Ông dùng mô  
hình màu da người bng Gauss để xác định các ng  
viên, sau đó loi bt nhng ng viên nào không tha  
mãn tính cht hình dáng gn ging hình ellipse. Cui  
cùng ông dùng mt mng neural đã được hun luyn  
để xác định khuônmt người. Tlxác định chính  
xác là 88.9%, còn tlxác định sai là 11.1%.  
Da trên nghiên cu ca Rowley [48], Hazem  
[108] ci tiến để tc độ xlý tăng lên đáng k.  
Kwolek [131] dùng blc Gabor để trích đặc  
trưng, dùng đặc trưng này để hun luuyn cho mng  
neural xon. Mng neural xon là mng neural mà  
mi node mi tng có thliên kết vi các làng  
ging cc btng phía trước ca nó. Tlchính xác  
là 87.5%.  
d) SVM  
Support Vector Machine (SVM) đã được Osuna  
[220] áp dng đầu tiên để xác định khuôn mt  
người. SVM được xem như là mt kiu mi dùng  
hun luyn để phân loi theo hàm đa thc. Trong khi  
hu hết các phương pháp khác hun luyn để phân  
loi (Mng Bayes, Nueral, RBF) đều dùng tiêu chí  
ti thiu li hun luyn (ri ro do kinh nghim),  
trong khi SVM dùng quy np (được gi là ti thiu  
ri ro cu trúc), mc tiêu là làm ti thiu mt bao  
bên trên trên li tng quát. Mt phân loi SVM là  
mt phân loi tuyến tính, dùng mt siêu phng để  
tách dliu. Da trên mt kết hp có các trng số  
ca mt tp con nhcác vector hun luyn, các  
vector này được gi là support vector. Ước lượng  
siêu phng thì tương đương gii mt bài toán tuyến  
tính bc hai. Osuna [220] đã phát trin mt phương  
pháp hiu quả để hun luyn mt SVM vi tlln  
để áp dng cho bài toán xác định khuôn mt người.  
Julien [129] xây dng mt cu trúc SVM mi  
gm nhiu SVM kết ni song song vi nhau hc dữ  
liu tkhông gian eigenface. Tlchính xác hơn  
93% trong nh xám vi khuôn mt đơn được chp  
thng.  
17  
e) Mng lc thưa  
gian có schiu thp hơn (dùng PCA để xây dng)  
và lượng thóa thành mt tp các mu có gii hn,  
và thng kê mi vùng đã được chiếu, các thng kê  
này được ước lượng tcác mu được chiếu xung  
không gian có schiu nhhơn, để mã hóa din  
mo cc b. Khi tlkhnăng ln hơn tlca các  
xác sut ưu tiên thì có khuôn mt người. Ông cũng  
cho thy so sánh gia phương pháp này và [48],  
hướng tiếp cn này cho phép xác định các khuôn  
mt bxoay và nhìn nghiêng. Schneiderman và  
Kanade sau đó kết hp biến đổi wavelet để xác định  
các khuôn mt nhìn nghiêng và xe hơi [58].  
Yang đề xut mt phương pháp dùng mng lc  
dư thưa (Sparse Network of Winnows – SNoW)  
[181, 230] để xác định khuôn mt người vi các đặc  
trưng khác nhau và biu din trong các tư thế khác  
nhau, và dưới điu kin ánh sáng khác nhau [264].  
Đồng thi nghiên cu phương pháp hc sơ khai tt  
như thế nào khi dùng các đặc trưng đa tl. SNoW  
là mt mng thưa dùng các hàm tuyến tính và dùng  
lc để cp nht lut [210]. Phương pháp này thích  
hp cho hc trong min khi các đặc trưng tim năng  
to các quyết định sai khác nhau mà không biết mc  
độ ưu tiên. Mt vài đặc tính ca kiến trúc hc này là  
rt hiếm dliu có phân chung, có chỉ định các đặc  
trưng và liên kết trong dliu, kthut quyết định,  
và cp nht lut hiu qu. Tlli là 5.9%, hiu quả  
cũng như các phương pháp khác [48, 160, 220, 237].  
Gundimada [4] da trên kiến trúc SNoW để xây  
dng ba mng, mng thnht phân loi da trên  
phân bcường độ, hai mng da trên phân bmàu  
da người để tìm ng viên kết hp phương pháp làm  
ni bt cnh. Xây dng các mu đầy đủ tư thế ca  
khuôn mt, mi bphân loi stương ng cho mt  
hướng, mi hướng lch nhau 10o.  
Rickert cũng dùng cách chn các đặc trưng cc  
b[229]. Các đặc trưng cc bộ được trích ra bng  
cách áp dng các blc đa tlvà nhiu độ phân  
gii trên dliu nh đưa vào. Dùng phương pháp  
gom nhóm dliu và mt Gauss hn hp để tìm  
phân bca các vector đặc trưng. Sau khi hun  
luyn cho mô hình và tinh chế, tính khnăng ca  
các vector đặc trưng ca các nh để phân loi.  
Phương pháp này cho kết qutt cho xác định  
khuôn mt người cũng như xe hơi.  
Thang [77] xác định khuôn mt người thông qua  
phân loi mng Bayes kết hp, hay còn gi là mng  
Bayes có cu trúc như rng (Forest-Structured  
Bayesian Network), để xác định các bit s. Kết hp  
phương pháp Bagging để xây dng phân loi tích  
hp nhm xác định khuôn mt người trong nh xám.  
Tlchính xác hơn 90%.  
f) Phân loi Bayes  
Trái ngược vi các phương pháp trong [48, 220,  
248] da vào din mo trên toàn khuôn mt,  
Schneiderman và Kanade mô tmt phân loi naive  
Bayes để uc lượng xác sut để ni các din mo ti  
vtrí cc btrên khuôn mt và vtrí ca các mu  
khuôn mt người (các vùng con trên khuôn mt)  
trong nhiu độ phân gii [73, 237]. Hai ông nhn  
mnh tính cht din mo khuôn mt vtrí cc bộ  
bi vì vi vài mu vtrí cc bca mt đối tượng  
scó tính cht duy nht, cường độ xung quanh mu  
mt thì đặc bit hơn vtrí má. Đây là hai lý do để  
dùng phân loi naive Bayes (không xem xét thng  
kê nhng phthuc gia các vùng). Đầu tiênphân  
loi này cung cp ước lượng tt hơn ca các hàm  
mt độ điu kin ca các vùng này. Thhai, mt  
phân loi Bayes cung cp mt dng hàm ca theo  
xác sut để nhn thng kê ca din mo vtrí cc  
bvà vtrí ca nó trên đối tượng. Ti mi tl, mt  
nh khuôn mt người được phân rã làm bn vùng  
hình chnht con. Chiếu các vùng này xung không  
Nam và Rhee [110, 123] xây dng mng Bayes  
hc phân loi theo ngcnh: màu da, ánh sáng, và  
kết cu khuôn mt và kết hp mng FuzzyARTđể  
xác định khuôn mt người trong nh. Hai tác ginày  
cũng dùng thêm khong cách Mahalanobis [122] khi  
kết hp mng RBF và FuzzyART để xác định khuôn  
mt có nhiu tlkhác nhau. Hai tác giphát trin  
bng cách dùng nhiu phân loi Bayes để chn ng  
viên thông qua các đặc trưng thông tin vcường độ  
và kết cu ca khuôn mt [126]. Tlchính xác hơn  
87%.  
Lee và Kim [120] dùng đặc trưng Haar wavelet  
1-chiu để hun luyn cho mng Bayes để xác định  
nhiu khuôn mt chp thng trong nh xám thông  
qua PDF ca các mu khuônmt người và mu  
18  
không phi khuôn mt người. Tlchính xác là tvà mt quan sát được xem như mt khi các đim  
98%. nh, hình 12a và hình 13. Áp dng mt định hướng  
Zhu [97] dùng wavelet để trích các tham số đặc theo xác sut để chuyn ttrng thái này sang trng  
trưng da vào histogram ri dùng mng Bayes đã thái khác, hình 12b, dliu nh được mô hình hóa  
được hc để xác định khuôn mt người trong nhiu bng phânbGauss nhiu biến. Mt chui quan sát  
tlkhác nhau.  
bao gm tt cgiá trcường độ tmi khi. Kết quả  
Duy Nguyen [280] dùng blc Sobel để xác xut ra cho biết quan sát thuc lp nào. HMM được  
định các đặc trưng ri dùng phân loi naive Bayes dùng để nhn dng khuôn mt người và xác định  
như Schneiderman và Kanade để xác định khuôn khuôn mt người. Samaria [235] dùng năm trng  
mt người.  
thái tương ng năm vùng, hình 12b để mô hình hóa  
tiến trình xác định khuôn mt người. Ông hun  
luyn tng vùng cho HMM. Mi tình trng sphụ  
trách xem xét vùng tương ng để đưa ra quyết định  
phù hp. Nếu kết quxem xét cui cùng vượt qua  
mt ngưỡng thì quan sát này slà khuôn mt người.  
g) Mô hình Markov n  
Mt githuyết quan trng ca mô hình Markov  
n (Hidden Markov Model – HMM) là các mu có  
thể được đặc tính hóa như các tiến trình ngu nhiên  
có tham svà các tham snày được ước lượng  
chính xác, đây là mt trong nhng định nghĩa rõ  
ràng. Khi phát trin HMM để gii quyết bài toán  
nhn dng mu, phi xác định rõ có bao nhiêu trng  
thái n đầu tiên cho hình thái mô hình. Sau đó, hun  
luyn HMM hc xác sut chuyn tiếp gia các trng  
thái tcác mu, mà mi mu được mô tnhư mt  
chui các quan sát. Mc tiêu hun luyn HMM là  
Hình 12: Mô hình Markov n:  
(a) các vector quan sát để hun luyn cho HMM;  
(b) năm trng thái n.  
Samaria và Young dùng HMM 1-chiu (hình  
cc đại hóa xác sut ca quan sát tdliu hun 12) và 2-chiu (hình 13) để trích đặc trưng khuôn  
luyn bng cách điu chnh các tham strong mô mt dùng để nhn dng khuôn mt [234, 235]. HMM  
hình HMM thông qua phương pháp phân đon khai thác cu trúc ca khuôn mt tuân theo các  
Viterbi chun và các thut toán Baum-Welch [227]. chuyn tiếp trng thái. Tcác cùng có đặc trưng  
Sau khi hun luyn xong, da vào xác sut để xác quan trng như: tóc, trán, mt, mũi, và ming, hai  
định mt quan sát thuôc lp nào.  
ông phân tích theo tnhiên ttrên xung dưới, mi  
Mt cách trc quan, có thchia mt mu khuôn vùng được thiết kế thành mt trng thái 1-chiu. Mi  
mt người thành nhiu vùng khác nhau như đầu, nh được phân đon chun thành năm vùng theo thứ  
mt, mũi, ming, và cm. Có thnhn dng mt mu tttrên xung dưới to thành năm trng thái. Hai  
khuôn mt người bng mt tiến trình xem xét các ông dùng phân đon Viterbi thay cho phân đon  
vùng quan sát theo mt thtthích hp (ttrên chun và các tham strong HMM được tái ước  
xung dưới, ttrái qua phi). Thay vì tin tưởng vào lượng bng thut toán Baum-Welch. Tương tự  
mc độ chính xác vtrí lề để dùng cho các phương [234], Nefian và Hayes dùng HMM và biến đổi  
pháp da trên so khp hay da trên din mo (nơi Karhunen Lòeve (Karhunen Lòeve Tranform –  
xut hin các đặc trưng như mt và mũi cn xác định KLT) để xác định khuôn mt người và nhn dng  
vtrí ltt để ly được toàn bchi tiết ca đặc [217]. Thay vì dùng các giá trcường độ thô, các  
trưng). Mc tiêu ca hướng tiếp cn này là kết hp vector quan sát sbao gm các hs(dùng KLT để  
các vùng đặc trưng khuôn mt vi các trng thái ca có) thì kết qustt hơn [234], và tlchính xác  
mô hình. Thường các phương pháp da vào HMM khi dùng HMM 2-chiu (hình 13) là 90%.  
sxem xét mt mu khuôn mt như mt chui các  
vector quan sát, vi mi vector là mt dãy các đim  
nh, hình 12a và hình 13. Trong quá trình hun  
luyn và kim tra, mt nh được quét theo mt thứ  
19  
Hammersley-Clifford, mt MRF có thể được đặc  
tính hóa tương đương bng mt phân bGibbs và  
các tham sthường cc đại hóa sau khi ước lượng  
[225]. Như mt sla chn, các phân khuôn mt  
người và không phi khuôn mt có thể được ước  
lượng qua các histogram. Dùng thông tin quan hệ  
Kullback, tiến trình Markov cc đại hóa bit strên  
cơ sthông tin gia các lp để xác định khuôn mt  
người [160, 207].  
Hình 13: Xác định khuôn mt bng HMM các trng thái, mi trng thái  
li có nhng trng thái nhbên trong: trng thái trán có ba trng thái nhỏ  
bên trong; trng thái mt có năm trng thái nhbên trong.  
Lew áp dng thông tin quan hKullback [162]  
kết hp hàm xác sut p(x) khi mu là khuôn mt  
người và q(x) khi mu không phi là khuôn mt  
người để xác định khuôn mt người [207]. Ông dùng  
100 cá thkhuôn mt người gm chin quang cnh để  
ước lượng phân bca khuôn mt. Dùng 143,000  
mu không phi khuôn mt để ước lượng hàm mt  
độ xác sut (PDF) thông qua histogram. Từ đây  
chn được các đim nh giàu thông tin nht (Most  
Informative Pixel – MIP) để cc đại hóa thông tin  
quan hKullback gia p(x) và q(x) (có được mt  
phân tách lp cưc đại). Phân bMIP tp trung các  
vùng mt và ming, nhưng bqua vùng mũi. MIP  
được dùng để được các đặc trưng tuyến tính dùng  
cho phân loi và mô tbng phương pháp ca  
Fukunage và Koontz [175]. Dùng mt ca sduyt  
trên tòan bộ ảnh để xây dng khong cách tkhông  
gian khuôn mt (Distance From Face Space –  
DFFS), được định nghĩa [283]. Nếu DFFS đến  
không gian con khuôn mt ngn hơn khong cách  
đến không gian con không phi khuôn mt, hình 8,  
thì xem như đã xác định được khuôn mt trong ca  
s.  
Rajagopalan đưa ra hai phương pháp xác sut để  
xác định khuôn mt người [228]. Tương phn vi  
[248], dùng mt tp các Gauss nhiu biến để mô  
hình hóa phân bca khuôn mt người, phưong  
pháp đầu tiên trong [228] dùng htng kê có thtự ở  
mc cao hơn (Higher Order Statistic - HOS) để ước  
lượng cường độ. Tương t[248], các phân bkhông  
biết ca khuôn mt và không phi không mt được  
gom nhóm bng sáu hàm cường độ da trên HOS  
ca các mu. Như trong [246], sdng tri giác nhiu  
tng để phân loi, mt vector đưa vào xlý gm  
mười hai đo lường khong cách gia mu nh và  
mười hai nhóm. Tiếp cn này da trên cơ ssinh  
mt dãy quan sát từ ảnh ri dùnh HMM hc các  
tham stương ng. Kết quca ông cho thy chai  
phương pháp HOS và HMM đều có kết quxác định  
khuôn mt người cao hơn [48, 248], nhưng nhiu  
xác định nhm hơn.  
Filareti dùng đặc trưng sc màu kết hp thông  
tin về độ sâu ca nh làm dliu đầu vào dy cho  
HMM để xác định khuôn mt người [63]. Phương  
pháp này cho phép gii quyết vn đề về điu kin  
hình nn, độ sáng, che khut, tư thế khuôn mt.  
Hong [121] xây dng mô hình Markov n hc  
dliu da trên các đặc trưng Haar-like để xác định  
khuôn mt người. Tlchính xác là 96%.  
Thông tin quan hKullback cũng được  
Colmenarez và Huang dùng để cc đại hóa bit số  
trên cơ sthông tin gia các mu negative và  
positive ca khuôn mt [160]. Phân tích các nh từ  
tp hun luyn ca mi lp (lp khuôn mt người và  
lp không phi khuôn mt người) như các quan sát  
trong tiến trình ngu nhiên và đaược đặc tính hóa  
bng hai hàm xác sut. Hai ông dùng mt hc các  
quá trình xlý Markov ri rc để mô hình các mu  
khuôn mt và hình nn ri ước lượng mô hình xác  
sut tương ng. Quá trình hc được chuyn thành  
bài tóan ti ưu để chn được tiến trình cc đại bit  
strên cơ sthông tin gia hai lp. Tính tlkhả  
h) Hướng tiếp cn lý thuyết thông tin  
Thuc tính trong không gian ca mu khuôn mt  
có thể được mô hình hóa qua nhiu din mo khác  
nhau. Dùng ngcnh để phân đon là mt phương  
pháp hiu qu, xác định ngcnh thông qua các  
đim nh lân cn. Lý thuyết trường ngu nhiên  
Markov (Markov Random Field – MRF) cung cp  
mt tin li và cách phù hp để mô hình hóa các  
thc thda vào ngcnh như các đim nh và các  
đặc trưng có mi tương quan. Theo định lý  
20  
Tải về để xem bản đầy đủ
pdf 28 trang yennguyen 13/04/2022 6160
Bạn đang xem 20 trang mẫu của tài liệu "Tổng quan các phương pháp xác định khuôn mặt người", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • pdftong_quan_cac_phuong_phap_xac_dinh_khuon_mat_nguoi.pdf