Báo cáo nghiên cứu khoa học Kỹ thuật định danh khuôn mặt dựa vào mẫu nhị phân
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC QUỐC TẾ SÀI GÒN
---------------------------
Lê Bùi Phương An
Nguyễn Lê Huy Phất
KỸ THUẬT ĐỊNH DANH KHUÔN MẶT DỰA
VÀO MẪU NHỊ PHÂN
BÁO CÁO
NGHIÊN CỨU KHOA HỌC
Ngành: Khoa học máy tính
TP. HỒ CHÍ MINH, tháng 5 năm 2021
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC QUỐC TẾ SÀI GÒN
---------------------------
VÕ ANH TIẾN
KỸ THUẬT ĐỊNG DANH KHUÔN MẶT DỰA
VÀO MẪU NHỊ PHÂN
BÁO CÁO
NGHIÊN CỨU KHOA HỌC
Ngành: Khoa học máy tính
CÁN BỘ HƯỚNG DẪN KHOA HỌC: TS. VĂN THIÊN HOÀNG
TP. HỒ CHÍ MINH, tháng 5 năm 2021
CÔNG TRÌNH ĐƯỢCHOÀNTHÀNHTẠI
TRƯỜNG ĐẠI HỌC QUỐC TẾ SÀI GÒN
Giảng viên hướng dẫn khoa học: ThS. Võ Anh Tiến
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Đề tài được bảo vệ tại trườ ng Đại học Quốc tế Sài Gòn
ngày … tháng … năm …
Thành phần Hội đồng đánh giá đề tài gồm:
TT
1
Họ và tên
Chức danh Hội đồng
Chủ tịch
2
Phản biện 1
3
Phản biện 2
4
Ủy viên
5
Ủy viên, Thư ký
Xác nhận của Chủ tịch Hội đồng đánh giá đề tài sau khi đề tài đã
chữa (nếu có).
được sửa
Chủ tịch Hội đồng đánh giá đề tài
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
TRƯỜNG ĐH QUỐC TẾ SÀI GÒN
KHOA CÔNG NGHỆ THÔNG TIN
TP. HCM, ngày..… tháng….. năm 20..…
NHIỆM VỤ ĐỀ TÀI
Họ tên học viên:
Giới tính:
Nơi sinh:
MSSV:
Ngày, tháng, năm sinh:
Ngành: Khoahọc máy tính
I- Tên đề tài:
Kỹ thuật định danh khuôn mặt dựa vào mẫu nhị phân.
.................................................................................................................................................
.................................................................................................................................................
II- Nhiệmvụ và nội dung:
Nhiệm vụ tổng quát của đề tài là: Đề xuất được phương pháp mới để định danh
khuôn mặt dựa vào mẫu nhị phân, trên cơ sở nghiên cứu các hướng tiếp cận mẫu
nhị phân liên quan nhằm đạt độ chính xác nhận dạng khuôn mặt cao (so với
phương pháp của Kra'l và các đồng sự).
III- Ngày giao nhiệm vụ:
IV- Ngày hoàn thành nhiệm vụ:
V- Giảng viên hướng dẫn: ThS. Võ Anh Tiến
.................................................................................................................................................
.................................................................................................................................................
GIẢNG VIÊN
H
Ư
ỚNG DẪN
KHOA QUẢN LÝ
(Họ tên và chữ ký)
(Họ tên và chữ ký)
LỜI CAM ĐOAN
Chúng tôi xin cam đoan đây là công trình nghiên cứu của riêng chúng tôi. Các
số liệu, kết quả nêu trong đề tài là trung thực và chưa từng được ai công bố trong
bất kỳ công trình nào khác.
Chúng tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện đề tài
này đã được cảm ơn và các thông tin trích dẫn trong đề tài đã được chỉ rõ nguồn
gốc.
Sinh viên thực hiện
i
LỜI CẢM ƠN
Để hoàn thành đề tài này, chúng em xin tỏ lòng biết ơn sâu sắc nhất đến ThS.
Võ Anh Tiến, người đã tận tình hướng dẫn trong suốt quá trình viết luận văn.
Tôi cũng xin chân thành cảm ơn quý Thầy, Cô trong khoa Công nghệ thông
tin, trường Đại học Quốc tế Sài Gòn đã tận tình truyền đạt kiến thức. Với vốn kiến
thức được tiếp thu trong quá trình học không chỉ là nền tảng cho quá trình nghiên
cứu mà còn là hành trang quý báu để chúng em có thể bước vào đời một cách vững
chắc và tự tin.
Cuối cùng, tôi xin kính chúc quý Thầy, Cô dồi dào sức khỏe và thành công
trong sự nghiệp, đạt được nhiều thành công tốt đẹp trong công việc và cuộc sống.
Sinh viên thực hiện
ii
TÓM TẮT
Nghiên cứu này trình bày phương pháp mới cho nhận dạng khuôn mặt dựa vào mẫu nhị
phân cục bộ (LBP). Mẫu nhị phân cục bộ xem xét các điểm xung quanh điểm trung tâm
trong vùng nhị phân cục bộ để tính toán các đặc trưng và đặc điểm riêng biệt trên khuôn
mặt, nhưng bị ảnh hưởng bởi nhiễu, độ lệch và điều kiện ánh sáng. Trong nghiên cứu này,
đề xuất phương pháp mẫu nhị phân bền vững (RLBP) nhằm mở rộng, xem xét nhiều điểm
ảnh khác nhau để tính vector đặc trưng, đồng thời xét thêm điểm trung tâm so với trung bình
các điểm trong vùng cục bộ. Nhờ việc giảm cường độ điểm ảnh và xem xét giá trị điểm
trung tâm nên phương pháp được đề xuất loại bỏ nhiễu tốt, không bị ảnh hưởng bởi điều
kiện ánh sáng. Phương pháp đề xuất được thử nghiệm trên hai bộ dữ liệu: ORL [1], YaleB
[2]. Qua thực nghiệm cho thấy, phương pháp đề xuất trong đề tài này đạt độ đo chính xác
tốt hơn các phương pháp khác.
iii
ABSTRACT
This paper presents a new method for face recognition based on local binary pattern
(LBP). Local binary samples look at points around the central point in the binary locality
to calculate specific facial features and characteristics, but are affected by noise,
deviation, and light conditions. In this study, a robust binary sample (RLBP) model was
proposed to expand, considering various pixels for vector specificity, while adding a
central point to the average of points in the lump area. By reducing the pixel intensity
and considering the center point value, the proposed method eliminates interference,
which is not affected by lighting conditions. The proposed method was tested on three
sets of data: ORL [1], YaleB [2]. Experimental results show that the method proposed in
this thesis has better accuracy than other methods.
iv
MỤC LỤC
LỜI CAM ĐOAN..........................................................................................................i
LỜI CẢM ƠN ...............................................................................................................ii
TÓM TẮT.................................................................................................................. iii
MỤC LỤC ...................................................................................................................v
DANH MỤC BẢNG ....................................................................................................x
DANH MỤC HÌNH VẼ ..............................................................................................xi
CHƯƠNG 1. TỔNG QUAN....................................................................................1
1.1 Giới thiệu ........................................................................................................1
1.2 Hệ thống nhận dạng khuôn mặt .......................................................................5
1.3 Mục tiêu của đề tài ..........................................................................................7
1.4 Bố cục luận văn...............................................................................................7
2.2.1 Đặc trưng mẫu nhị phân cục bộ...............................................................24
v
2.2.2 Đặc trưng mẫu nhị phân bất biến ............................................................27
2.2.3 Đặc trưng mẫu nhị phân cải tiến..............................................................28
2.3 Kết luận.........................................................................................................32
3.1 Ý tưởng thuật toán.........................................................................................33
3.2 Ví dụ minh họa..............................................................................................36
3.3 Kết luận.........................................................................................................37
4.2.1 Thống kê vét lân cận cạn.........................................................................40
4.2.2 Thống kê vét lân cận sâu.........................................................................44
4.2.3 Phương pháp thống kê ............................................................................45
4.2.4 Nhận xét .................................................................................................45
4.3.1 Thống kê lân cận cạn ..............................................................................48
4.3.2 Thống kê lân cận sâu ..............................................................................51
4.3.3 Phương pháp thống kê ............................................................................52
4.3.4 Nhận xét .................................................................................................53
vi
4.4 Thời gian thực hiện .......................................................................................53
CHƯƠNG 5. KẾT LUẬN......................................................................................55
5.1 Kết quả làm được ..........................................................................................55
5.2 Hướng phát triển ...........................................................................................55
TÀI LIỆU THAM KHẢO ..........................................................................................55
vii
DANH MỤC TỪ VIẾT TẮT VÀ TỪ KHÓA
STT Từ viết tắt Tiếng Anh
Ý nghĩa tiếng Việt
Mẫu nhị phân cục bộ
1
2
LBP
PCA
Local binary patterns
Principal Components Analysis
Phân tích thành phần chính
Phân tích tách lớp tuyến
tính
3
4
LDA
DFD
Linear Discriminant Analysis
Discriminant face descriptor
Phân biệt bộ mô tả khuôn
mặt
5
6
BoW
LQP
Bag of Words
Đặc trưng túi từ
Local quantized pattern
Mẫu lượng tử cục bộ
Biểu đồ mật độ lệch mức
xám theo hướng
7
HOG
Histogram of Oriented Gradient
8
9
LPQ
Local Phase Quantization
Định lượng đoạn cục bộ
NMF
Nonnegative Matrix Factorization Hệ số ma trận không âm
Phép biến đổi đặc trưng bất
Scale Invariant Feature Transform
biến về tỉ lệ.
SIFT
10
11 AU
Action Units
Đơn vị hành động
Two-dimensional Principle
Component Analysis
Two-dimensional Linear
Discriminant Analysis
Variance Local Binary Patterns
Kỹ thuật phân tích thành
phần chính hai chiều
Kỹ thuật phân tích tách lớp
tuyến tính hai chiều
Mẫu nhị phân bất biến
Cải tiến mẫu nhị phân cục
bộ
12 2D-PCA
13 2DLDA
14 VAR-LBP
15 ILBP
Improve Local Binary Patterns
Neighbors Local Binary Patterns
16 NILBP
Mẫu nhị phân chuẩn hóa
viii
17 EN-LBP
18 LTP
Enhanced Local Binary Patterns
Local Ternary Patterns
Mẫu nhị phân tăng cường
Mẫu tam phân cục bộ
Mẫu nhị phân bền vững
19 RLBP
Robust Local Binary Patterns
ix
DANH MỤC BẢNG
thuật toán khác trên cơ sở dữ liệu ORL.......................................................................41
với các thuật toán khác trên cơ sở dữ liệu ORL. .........................................................42
với các thuật toán khác trên cơ sở dữ liệu ORL. .........................................................44
thuật toán khác trên cơ sở dữ liệu YaleB.....................................................................48
với các thuật toán khác trên cơ sở dữ liệu YaleB. .......................................................49
các thuật toán khác trên cơ sở dữ liệu YaleB. .............................................................51
x
DANH MỤC HÌNH VẼ
Hình 1.1: Các dạng sinh trắc học phổ biến....................................................................1
Hình 1.2: Hệ thống nhận dạng khuôn mặt.....................................................................5
Hình 1.3: Minh họa bài toán định danh (a) và xác thực (b). ..........................................6
Hình 2.1: Đặc trưng hình học [29]................................................................................9
Hình 2.3: Biễu diển đặc trưng dựa vào bộ lọc Gabor [29]...........................................12
Hình 2.4: Biểu diễn đặc trưng túi từ BoW [29]. ..........................................................13
Hình 2.5: Đặc trưng GP-NMF [29].............................................................................13
Hình 2.6: Đặc trưng mã hóa phân rã [29]....................................................................14
Hình 2.10: Bộ lọc làm trơn IC [29].............................................................................18
Hình 2.12: Biểu diễn biến đổi tự do [29].....................................................................20
Hình 2.13: Đặc trưng BoW theo thời gian [29]...........................................................21
Hình 2.14: Ví dụ LBP và độ tương phản cục bộ C......................................................24
Hình 2.15: Tập hợp các điểm xung quang Ptt. .............................................................25
Hình 2.16: Các biến thể của LBP................................................................................26
Hình 2.17: Bảng thống kê các mẫu của uniform LBP. ................................................27
Hình 2.18: Thể hiện trọng số của ILBP8,1 và ILBP4,1...................................................29
Hình 2.19: Ví dụ minh họa LTP cơ bản......................................................................30
Hình 2.20: Biểu đồ thể hiện thủ tục EN_LBP. ............................................................31
Hình 3.1: Minh họa ý tưởng thuật toán đề xuất...........................................................34
Hình 3.2: Biểu đồ thể hiện thủ tục. .............................................................................34
xi
Hình 3.3: Ví dụ RLBP................................................................................................37
toán đề xuất RLBP trên cơ sở dữ liệu ORL.................................................................39
dữ liệu ORL. ..............................................................................................................41
sở dữ liệu ORL...........................................................................................................42
sở dữ liệu ORL...........................................................................................................44
RLBP trên cơ sở dữ liệu YaleB. .................................................................................47
dữ liệu YaleB. ............................................................................................................49
sở dữ liệu YaleB.........................................................................................................50
sở dữ liệu YaleB.........................................................................................................52
xii
CHƯƠNG 1. TỔNG QUAN
1.1 Giới thiệu
Sinh trắc học hay còn gọi là Công nghệ sinh trắc học (Biometric) là công nghệ sử
dụng những thuộc tính vật lý, đặc điểm sinh học đặc trưng riêng của mỗi cá nhân như
vân tay, mống mắt, khuôn mặt, giọng nói, dáng đi,.. để nhận dạng. Sinh trắc học được
xem là công cụ xác thực cá nhân hữu hiệu nhất hiện nay.
Sinh trắc học được phát triển lâu dài, đã được nghiên cứu và ứng dụng trong các lĩnh
vực anh ninh, quốc phòng, thương mại. Trong những năm gần đây, công nghệ này đã
đáp ứng được những yếu tố và nhu cầu cần thiết về chi phí, sự vận hành và khả năng xác
thực cho độ chính xác cao. Vì vậy trong tương lai sinh trắc học sẽ hiện hữu và được ứng
dụng mạnh mẽ hơn.
Một số loại sinh trắc học phổ biến hiện nay như: Dấu vân tay ( Finger print), lồng bàn
tay ( Palm print), khuôn mặt ( Face), hành vi ( Behavioral), nhịp tim ( Cardiac Rhythm),
võng mạc ( Retiane),... Những đáp ứng nhu cầu thực tế vô cùng hữu hiệu của các loại
sinh trắc học trên, đã thôi thúc các nhà nghiên cứu không ngừng tìm hiểu và phát triển
ngành công nghệ này lên tầm cao mới. Và nhận dạng khuôn mặt trở thành chủ đề tiềm
năng trong nghiên cứu thị giác máy tính [3].
Hình 1.1: Các dạng sinh trắc học phổ biến.
1
Nhận dạng khuôn mặt là một vấn đề nghiên cứu từ máy tính khá lâu đời, nhưng được
xem là khá mới mẻ khi một số phương pháp nhận dạng khuôn mặt đã được đề xuất trong
hai thập kỷ qua [4], [5], [17], [18], [22], [25]. Có bốn giai đoạn trong một hệ thống nhận
dạng khuôn mặt thông thường: Phát hiện khuôn mặt, canh chỉnh khuôn mặt, đặc trưng
khuôn mặt, và so khớp khuôn mặt. Giai đoạn rút trích đặc trưng khuôn mặt và so khớp
là hai giai đoạn quan trọng trong một hệ thống nhận dạng khuôn mặt. Đối với đặc trưng
khuôn mặt ( mắt, mũi, miệng, cằm...), mục tiêu là để rút trích các đặc điểm phân biệt để
làm cho hình ảnh khuôn mặt được phân tách nhiều hơn. Giai đoạn so khớp khuôn mặt
có mục tiêu là thiết kế thuật toán phân lớp hiệu quả để phân biệt các khuôn mặt khác
nhau.
So khớp khuôn mặt đóng vai trò quan trọng, ảnh hưởng đến độ đo chính xác (%) của
một hệ thống nhận dạng khuôn mặt vì hình ảnh khuôn mặt bị chụp trong các môi trường
thế giới thực thường bị ảnh hưởng bởi nhiều biến thể như tư thế khác nhau, biểu hiện,
độ sáng, sự bịt kín, độ phân giải, và nguồn gốc. Những biến thể làm giảm sự giống nhau
của các mẫu khuôn mặt từ cùng một người và làm tăng sự giống nhau của các mẫu khuôn
mặt từ những người khác nhau, đó là một trong những thách thức quan trọng trong nhận
dạng khuôn mặt. Trong những năm gần đây, một số phương pháp đặc trưng khuôn mặt
đã được đề xuất [4], [5], và chủ yếu được phân thành hai loại: Đặc trưng toàn cục [5],
[22] và Đặc trưng cục bộ [4], [17]. Đặc trưng toàn cục bao gồm phân tích chính thành
phần (PCA) [22] và phân tích tách lớp tuyến tính (LDA) [5], và các đặc trưng cục bộ là
mô hình mẫu nhị phân cục bộ (LBP) [13] và biến đổi sóng wavelets (Gabor Wavelets)
[17]. Các phương pháp nhận dạng khuôn mặt trong môi trường có kiểm soát đã được
phát triển nhiều, nhưng độ đo chính xác (%) của chúng vẫn còn chưa hiệu quả trong môi
trường không bị giới hạn. Do đó, làm thế nào để rút trích các đặc trưng bền vững với
nhiễu và phân biệt là bài toán quan trọng và thách thức trong nhận dạng khuôn mặt.
Có 3 vấn đề liên quan đến nhận dạng khuôn mặt mà chúng ta cần chú ý:
2
Đặc trưng khuôn mặt
Làm việc với đặc trưng khuôn mặt trong kho tàng khoa học rộng lớn, các phương
pháp này có thể được chia thành hai loại: Đặc trưng toàn cục [5], [22] và Đặc trưng cục
bộ [13], [17]. Đặc trưng toàn cục chuyển đổi từng hình ảnh khuôn mặt vào một vector
đặc trưng và một không gian con đòi hỏi sự đặc trưng để bảo vệ thông tin thống kê của
hình ảnh khuôn mặt. Phương pháp đặc trưng khuôn mặt trong không gian con dựa trên
các đại diện bao gồm PCA [22] và LDA [5]. Không giống như các đặc trưng toàn cục,
đặc trưng cục bộ đầu tiên mô tả mô hình cấu trúc của mỗi bản vá lỗi cục bộ và sau đó
kết hợp số liệu thống kê của tất cả các bản vá lỗi vào một bản vá các đặc trưng vector.
Đặc trưng cục bộ điển hình là LBP [13] và Gabor wavelets [17]. Tuy nhiên, các đặc trưng
cục bộ được làm thủ công và thường đòi hỏi kiến thức rộng để thiết kế chúng bằng
tay. Hơn nữa, một số trong số chúng khá là đắt tiền, mà có thể hạn chế các ứng dụng
thực tế.
Đặc trưng học thống kê
Đã có một số phương pháp học thống kê được đề xuất trong những năm gần đây [6],
[9], [10], [12], [14], [20]. Tiêu biểu là phương pháp đặc trưng học thống kê bao gồm bộ
mẫu hóa tự động thưa thớt [6], giảm nhiễu mẫu hóa tự động [20], máy Boltzmann [9],
mạng nơron xoắn [10], phân tích không gian con độc lập [12], và xây dựng lại phân tích
thành phần độc lập [14]. Gần đây, cũng đã có một số công trình về đặc trưng học tập dựa
trên đặc trưng khuôn mặt, và một số trong số đó đã đạt được độ đo chính xác (%) khá tốt
trong nhận dạng khuôn mặt. Ví dụ, Lei và đồng sự [15] đề xuất một phương pháp biệt số
mô tả khuôn mặt (DFD) bằng cách lọc ảnh sử dụng LDA tạo ra tiêu chí để có được đặc
trưng như LBP. Cao và các đồng sự [7] trình bày một phương pháp biểu diễn đặc trưng
học tập bằng cách áp dụng các khuôn khổ bag-of-word (Bow). Hussain và các đồng
sự [11] đề xuất một phương pháp mô hình lượng tử (LQP) bằng cách thay đổi phương
pháp LBP với một chiến lược mẫu hóa. So với các mô tả đặc trưng bằng tay, các phương
3
pháp biểu diễn đặc trưng học thống kê dựa trên độ đo chính xác (%) hiển thị được công
nhận tốt hơn bởi vì các thông tin dữ liệu thích nghi hơn có thể được khai thác dựa vào
các đặc trưng đã học.
Mẫu nhị phận
So với các mô tả đặc trưng giá trị thực, có ba lợi thế cho mẫu nhị phân:
1) Tiết kiệm bộ nhớ.
2) Có tốc độ tính toán nhanh hơn.
3) Chúng đủ mạnh để biến thể cục bộ.
Gần đây, đã có một sự quan tâm ngày càng cao đối với mẫu nhị phân trong thị trường
máy tính [8], [21], [23], [24]. Ví dụ, Weiss và đồng sự [24] đề xuất phương pháp học
thống kê mẫu hóa nhị phân bằng cách lưu giữ sự giống nhau của các đặc trưng ban đầu
cho tìm kiếm hình ảnh. Norouzi và đồng sự [19] đề xuất mẫu nhị phân bằng cách giảm
thiểu một thứ hạng bộ ba tổn thất của cặp tương tự. Wang và đồng sự [23] trình bày một
phương pháp học thống kê mẫu nhị phân bằng cách tối đa hóa sự giống nhau của cặp lân
cận và giảm thiểu sự giống nhau của cặp phi lân cận để thu hồi hình ảnh. Trzcinski và
Lepetit [21] mô tả mẫu nhị phân từ các bản vá lỗi bằng cách duyệt qua một vài đối chiếu
tuyến tính dựa trên bộ lọc giả định quá trình huấn luyện. Tuy nhiên, hầu hết các phương
pháp học thống kê mẫu nhị phân hiện đang được phát triển cho tìm kiếm tương tự [8],
[21] và theo dõi trực quan [16]. Trong khi đặc trưng nhị phân như LBP và Haar-like
được sử dụng trong nhận dạng khuôn mặt và đạt được hiệu quả đáng khích lệ, hầu hết
trong số đó là làm thủ công.
Hơn thế, ngày nay công nghệ phát triển mạnh mẽ, thiết bị di động đã trở nên đa năng
và được tích hợp nhiều ứng dụng mạnh mẽ giúp cho con người trong việc bảo mật hoặc
ghi nhớ thông tin... đặc biệt là các hệ thống xác thực người dùng trên thiết bị di động đã
và đang ngày càng tiến bộ.
4
Tải về để xem bản đầy đủ
Bạn đang xem 20 trang mẫu của tài liệu "Báo cáo nghiên cứu khoa học Kỹ thuật định danh khuôn mặt dựa vào mẫu nhị phân", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
File đính kèm:
- bao_cao_ky_thuat_dinh_danh_khuon_mat_dua_vao_mau_nhi_phan.pdf