Ứng dụng cắt ảnh tự động trong thiết kế thẻ sinh viên

Tạp chí Khoa học Công nghệ và Thực phm 17 (1) (2018) 107-114  
NG DNG CT NH TỰ ĐỘNG  
TRONG THIT KTHẺ SINH VIÊN  
Nguyễn Văn Lễ*, Phm Nguyễn Huy Phƣơng, Vũ Văn Vinh  
Trường Đại học Công nghiệp Thc phm TP.HCM  
Ngày nhận bài: 25/9/2018; Ngày chấp nhận đăng: 15/11/2018  
TÓM TẮT  
Hình ảnh người trên các dạng thẻ như thẻ sinh viên, thẻ hc sinh, thẻ nhân viên... là một  
trong những thành phần quan trọng để nhn din ngưi. Hiện nay, cách phổ biến để xử lý các  
hình thẻ này là cắt thủ công trên các phần mm xử lý đồ ha (Adobe Photoshop, Corel, MS  
Paint,…) dẫn đến mt nhiu thi gian khi xử lý tập nh lớn và chưa có căn cứ để xác định vị  
trí của đối tượng bên trong ảnh. Trong bài báo này, nhóm tác giả đề xut giải pháp kết hp  
thuật toán phát hiện khuôn mặt và thuật toán phát hiện biên để ct nh thtự động theo tlệ  
kích thước 3:4. Trong đó, vị trí đối tượng bên trong ảnh được tính sao cho cách đều 2 biên  
dc và cách biên ngang phía trên của vùng cắt mt khoảng cách phù hợp. Phương pháp đề  
xut thnghiệm trên tập ảnh có nền đồng nhất đạt được tlệ chính xác cao.  
Từ khóa: Phát hiện khuôn mặt, biên Canny, ct nh, ct nh tự động, phát hiện biên.  
1. GII THIU  
Hiện nay, hình ảnh ngưi được sdụng trong các dng thẻ như thhọc sinh, sinh viên,  
nhân viên… chquy định kích thước khung nh bng 2 x 3 cm, 3 x 4 cm, 4 x 6 cm mà chưa  
quan tâm đến vị trí, kích thước của người bên trong ảnh, điều này dẫn đến sự không đồng  
đều giữa các đối tượng trong các ảnh thẻ và một số ảnh blch đối tượng (Hình 1). Tuy  
nhiên, Tchc Hàng không Dân dụng Quc tế có các tiêu chuẩn quy định rt cht chvề  
nh chp sdng trong hchiếu và đã được rt nhiều nước trên thế giới áp dụng [1]. Theo  
tiêu chuẩn này, chiu rng nh 35-40 mm, khuôn mặt chiếm t70-80% nh, mặt nhìn thẳng  
về trước… Trong bài báo này, nhóm tác giả đề xuất phương pháp cắt nh chứa đối tượng  
người một cách tự động theo tlệ kích thước nh 3:4 tmt nh kthut sbt k. Trong  
đó, vị trí của đối tượng người được tính cân đối với các đường biên của vùng cắt hình chữ  
nht. Thuật toán Viola – Jones được sdụng để phát hiện và xác định tọa độ của khuôn mặt  
người có trong ảnh [2]. Thuật toán này phát hiện được nhiều khuôn mặt trong mt nh vi  
nn nh bt k. Tuy nhiên, vùng cắt nh thẻ được xác định là một hình chữ nht duy nht  
nên tập ảnh đầu vào được chn để phát hiện khuôn mặt là các ảnh đơn, nghĩa là mỗi nh gm  
một đối tượng người. Để xác định vị trí đối tượng, nhóm tác gisdng thuật toán Canny  
Edge Dectection [3], thuật toán này tìm ra các đường biên của đối tượng (Hình 7b). Dựa vào  
tập đường biên này để xác định vị trí đỉnh đầu và tính khoảng cách từ đỉnh đầu đến biên  
ngang phía trên ca khung nh.  
107  
Nguyễn Văn L, Phm Nguyễn Huy Phương, Vũ Văn Vinh  
(a)  
(b)  
(c)  
(d)  
Hình 1. nh thvới đối tượng người blch  
(a): lệch trái, (b): lch phi, (c) (d): lệch trên  
Hình 2. nh gc ban đu  
Hình 3. Kết quả ảnh sau khi ct tự đng theo tl3:4  
2. CÁC CÔNG TRÌNH LIÊN QUAN  
Năm 2003, Bongwon Suh và B.Bederson đề xuất phương pháp cắt nh thu nhtự động  
(Thumbnail Cropping) dựa trên những điểm ni bt của đối tượng (Saliency Map) [4].  
Phương pháp này tìm ra hình chữ nht tối ưu bao quanh đối tượng với các ngưỡng cho trước  
và cắt thành ảnh thu nhỏ tương ứng. Ngoài ra, kết hợp phát hiện khuôn mặt (face detection)  
để ct nh cha đối tượng người htrợ cho các hệ thng nhn dng. Năm 2005, Mingju  
Zhang và Lei Zhang đề xuất phương pháp cắt nh tự động dựa trên 14 loi mẫu hình ảnh  
được xác định trước, kết hp vi kết quả phát hiện khuôn mặt và phát hiện các vùng nổi bt  
để ct nh người theo tlệ cho trước như 2:1, 4:3, 1:1, 3:4, 2:3 [5]. Tuy nhiên, việc dựa vào  
các điểm ni bt để xác định vùng cắt đôi khi dẫn đến kết quả không chính xác vì một số đối  
tượng trong nh rt ni bt nhưng không phải là đối tượng trung tâm. Năm 2006, A.Santella  
và D.DeCarlo đề xuất phương pháp cắt ảnh bán tự động da trên tương tác góc nhìn. Xác  
định vùng cắt bằng cách phân đoạn nh kết hp vi kthut Eye Tracking [6]. Năm 2007,  
Fred Stentiford đề xuất phương pháp cắt nh tự động dựa trên điểm chú ý [7]. Phương pháp  
này dựa trên nền tng Saliency Map và tìm vùng chứa các điểm chú ý là các điểm có sự  
chênh lệch màu sắc lớn hơn một ngưỡng xác định. Ngoài ra, kết hp vi hsố phóng to để  
ct nh chứa các điểm chú ý theo nhiều kích thước khác nhau. Năm 2009, Nishiyama et al.  
trình bày phương pháp cắt hình ảnh dựa trên cảm giác [8]. Phương pháp này sdng  
Saliency Map để trích xuất các đối tượng có trong ảnh, mỗi đối tượng được chỉ định mt  
108  
ng dng ct nh tự động trong thiết kế thẻ sinh viên  
vùng cắt tương ứng. Sau đó, chọn vùng cắt phù hợp nht dựa vào kết quả phân lớp hình ảnh.  
Ngun dliu hun luyn để phân lớp được thu thp từ các trang web lưu trữ ảnh vi số  
lượng ln. Năm 2010, nhóm tác giả G. Liu và J. Chen đề xut tối ưu hóa thành phần nh  
bằng cách xác định vùng cắt tối ưu là hình chnhật có cùng tỷ lvi nh gốc ban đầu [9].  
Phương pháp này thực hiện phân đoạn ảnh để tìm ra các vùng nổi bt (salient regions) và  
đường ni bt (prominent lines), sau đó đo lường mức độ thm mỹ và xác định vùng cắt ti  
ưu. Năm 2011, J.She và D.Wang đề xut ct nh tự động dựa trên mã hóa mật độ thp  
(Sparse coding) [10]. Phương pháp này thực hiện phân loại ảnh thành 13 danh mc, trích  
xuất các điểm ni bt ca nh dựa trên đồ thị để to từ điển cho tng danh mục. Vùng cắt  
được xác định dựa trên mã hóa mật độ thấp và btừ điển. Năm 2013, J.Yan và S.Lin xây  
dng 3 bhun luyn liên quan đến các chủ đề ảnh khác nhau dựa trên cp nh gốc và ảnh  
được ct bi các chuyên gia về nhiếp nh [11]. Phương pháp này kết hợp phát hiện khuôn  
mặt, phát hiện điểm ni bt để trích xuất các đối tượng tin cảnh, sau đó loại trừ các đối  
tượng phụ và xác định vùng cắt phù hợp. Gần đây, Chen et al. nghiên cứu độ phc tạp tính  
toán trong việc tìm kiếm vùng cắt tối ưu dựa trên điểm ni bt ca ảnh và chỉ ra 3 vấn đề  
trong các thuật toán trước đó có độ phc tp tính toán cao [12]. Các vấn đề là: tìm kiếm vùng  
ct ti thiu, cố định tlệ vùng cắt tìm kiếm và xác định nhiều vùng cắt trên một ảnh cho các  
đối tượng ri rc, đồng thời đưa ra thuật toán để gii quyết các vấn đề này.  
Các công trình nghiên cứu vừa trình bày cho thấy vic ct nh chyếu dựa vào phát  
hiện các đim ni bt (Saliency Map) để khoanh vùng các đối tượng chính có trong ảnh hoc  
kết hp với phát hiện khuôn mặt (đối vi ảnh người), từ đó xác định vùng cắt bằng cách tìm  
kiếm hình chữ nht tối ưu theo nhiều phương pháp khác nhau. Trong bài báo này, nhóm tác  
giả đề xut giải pháp mới để ct nh thẻ, vùng cắt là hình chữ nhật được xác định theo tlệ  
kích thước 3:4. Phương pháp này kết hợp phát hiện khuôn mặt (Face Detection) và phát hiện  
biên (Edge Detection) sau đó tính toán đưa ra vùng cắt phù hợp nht.  
3. PHƢƠNG PHÁP CT NH THẺ  
3.1. Cấu trúc ảnh thẻ  
Trong bài báo này, nhóm tác giả đề xut cấu trúc ảnh thbao gồm kích thước biên ảnh  
vi chiu rng RecW và chiều cao RecH theo tl3:4; khoảng cách từ đỉnh đầu của người  
đến biên trên là H = *RecW; khoảng cách từ hai biên trái và phải của khuôn mặt đến 2 biên  
trái và phải ca khung nh D = *FaceW/2, vi FaceW là độ rng của khuôn mặt.  
Hình 4. Cấu trúc ảnh thẻ  
109  
Nguyễn Văn L, Phm Nguyễn Huy Phương, Vũ Văn Vinh  
Tìm hệ s: Vi nh thgiy chun kích thước 30 x 40 mm thì khoảng cách K tính từ  
đỉnh đầu người trong ảnh đến biên trên của khung nh phù hợp nhất là trong khong từ 2 đến  
8 mm. Tuy nhiên, ảnh kthut ssdng đơn vị Pixel nên kích thước các ảnh có thể chênh  
lch vi nhau tùy thuộc vào độ phân giải ca nh. Do đó, với mt nh kthut số có chiều  
rộng là RecW pixel thì khoảng cách từ đỉnh đầu người đến biên trên của khung ảnh được tính  
li theo công thức H=(K/30)*RecW. Đặt = K/30, vy H=*RecW. Hscó giá trị phụ  
thuộc vào K được liệt kê như trong bảng 1. Giá trị càng lớn thì khoảng cách H tính từ đỉnh  
đầu người đến biên trên càng lớn.  
Bng 1. Giá trị hs  
K
2
3
4
5
6
7
8
0,067  
0,100  
0,133  
0,167  
0,200  
0,233  
0,267  
Hs  
Tìm hệ s: Để tìm hệ số này, nhóm tác giả thu thp 100 nh thgm 50 nh ca sinh  
viên chụp ti Trường Đại học Công nghiệp Thc phm TP.HCM, 50 nh thẻ trên mạng  
internet và tiến hành đo thc nghim 2 giá trị gm: tng khoảng cách W tính từ 2 biên trái  
phi của khuôn mặt đến 2 biên trái phải ca khung nh (W = 2D) và độ rng F ca khuôn  
mặt. Sau đó tính trung bình các giá trị này trên 100 ảnh (N = 100).  
 
 
 
 
 
 
    
    
 
   
 
    
   
 
 
Ta có công thức tính hệ snhư sau:  
 
    
    
   
    
 
(1)  
 
   
3.2. Quy trình xử lý cắt nh thẻ  
Hình 5. Sơ đồ xử lý cắt nh thẻ  
Mục tiêu hoạt động ca hthống là xác định vùng cắt hình chữ nhật trên mỗi ảnh đầu  
vào, vùng cắt này là duy nhất nên ảnh đầu vào được chọn là ảnh đơn, nghĩa là mỗi nh chỉ  
cha một đối tượng người. Các thông số của vùng cắt cần xác định gm: chiu rng RecW,  
chiu cao RecH và tọa độ của hình chữ nhật này trong không gian 2 chiu gồm: hoành độ  
Xrec và tung độ Yrec  
110  
ng dng ct nh tự động trong thiết kế thẻ sinh viên  
Hình 6. Vùng cắt hình chữ nht trong htrc tọa độ không gian hai chiều  
Thuật toán Viola – Jones xác định tọa độ của khuôn mặt với hoành độ Xface và hình chữ  
nhật màu đỏ (Hình 6, Hình 7a) chứa khuôn mặt với độ rng FaceW. Dựa vào độ rng FaceW  
của hình chữ nhật này và hệ sđể tính độ rng RecW vùng cắt nh th:  
          
(2)  
( )  
                
                                
 
Chiu cao RecH của vùng cắt được xác định dựa vào chiều rng RecW theo tl3:4:  
 
(3)  
              
 
Hoành độ vùng cắt (Hình 6) được xác định theo công thức:  
           
(4)  
 
    
 
 
    
     
 
 
Thuật toán Canny edge detection xác định tt cả các đường biên của đối tượng (Hình 7b).  
Mục tiêu bước này là tìm đường biên qua đỉnh (Hình 7c). Đường biên qua đỉnh được xác  
định là đường biên đi qua điểm có tung độ nhnht Ytophead, sau đó ta tính được Yrec theo  
công thức:  
 
    
    
        
           
(5)  
        
        
Sau cùng là cắt nh dựa vào vùng cắt đã xác định: Xrec , Yrec , RecW, RecH  
(a) Phát hiện  
khuôn mặt  
(b) Phát hiện tt cả biên (c) Tìm đường biên d) Vùng ct vi  
của đối tưng qua đỉnh đường nét đứt  
Hình 7. Xác định vùng cắt  
111  
Nguyễn Văn L, Phm Nguyễn Huy Phương, Vũ Văn Vinh  
Đối vi ảnh có nền không đồng nht, mt số ảnh sxut hiện các đường biên phía trên  
tập đường biên của đối tượng người do nn nh sinh ra dẫn đến sai strong việc xác định  
Ytophead. Để hn chế sai số này, việc tìm kiếm đường biên qua đỉnh chgii hn trong mt  
khoảng cho trước vị trí phía trên khuôn mặt.  
3.3. Đánh giá phƣơng pháp  
Để đánh giá độ chính xác của phương pháp cắt nh thẻ, nhóm tác giả thu thp 200 nh  
người chp với tư thế mặt hướng ra phía trước. Trong đó, 100 ảnh được chp vi nn không  
đồng nht [13], 100 ảnh còn lại có nền đồng nht [14] và tiến hành thnghim ct nh thtự  
động theo tlệ kích thước 3:4 trên 2 tp ảnh này. Các giá trị được ghi nhn gm: số lượng  
nh cắt đúng (sau khi ct, đối tượng người được canh cân đối so với các biên của khung  
nh); số lượng nh ct lch (đối tượng người blch so với các biên của khung nh sau khi  
ct); số lượng ảnh không xác định (không phát hiện được mặt người trong nh); tlệ đúng  
(tính bằng tlphần trăm của số lượng nh cắt đúng trên tng số lượng nh). Kết quthử  
nghiệm được trình bày trong bảng dưới đây.  
Bng 2. Đánh giá cắt nh thẻ  
Loi nh  
Số lượng Cắt đúng  
Ct lch Không xác định Tlệ đúng  
Ảnh có nền không đng nht  
Ảnh có nền đồng nht  
100  
100  
85  
93  
10  
4
5
3
85%  
93%  
Bng kết quthnghiệm trên cho thấy, ảnh có nn đồng nht có tỷ lcắt đúng (93%)  
cao hơn so với ảnh có nền không đồng nht (85%). Thông thường các ảnh dùng làm thẻ  
được chp với tư thế nhìn thẳng về trước, màu nền đồng nht nên việc áp dụng nghiên cứu  
này trong các hệ thng ct nh thsrất phù hợp và cho hiu sut cao.  
Hình 8. ng dng ct nh thtrong thiết kế thẻ sinh viên  
112  
ng dng ct nh tự động trong thiết kế thẻ sinh viên  
4. KT LUN  
Nhóm tác giả vừa trình bày phương pháp cắt nh ththeo tlệ kích thước 3:4 dựa trên  
skết hp thuật toán Viola – Jones để phát hiện khuôn mặt và thuật toán Canny edge  
detection nhm xác định biên đối tượng. Kết quthnghiệm trên 2 tp dliu ảnh có nền  
đồng nhất và có nền không đồng nht là 93% và 85%. Trong đó tập ảnh có nền đồng nht  
cho tlệ chính xác cao hơn, phù hợp để ứng dng trong thiết kế thẻ sinh viên.  
Dựa trên kết quả này, hướng phát triển tiếp theo là xử lý cắt và xoay đối với các ảnh  
nghiêng, tính tỷ lphần trăm đối tượng trong ảnh và một số ràng buộc khác đáp ứng tiêu  
chun nh thẻ được quy định cho thvisa hoc hchiếu.  
TÀI LIỆU THAM KHO  
1. Poon J. - A photograph guidelines, International Civil Aviation Organization (ICAO),  
Photograph_Guidelines.pdf).  
2. Viola P. and Jones M. - Rapid object detection using a boosted cascade of simple  
features, Proceedings of the 2001 IEEE Computer Society Conference on Computer  
Vision and Pattern Recognition (CVPR) 1 (2001) 511-518.  
3. Canny J. - A computational approach to edge detection, IEEE Transactions on Pattern  
Analysis And Machine Intelligence 6 (1986) 679698.  
4. Suh B., Ling H., Bederson B.B. and Jacobs D.W. - Automatic thumbnail cropping and  
its effectiveness, Proceedings of the 16th annual ACM symposium on User interface  
software and technology (2003) 95-104.  
5. Zhang M., Zhang L., Sun Y., Feng L. and Ma W. - Auto cropping for digital  
photographs, IEEE International Conference on Multimedia and Expo (ICME) (2005).  
6. Santella A., Agrawala M., DeCarlo D., Salesin D. and Cohen M. - Gaze-based  
interaction for semi-automatic photo cropping, Proceedings of the SIGCHI conference  
on Human Factors in Computing Systems (2006) 771-780.  
7. Stentiford F. - Attention based auto image cropping, Workshop on Computational  
Attention and Applications on International Conference on Computer Vision Systems  
(ICVS) 1 (2007) 253-261.  
8. Nishiyama M., Okabe T., Sato Y. and Sato I. - Sensation-based photo cropping,  
Proceedings of the 17th ACM International Conference on Multimedia (2009) 669-672.  
9. Liu L., Chen R., Wolf L. and CohenOr D. - Optimizing photo composition, Computer  
Graphics Forum 29 (2010) 469-478.  
10. She J., Wang D. and Song M. - Automatic image cropping using sparse coding, First  
Asian Conference on Pattern Recognition (ACPR) (2011) 490-494.  
11. Yan J., Lin S., Bing Kang S. and Tang X. - Learning the change for automatic image  
cropping, Proceedings of the IEEE Conference on Computer Vision and Pattern  
Recognition (CVPR) (2013) 971-978.  
12. Chen J., Bai G., Liang S. and Li Z. - Automatic Image Cropping: A Computational  
Complexity Study, Proceedings of the IEEE Conference on Computer Vision and  
Pattern Recognition (CVPR) (2016) 507-515.  
113  
Nguyễn Văn L, Phm Nguyễn Huy Phương, Vũ Văn Vinh  
13. Nguyễn Văn Lễ, 100 nh nền không đồng nht, 2018  
(https://www.flickr.com/gp/108852439@N03/30W18x).  
14. Nguyễn Văn Lễ, 100 nh nền đồng nht, 2018  
(https://www.flickr.com/gp/108852439@N03/p8N2j6).  
ABSTRACT  
APPLYING AUTO IMAGE CROPPING TO DESIGN STUDENT CARD  
Nguyen Van Le*, Pham Nguyen Huy Phuong, Vu Van Vinh  
Ho Chi Minh City University of Food Industry  
The people image on cards such as student cards, staff cards is one of the important  
components to identify people. Currently, the common way to create these images is manual  
image cropping on the graphics processing software (Adobe Photoshop, Corel, MS Paint,  
etc.), this task takes a long time to process the large numbers of image files and there is  
baseless to determine the location of the object inside the image. In this paper, the face  
detection and edge detection algorithm were combined to automatically crop the image at the  
aspect ratio of 3:4. In which the position of the object inside the image was calculated to  
equal the distance of both vertical edges side and far away to the upper edge on a suitable  
distance. The proposed method was tested on a set of images with uniform backgrounds  
achieved a high accuracy rate.  
Keywords: Face detection, Canny edge, image cropping, auto cropping, edge detection.  
114  
pdf 8 trang yennguyen 16/04/2022 3620
Bạn đang xem tài liệu "Ứng dụng cắt ảnh tự động trong thiết kế thẻ sinh viên", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • pdfung_dung_cat_anh_tu_dong_trong_thiet_ke_the_sinh_vien.pdf