Thiết kế hệ thống điều khiển cửa tự động sử dụng công nghệ xử lý giọng nói và công nghệ xử lý ảnh

22  
Lê Tiến Dũng, Trnh Ngc Văn, Nguyn Văn Kiên, Nguyn Đức Tường  
THIT KHTHNG ĐIU KHIN CA TỰ ĐNG SDNG CÔNG NGHỆ  
XLÝ GING NÓI VÀ CÔNG NGHXNH  
DESIGNING AN AUTOMATIC DOOR CONTROL SYSTEM APPLYING SPEECH  
PROCESSING AND IMAGE PROCESSING  
Lê Tiến Dũng1, Trnh Ngc Văn2, Nguyn Văn Kiên2, Nguyn Đức Tường2  
1Trường Đại hc Bách khoa, Đại hc Đà Nng; ltdung@dut.udn.vn  
2Lp 12DCLC, Trường Đại hc Bách khoa, Đại hc Đà Nng;  
vantnbk91@gmail.com, vankienemk@yahoo.com, tuongnguyen9494@gmail.com  
Tóm tt - Ngày nay, vi sphát trin không ngng ca ngành tự  
động hóa, con người có xu hướng sdng các thiết btự động để  
nâng cao tính tin nghi, an toàn cho không gian sng ca h. Trong  
bài báo này, chúng tôi đề xut mt gii pháp nhm nâng cao tính  
an ninh và tin li ca hthng điu khin ca tự động. Hthng  
điu khin này sdng các công nghbo mt như mt khu, bo  
mt bng thRFID, hay bng các phương pháp sinh trc hc khác  
như nhn din khuôn mt hay ging nói ca người dùng. Ngoài ra  
hthng có thêm chc năng truyn hình nh tcamera đặt ca  
ti các thiết btrong mng LAN, cũng như giao tiếp vi các thiết bị  
trong mng LAN thông qua giao thc MQTT. Đồng thi chúng tôi  
xây dng mt mô hình để kim nghim hot động thc tế các gii  
pháp đã đề ra.  
Abstract - Nowadays, because of the consistent development of  
automation technology, there is a growing tendency among people  
to use automatic devices to improve the convenience and safety of  
their living space. In this paper, we propose a measure to enhance  
the convenience and security of the control system of automatic  
doors. Our control system uses security technology such as  
password, RFID or biometric methods like face recognition or  
speech recognition. Besides, our system have two extra functions:  
transmitting images captured by camera via Local Area Network  
(LAN) to other devices and saving video to review when it is  
necessary. The system adopt MQTT as the main communication  
protocol to exchange messages. Finally, we build up a working  
model to demo and test our solution.  
Tkhóa - xlý ging nói; xlý hình nh; hthng bo mt; nhn  
dng khuôn mt; ca thông minh.  
Key words - speech processing; image processing; security  
systems; face recognition; intelligent door.  
1. Đặt vn đề  
Ngày nay, khi đời sng kinh tế - xã hi phát trin, vn đề  
an ninh được quan tâm nhiu hơn. nước ta, vic bo van  
ninh đang dm chân ti chỗ ở vic người ta vn đang sdng  
con người cho mc đích an ninh là chính như vic thuê các  
bo vviên, hay lp đặt các hthng camera thông thường mà  
mt kgian hiu biết có thqua mt được.  
Trên thế gii hin đã có nhiu công trình nghiên cu và  
áp dng hthng điu khin ca thông minh. Trước hết, có  
thkể đến hthng chuông ca thông minh Chui [4] sử  
dng kthut nhn din khuôn mt, thtvà mt khu để  
nhn din và quyết định mkhóa. Ngoài ra, hthng này  
còn truyn hình nh qua mng LAN để người dùng biết  
được người đang đứng trước ca là ai. Tuy nhiên, hthng  
đó chưa lưu li video để người dùng ddàng xem li khi  
cn. Mt ng dng thương mi khác là hthng khóa  
HF6618 sdng kthut nhn din khuôn mt, tht,  
khóa cơ và mt khu hoc kết hp để mkhóa [8]. Nhược  
đim ca hthng này là chưa truyn hình nh qua mng  
LAN cũng như lưu li video để người sdng giám sát  
ngôi nhà ca h. Bên cnh đó, có thkể đến hthng ca  
thông minh các sân bay Australia [2] đối chiếu khuôn mt  
trong hchiếu đin tvà khuôn mt thu được tcamera để  
mca cho du khách nhp cnh. Hthng này khá cng  
knh và cũng chưa có chc năng lưu video hay truyn qua  
mng LAN.  
Hình 1. Sơ đồ khi ca hthng  
Hthng ca này sdng camera để phân bit, nhn  
din các đối tượng được phép mca làm phương thc bo  
mt chính. Ngoài ra, hthng ca còn chp nhn các yêu  
cu khác như vic nhp khu tbàn phím có sn hay nhn  
dng ging nói người dùng, đồng thi lưu trhình nh từ  
camera để thun tin cho vic truy xut hình nh khi cn.  
Trong bài báo này, chúng tôi sxây dng mt mô hình  
hthng ca tự đng vi cp độ bo mt cao và khc phc  
các vn đề còn tn ti ca các hthng ca thông mình kể  
đến trên. Sơ đồ khi cu trúc ca toàn hthng được biu  
din hình 1.  
ISSN 1859-1531 - TP CHÍ KHOA HC VÀ CÔNG NGHỆ ĐẠI HC ĐÀ NNG, S3(112).2017-Quyn 1  
23  
Khi người dùng yêu cu mca, mt cơ cu cht khóa s2.2. Phát hin khuôn mt  
tự động được kéo ra cho phép người dùng có thmca.  
Thut toán được sdng để phát hin khuôn mt trong  
bài báo này là thut toán Viola-Jones. Ưu đim ni bt ca  
thut toán này là tc độ xlý. Thc tế đây là thut toán  
phát hin khuôn mt có tc độ nhanh nht và có độ chính  
xác tương đối cao. Bài báo này sdng thư vin xnh  
mã ngun mOpenCV [3] để thc hin vic phát hin  
khuôn mt.  
Cơ cu này cũng sgài li khi có yêu cu tngười dùng.  
Hthng còn có mt stính năng bsung khác như truyn  
hình nh tcamera đến các thiết bkhác như đin thoi,  
máy tính, cũng như chế độ tchi tiếp khách liên động vi  
chuông ca. Cái ct lõi nht mà bài báo này hướng đến đó  
là gii pháp tự động hóa mang tính ci tiến, nâng cao bo  
mt và ng dng thc tế cao.  
Sau khi phát hin khuôn mt, chương trình trvvtrí  
và kích thước ca hình chnht bao quanh khuôn mt như  
hình 2. Từ đó, ta có thtách khuôn mt ra khi bc nh để  
thc hin tiếp các bước nhn dng.  
Phn còn li ca bài báo được bcc như sau: Mc 2  
trình bày thut toán xnh và nhn din khuôn mt; Mc  
3 trình bày vphương án xlý ging nói cho hthng điu  
khin ca ca tự động; Mc 4 trình bày vgii pháp truyn  
thông. Mt mô hình thc nghim được xây dng để kim  
chng gii pháp đề xut, được trình bày trong mc 5. Cui  
cùng, mc 6 đưa ra nhng kết lun, đề xut.  
2. Thut toán xnh và nhn din khuôn mt  
2.1. Thut toán xnh  
Hthng xác minh khuôn mt trong bài báo này thc hin  
xnh qua bn bước như sau:  
Hình 2. Kết quca đon chương trình phát hin khuôn mt  
2.3. Căn chnh khuôn mt  
‚
Phát hin khuôn mt (detection): Tìm ra vtrí và kích  
thước ca khuôn mt trong bc nh.  
Để căn chnh khuôn mt, trước hết, cn phi tìm các  
đim landmarks, đây là các đim đặc bit có mt trong mi  
khuôn mt, chng hn như góc mt, đỉnh mũi hay khóe  
ming. Bài báo này sdng thư vin xnh mã ngun  
mDlib [6] để tìm 68 đim landmarks trên khuôn mt.  
Thut toán được sdng là thut toán Ensemble of  
Regression Trees; thut toán này có tc độ thc thi rt cao,  
nó có thxlý 1.000 bc nh trong vòng 1s.  
‚
Căn chnh khuôn mt (alignment): Tìm các đim  
landmarks ri da vào các đim này để biến đổi khuôn  
mt (xoay, tnh tiến hay thu phóng) sao cho khuôn mt  
trong bc nh góc nhìn chính din nht có th.  
‚
‚
Biu din (Representation): Biu din khuôn mt  
thành các số đo để da vào đó xác minh khuôn mt.  
Xác minh (Verification): Da vào các số đo đã được  
tìm ra để xác minh khuôn mt có phi là người dùng  
hay không.  
Minh ha các đim landmarks trên mt khuôn mt như  
hình 3.  
Bc nh thu được tcamera có kích thước là  
480x640x3, bc nh này sẽ được xđể phát hin ra vị  
trí và kích thước ca khuôn mt; khuôn mt này được ct  
ra ri được điu chnh vkích thước 96x96x3. Bc nh đã  
được điu chnh sẽ được xlý tiếp qua các giai đon sau  
để xác minh.  
Các khung hình được xlý liên tiếp. Sau khi xlý xong  
mt khung hình, máy tính sly tiếp mt khung hình na  
ri lp li các bước xlý như trên; quá trình này được lp  
li vô hn.  
Hình 3. Kết qutìm đim landmarks và căn chnh khuôn mt  
Sau khi phát hin các đim landmarks, ta sda vào các  
đim này để biến đổi khuôn mt sao cho góc nhìn được  
chính din nht. Ở đây ta ssdng phép biến đổi affine.  
Cthlà tìm mt ma trn H, ma trn này biến đổi các đim  
Trong ngôn nglp trình Python, các bc nh được  
biu din dng numpy array. Ví dmt mng numpy  
array như sau:  
có ta độ , ꢃ, 1 trong bc nh gc thành các đim có  
ꢄ  
I = [[1, 0, 0], [0, 1, 2]]  
ta độ , ꢃ[3] trong bc nh mi sao cho:  
ꢂ  
Trong mng này, các số ở gia mi cp ngoc vuông bên  
trong là các phn tca mt hàng; du phy gia các cp  
ngoc vuông phân cách các hàng vi nhau. Vic đánh scác  
phn ttrong hàng và ct được bt đầu bng s0, ví dI [0,  
0] trvgiá tr1. Để ly tt ccác phn tử ở mt chiu nào  
đó, ta dùng du “:” các chiu khác, ví dụ để ly hàng đầu  
tiên, ta dùng lnh I [1,:] (ly tt ccác ct hàng 1).  
ꢅ  
ꢅ  
ꢇ = ꢈ ꢉ ꢊ  
(1)  
1
Để tìm được H, ta cn da vào mt tính cht ca phép  
biến đổi affine như sau: Vi hai hình tam giác bt k, ta luôn  
tìm được mt phép biến đổi affine để biến đổi tam giác này  
thành tam giác kia [5]. Da vào tính cht này, ta schn ra  
ba đim, tìm ma trn H sao cho vi ma trn H, ba đim  
landmarks được chn trong bc nh gc được biến đổi thành  
ba đim landmarks chun tương ng. Hình 4 bên dưới minh  
ha 68 đim landmarks chun mà bài báo này sdng [1].  
Các bc nh được biu din bng mng numpy array 3  
chiu theo thtlà chiu dc, chiu ngang và chiu sâu.  
Sau đây, chi tiết vcác bước xnh và xác minh sẽ được  
trình bày.  
24  
Lê Tiến Dũng, Trnh Ngc Văn, Nguyn Văn Kiên, Nguyn Đức Tường  
Trong đó là bc nh ca mt người để đối chiếu; ꢝ  
là mt bc nh khác ca cùng mt người vi là  
nh ca mt người khác vi . Tbt đẳng thc (7)  
ta thy rng khong cách ca các embeddings hai khuôn  
mt ca hai người khác nhau luôn ln hơn khong cách ca  
các embeddings ca hai khuôn mt cùng mt người ít nht  
(vi mng neuron ca OpenFace, = 0.2) [1].  
Gi A, B, C là ba đim landmarks được chn trong bc  
nh gc và A’, B’, C’ là ba đim tương ng ca landmarks  
chun, tphương trình (1) ta có:  
ꢌ  
ꢌꢅ  
ꢎꢎ ꢎꢏ ꢎꢐ  
ꢏꢎ ꢏꢏ ꢏꢐ  
ꢍ = ꢆ  
ꢇ ꢉ ꢊ  
(2)  
1
2.5. Xác minh khuôn mt  
Sau khi biu din khuôn mt, vic xác minh là rt dễ  
dàng. Tcông thc (7) ta rút ra:  
ꢀ ꢄ  
||ꢚꢀꢁꢄ ꢜ ꢚꢀꢁꢄ||ꢠ ||ꢚꢀꢁꢄ ꢜ ꢚꢀꢁꢄ||ꢜ ꢟ 8  
Tcông thc (8) suy ra:  
ꢀ ꢄ  
0 ꢠ ||ꢚꢀꢁꢄ ꢜ ꢚꢀꢁꢄ||ꢜ ꢟ 9  
Như vy, khong cách Euclide ca hai khuôn mt ca  
hai người khác nhau luôn ln hơn , trong bài báo này là  
0,2. Như vy, khi lp trình, chcn tính khong cách gia  
khuôn mt đã được lưu trong máy tính vi khuôn mt thu  
được tcamera, nếu khong cách này nhhơn 0,2 thì kết  
lun là hai khuôn mt là ca cùng mt người. Ngược li,  
nếu ln hơn 0,2 thì kết lun là hai khuôn mt khác nhau.  
Tuy nhiên, để đảm bo an toàn, ta chn ngưỡng thp hơn,  
trong bài báo này chúng tôi chn 0,18.  
Hình 4. Các đim landmarks chun được sdng  
ꢑ  
ꢑꢅ  
ꢎꢎ ꢎꢏ ꢎꢐ  
ꢏꢎ ꢏꢏ ꢏꢐ  
ꢍ = ꢆ  
ꢇ ꢉ ꢊ  
(3)  
1
ꢌ  
ꢒꢅ  
ꢎꢎ ꢎꢏ ꢎꢐ  
ꢏꢎ ꢏꢏ ꢏꢐ  
ꢒꢅꢍ = ꢆ  
ꢇ ꢉ ꢊ  
(4)  
2.6. Đọc nh tsever  
1
Để đọc nh tserver trv, trước hết, cn phi kết ni  
vi server. Server trong bài báo này trvề ảnh dng JPEG;  
đây là chun nén nh phbiến trên internet. Nếu server  
chtrvmt bc nh thì ta chcn gii mã chui dliu  
nhn được trong biến stream là đã được mt bc nh. Tuy  
nhiên, trong bài báo này, server liên tc trả ảnh vnên cn  
phi có cách để đọc tng chui mã hóa nh trong stream  
ra. Để tìm được chui mã hóa nh, ta cn tìm các chui  
‘\xff\xd8’ và ‘xff\xd9’; đây là các chui mở đầu và kết  
thúc được quy ước trong định dng nh JPEG. Sau khi  
đọc được chui mã hóa, ta sxóa các giá trt‘\xd9’ trở  
vtrước. Quá trình đọc nh tiếp tc được lp li để đọc  
các nh tiếp theo.  
Gii hphương trình trên ta tìm ra H:  
ꢙꢎ  
ꢌ  
1
0
1
0
1
0
0
0
0
1
0
1
0
ꢌꢅ  
ꢌꢅ  
ꢎꢎ
ꢘ  
0
0
ꢌ  
0
ꢑ  
0
ꢎꢏ
ꢗ  
ꢑ  
0
ꢑꢅ
ꢗ  
ꢎꢐ
ꢗ  
=
(5)  
ꢑꢅ  
ꢏꢎ  
0
0
ꢒ  
0
ꢓꢃꢖ  
0
ꢗ  
ꢏꢏ
ꢗ  
ꢓꢈꢏꢐꢖ  
ꢓ 0  
1ꢖ  
Ma trn biến đổi cui cùng là:  
ꢎꢎ ꢎꢏ  
ꢈ = ꢆ  
ꢏꢎ ꢏꢏ ꢏꢐ  
ꢎꢐꢇ  
(6)  
Trong bài báo này, các đim landmarks s39, 42 và 33  
được sdng để biến đổi.  
2.7. Lưu nh thành video  
2.4. Biu din khuôn mt  
Để lưu nh thành video, ta dùng hàm cv2.imwrite() ca  
thư vin opencv. Ta có ba thông scn phi khai báo.  
Thông số đầu tiên là tên ca video (ví d‘out.avi’), sau đó  
cn phi khai báo mã Fourcc và skhung hình trên mt  
giây (frames per second). Cui cùng là cisColor; nếu cờ  
này được set bng True thì chương trình slưu thành video  
vi các khung hình màu, nếu bng False thì chương trình  
lưu li thành video đen trng.  
Để so sánh hai khuôn mt, điu cn thiết là phi biu  
din bc nh thành các tính cht để làm gim sbiến thiên  
đối vi các bc nh ca cùng mt người, trong khi đó phi  
làm tăng sbiến thiên đối vi các bc nh ca hai người  
khác nhau. Đây là phn quan trng nht trong quá trình xác  
minh khuôn mt vì quá trình xác minh hoàn toàn da vào  
các tính cht này.  
Hthng ca bài báo này sdng mng neuron đã được  
luyn sn ca thư vin mã ngun mOpenFace [1]. Mng  
neuron có input là mt bc nh màu RGB vi kích thước  
96x96x3 và output là mt vector cha 128 số đo, được gi  
là embeddings. Khong cách Euclide gia hai embeddings  
ca hai bc nh sln nếu chúng thuc vhai người khác  
nhau và snhnếu chúng thuc vhai người khác nhau.  
Fourcc là mt đon mã dùng để nhn biết mã nh động  
(video codec), định dng nén và định dng pixel hoc màu  
được sdng trong video. Mi mã Fourcc được ký hiu  
bng bn chcái trong bng mã ASCII. Mã Fourcc phụ  
thuc vào hệ điu hành đang được sdng cũng như định  
dng video; nếu khai báo sai mã Fourcc thì vic lưu video  
stht bi. Mã Fourcc được sdng trong bài báo này là  
‘MJPG’ vi định dng video là .avi. Nếu vic lưu video  
tht bi thì cn phi thvi các mã Fourcc khác trên trang  
ꢀ ꢄ  
Gi là mt bc nh đầu vào và ꢚ ꢁ là vector cha các  
embeddings ca [7]. Mng này được hun luyn sao cho:  
||ꢚꢀꢁꢄ ꢜ ꢚꢀꢁꢄ||ꢞ ꢟ ꢠ ||ꢚꢀꢁꢄ ꢜ ꢚꢀꢁꢄ||ꢀ7ꢄ  
ISSN 1859-1531 - TP CHÍ KHOA HC VÀ CÔNG NGHỆ ĐẠI HC ĐÀ NNG, S3(112).2017-Quyn 1  
25  
3. Phương pháp xlý ging nói  
3.1. Thư vin âm thanh MARF  
‚
‚
‚
Tc độ mu âm thanh: 8.000Hz (8Khz).  
Độ phân gii mu: 16bit.  
Trong phm vi bài báo này, chúng tôi nhn thy vic  
xác minh người nói (speaker identifier) có ý nghĩa quan  
trng hơn trong vic bo mt ca hthng thay vì nhn  
din ging nói, vì thế chúng tôi quyết định chn nhng  
phn mm, thiết bliên quan ti công vic này.  
Kênh thu âm: 1 (mono).  
Nếu tp âm thanh không đúng định dng trên thì nó sẽ  
được chuyn về đúng định dng và ghi đè lên tp tin gc.  
Sau khi hun luyn ln đầu tiên thì mt mô-đun có đuôi mở  
rng là “.gzbin” và mt tp tin “speaker.txt “ được to ra  
ti thư mc làm vic hin ti. Tp tin “speaker.txt” cha  
thông tin tên người nói và sID ca người nói. Tp tin  
“*.gzbin” cha các đặc tính được phân tích ra ttp âm  
thanh hun luyn. Mi ln hun luyn, tp tin “*.gzbin” sẽ  
được cp nht li.  
Để sdng thư vin piwho trong chương trình python  
chúng ta phi nhp thư vin:  
from piwho import recognition  
Hình 5. Gii thiu vMARF  
recog = recognition.SpeakerRecognizer()  
Gii pháp phn mm được đưa ra trong bài báo này là  
thư vin MARF (Modular Audio Recognition Framework)  
đã được chnh sa li để có thsdng vi ngôn nglp  
trình python và hot động được trên máy tính Raspberry Pi.  
Nếu tp âm thanh dùng để hun luyn và nhn din nm  
mt thư mc khác thì chúng ta phi chrõ ra địa chca  
chúng. Ví dcác tp tin nm  
địa chỉ  
‘/home/pi/recordings’:  
MARF là mt nn tng nghiên cu mã ngun mvà là  
mt tp hp ca các thut toán vxlý ging nói/ âm  
thanh/ ngôn ngữ được viết trên nn tng java, được sp xếp  
vào trong mt mô-đun và mt cái sườn có thmrng  
được bng vic thêm vào các thut toán mi. MARF có thể  
chy trên mng (network) hoc có thhot động như mt  
thư vin thêm vào các ng dng, hoc có thdùng như mt  
ngun để nghiên cu và phát trin.  
recognition.SpeakerRecognizer(‘/home/pi/recordings/’)  
Để hun luyn mt tp dliu âm thanh mi sdng  
câu lnh:  
recog.train_new_data()  
3.4. Nhn din người nói  
Sau khi thc hin xong vic hun luyn thì bước tiếp  
theo là thnghim bng vic chy trình nhn din người  
nói. Để thc hin được điu này có mt syêu cu như sau:  
3.2. Cài đặt thư vin  
Thư vin MARF được tùy biến thành thư vin piwho  
sdng cho ngôn nglp trình python. Vbn cht, thư  
vin MARF được viết trên nn tng java, vì vy để sdng  
được thư vin chúng ta cn nn java ti thiu là phiên bn  
1.7. Đối vi máy tính Raspberry pi cũng như nhiu dng  
máy tính linux khác, trong nhân máy đã được cài sn java.  
Để kim tra phiên bn ca nn tng java, chúng ta sdng  
câu lnh:  
‚
Phi đảm bo tp tin “*.gzbin” và “speaker.txt” nm  
trong cùng thư mc, nơi cha đon code python  
được thc thi.  
‚
Kim tra “speaker.txt” không phi là file trng.  
Thc hin vic nhn din bng hàm identify_speakers()  
và kết qutrv‘name’ dưới đây là danh sách ca hai  
người nói có đim stt nht trong tp hun luyn. Người  
đầu tiên là người nói gn ging nht, tc là có đim sthp  
nht:  
$ java –version  
Để ghi âm phc vcho nhn din người nói, chúng ta  
cn mt thư vin âm thanh dành cho python là pyaudio:  
name = recog.identify_speaker()  
$ pip install pyaudio  
4. Gii pháp truyn thông  
Cui cùng là câu lnh cài đặt thư vin:  
$ pip install piwho  
4.1. Truyn hình nh qua mng LAN  
Mng LAN (Local Area Network) là tên ca mt loi  
mng cc b. Các thiết bkết ni trong mng này có thể  
chia sthông tin, dliu vi nhau mà không bcan thip,  
tn công tcác thiết bngoài mng. Vic truyn hình nh  
qua mng LAN giúp các thiết btrong mng có thxem  
được hình nh tcamera ca gi v. Để truyn được hình  
nh qua mng LAN trên máy tính Raspberry Pi (sdng  
hệ điu hành Debian) chúng tôi sdng mt dch vụ  
(service) đi kèm, đó là motion.  
3.3. Hun luyn máy nhn din  
Vic hun luyn máy nhn din không quá khó khăn,  
người dùng chvic lp li vic nói mt câu nào đó nhiu  
ln vi các âm điu khác nhau, thường là tnăm đến mười  
ln. Sau khi các đon âm thanh được ghi âm xong, máy tính  
sbt đầu hun luyn trên cthư mc cha các đon âm  
thanh đã được ghi âm và lưu tp hun luyn được vào mt  
tp tin.  
Để cài đặt dch v, chúng ta nhp vào terminal câu lnh:  
sudo apt-get install motion.  
Yêu cu ca vic hun luyn:  
‚
‚
Slượng hun luyn: Ti thiu hai người.  
Để bt đầu sdng dch vchúng ta gõ vào terminal  
câu lnh: sudo service motion start. Để dng dch vsử  
dng câu lnh: sudo service motion stop. Nếu vic truyn  
Định dng tp âm thanh hun luyn: PCM signed  
(wav).  
26  
Lê Tiến Dũng, Trnh Ngc Văn, Nguyn Văn Kiên, Nguyn Đức Tường  
hình nh không như ý mun, chúng ta có ththay đổi các  
thông strong tp tin cu hình ca dch vbng câu lnh:  
sudo nano/etc/motion/motion.conf, lúc đó tp cu hình  
được mra và chúng ta chnh sa li da trên chú thích  
trước mi thông s, hoc tìm hiu để biết thêm cách chnh  
sa các thông scho phù hp.  
4.2. Giao tiếp vi thiết bkhác qua giao thc MQTT  
MQTT là mt giao thc truyn tin hiu qu, đáng tin  
cy da trên nn tng giao thc TCP/IP được sdng phổ  
biến hin nay. MQTT thích hp vi vic truyn ti nhng  
dliu nh, yêu cu tc độ nhanh và sự đồng bda trên  
phương pháp đăng ký/xut bn (subscribe/publish) lên mt  
kênh bt k.  
MQTT có htrngôn ngpython. Để cài đặt gói giao  
thc MQTT cho python, sdng câu lnh pip install paho-  
mqtt. Để thêm thư vin MQTT vào chương trình python,  
sdng import paho.mqtt.client as mqtt. Để đăng ni dung  
lên mt kênh (topic), sdngclient.publish(“topic”, data,  
qos=0, retain=False). Để đăng ký ni dung tmt kênh bt  
k, sdng câu lnh client.subscribe(“topic”, qos = 0).  
Chú ý, yêu cu kênh đó phi tn ti, có nghĩa là chúng ta  
phi chđịa chmáy chnơi mà kênh được thiết lp và  
tn ti, sdng client.connect (địa chmáy ch, cng, thi  
gian gitin). Ví d: ”client.connect("iot.eclipse.org",  
1883, 60)”.  
Hình 7. Mt trước mô hình thc nghim thc tế  
5. Mô hình thc nghim  
Để kim nghim nhng đề xut, gii pháp ca bài báo,  
chúng tôi đã xây dng mt mô hình thc tế đã thử  
nghim các phương án nhiu ln. Chương trình xác minh  
khuôn mt đã xác minh đúng 98,55% sln th. Vi chế  
độ bo mt bng bàn phím, tlthành công là 100%, chế  
độ bo mt bng ging nói có xác sut thành công là 91%,  
và chế độ bo mt bng thRFID đạt tlthành công  
100%. Vi các chế độ kết hp, RFID kết hp xác minh  
khuôn mt đạt tlthành công là 96%; RFID kết hp ging  
nói đạt 89%, xác minh khuôn mt kết hp xác minh ging  
nói đạt 88%. Như vy, các chương trình cho kết quvi độ  
chính xác cao, chế độ RFID kết hp vi xác minh khuôn  
mt là chế độ tt nht và nên được sdng.  
Hình 8. Mt sau mô hình thc nghim thc tế  
6. Kết lun  
Bài báo đã trình bày phương án thiết kế hthng điu  
khin ca tự động sdng công nghxlý ging nói và  
công nghxnh và các phương thc bo mt kết hp.  
Các thut toán xlý hình nh, nhn dng ging nói đã được  
trình bày chi tiết. Các thiết kế trình bày trong bài báo giúp  
làm chcông ngh, đưa ra gii pháp để chế to hthng  
điu khin ca thông minh có cht lượng tt, nhiu ưu đim  
so vi các hthng đã được ng dng trong thc tin. Đồng  
thi, mt mô hình thc tế đã được xây dng để kim  
nghim các đề xut ca bài báo. Qua quá trình thnghim  
thc tế, chúng tôi nhn thy rng mô hình hot động có  
hiu qu, đáp ng được yêu cu đặt ra và có tháp dng  
được trong thc tin.  
Hình 6. Hình nh thiết kế mô hình và các thiết bmt trước  
ISSN 1859-1531 - TP CHÍ KHOA HC VÀ CÔNG NGHỆ ĐẠI HC ĐÀ NNG, S3(112).2017-Quyn 1  
27  
[5] Gonzalez, R.C. & E., W.R., 2007, Digital Image Processcing. 3rd  
TÀI LIU THAM KHO  
ed. Pearson.  
[1] Amos, B., Ludwiczuk, B. & Satyanarayanan, M., 2016, OpenFace:  
A general-purpose face recognition library with mobile application,  
CMU-CS-16-118, CMU School of Computer Science.  
[6] King, D.E., 2009, “Dlib-ml: A Machine Learning Toolkit”, Journal  
of Machine Learning Research, 10, page 1755-58.  
[7] Schroff, F., Kalenichenko, D. & Philbin, J., 2015, “FaceNet: A  
Unified Embedding For Face Recognition And Clustering”, In IEEE  
Computer Society Conference on Computer Vision and Pattern  
Recognition 2015., 2015.  
[2] Australian Border Force, n.d. The Department of Immigration and  
[Accessed 20 August 2016]  
[3] Bradski, G., 2000, “The OpenCV Library”, Dr. Dobb's Journal of  
Software Tools.  
[8] Xiamen Surmount Industry Co., Ltd., n.d, Xiamen Surmount  
Industry  
Co.,  
Ltd,  
[Online]  
Available  
at:  
[4] Chui,  
n.d.  
CHUI,  
[Online]  
Available  
at:  
(BBT nhn bài: 17/12/2016, hoàn tt thtc phn bin: 03/02/2017)  
pdf 6 trang yennguyen 13/04/2022 3100
Bạn đang xem tài liệu "Thiết kế hệ thống điều khiển cửa tự động sử dụng công nghệ xử lý giọng nói và công nghệ xử lý ảnh", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • pdfthiet_ke_he_thong_dieu_khien_cua_tu_dong_su_dung_cong_nghe_x.pdf