Ứng dụng kỹ thuật phân cụm và luật kết hợp khai phá dữ liệu khách hàng sử dụng dịch vụ khách sạn

Li nói đầu  
----  
Căn cvào quy hoch báo chí đã được Thtướng Chính phphê duyt,  
theo văn bn đề nghca BGiáo dc và Đào to, ngày 25 tháng 11 năm 2002,  
BVăn hoá - Thông tin đã ra Quyết định s510/GP-BVHTT, cp giy phép  
hot động báo chí cho Tp chí “Khoa hc và Công nghĐại hc Đà Nng.  
Ngày 10 tháng 8 năm 2006, Cc Báo chí BVăn hoá - Thông tin đã có  
Công văn s816/BC đồng ý cho phép Tp chí “Khoa hc và Công nghĐại hc  
Đà Nng được tăng kxut bn t03 tháng/klên thành 02 tháng/k.  
Ngày 6 tháng 2 năm 2007, Trung tâm Thông tin Khoa hc và Công nghệ  
Quc gia thuc BKhoa hc và Công nghệ đã có Công văn s44/TTKHCN-ISSN  
đồng ý cp mã chun quc tế: ISSN 1859-1531 cho Tp chí “Khoa hc và  
Công ngh”, Đại hc Đà Nng.  
Ngày 5 tháng 3 năm 2008, Cc Báo chí, BThông tin và Truyn thông đã có  
Công văn s210/CBC cho phép Tp chí “Khoa hc và Công nghĐại hc  
Đà Nng, ngoài ngôn ngữ được thhin là tiếng Vit, được bsung thêm  
ngôn ngthhin bng tiếng Anh và tiếng Pháp.  
Ngày 15 tháng 9 năm 2011, BThông tin và Truyn thông đã có Quyết định  
s1487/GP-BTTTT cp Giy phép sa đổi, bsung cho phép Tp chí Khoa hc và  
Công ngh, Đại hc Đà Nng được tăng khn xut bn t02 tháng/klên  
01 tháng/kvà tăng strang t80 trang lên 150 trang.  
Tp chí “Khoa hc và Công nghĐại hc Đà Nng ra đời vi mc đích:  
Công b, gii thiu các công trình nghiên cu khoa hc trong lĩnh vc  
ging dy và đào to;  
Thông tin các kết qunghiên cu khoa hc trong và ngoài nước nhm  
phc vcho công tác đào to ca nhà trường;  
Tuyên truyn, phbiến đường li chính sách ca Đảng và Nhà nước  
trong lĩnh vc giáo dc, đào to và nghiên cu khoa hc, công ngh.  
Tp chí “Khoa hc và Công nghĐại hc Đà Nng ra đời là skế tha và  
phát huy truyn thng các tp san, thông báo, thông tin, kyếu Hi tho ca  
Đại hc Đà Nng và các trường thành viên trong gn 40 năm qua.  
Ban Biên tp rt mong sphi hp cng tác ca đông đảo các nhà  
khoa hc, nhà giáo, các cán bnghiên cu trong và ngoài nhà trường, trong nước  
và ngoài nước để Tp chí “Khoa hc và Công ngh” ca Đại hc Đà Nng  
ngày càng có cht lượng tt hơn.  
BAN BIÊN TP  
Li gii thiu  
----  
Trường Cao đẳng Công nghThông tin, Đại hc Đà Nng có chc năng  
đào to ngun nhân lc có trình độ cao đẳng các chuyên ngành công nghthông  
tin và ng dng công nghthông tin trong các lĩnh vc; nghiên cu khoa hc và  
hp tác quc tế; trin khai công nghphc vyêu cu phát trin kinh tế - xã hi  
ca các tnh, thành phmin Trung, Tây Nguyên và cnước.  
Là mt trường thành viên ca Đại hc Đà Nng, Trường Cao đẳng Công nghệ  
Thông tin cùng vi các trường thành viên khác luôn xác định nghiên cu khoa hc  
không chlà chiến lược nâng cao cht lượng đào to mà còn là nhim vtrng tâm  
hướng đến xây dng Đại hc Đà Nng thành đại hc nghiên cu vào năm 2020.  
Năm 2015, nhà trường đã phi hp vi Ban Khoa hc, Công nghvà  
Môi trường, Đại hc Đà Nng đã tchc thành công Hi tho nghiên cu khoa hc  
CITA vi chủ đề "Công nghthông tin và ng dng trong các lĩnh vc" ln th4.  
Hi tho đã quy tụ được đông đảo nhng nhà khoa hc, nhng nhà chuyên môn  
trong lĩnh vc Công nghThông tin tham gia chia svà tho lun, đồng thi  
Hi tho cũng đã thu hút và chn lc được nhiu bài báo có cht lượng đăng trên  
mt sriêng ca Tp chí Khoa hc và Công ngh, Đại hc Đà Nng  
(s12(97).2015, quyn 2).  
Ban Tchc Hi tho "Công nghthông tin và ng dng trong các lĩnh vc"  
xin chân thành cm ơn các nhà qun lý, các nhà khoa hc đã gi bài tham dự  
Hi tho, đồng thi mong mun tiếp tc nhn được scng tác và nhng ý kiến  
quý báu ca các nhà qun lý, các nhà khoa hc nhm góp phn cho sthành công  
ca các ln Hi tho tiếp theo.  
Xin cm ơn Ban Giám đốc Đại hc Đà Nng và Ban Khoa hc, Công ngh&  
Môi trường đã to điu kin giúp đỡ và cho phép các bài báo có cht lượng ca  
Hi tho được chn lc và phn bin để đăng trong snày ca tp chí.  
Trân trng cm ơn!  
BAN TCHC HI THO  
MC LC  
ISSN 1859-1531 - Tp chí KHCN ĐHĐN, S12(97).2015, Quyn 2  
KHOA HC KTHUT VÀ TNHIÊN  
ng dng kthut phân cm và lut kết hp khai phá dliu khách hàng sdng dch vụ  
khách sn  
Applying clustering technique and association rule to mine data of customers using hotel services  
Nguyn Văn Chc, Đào ThGiang  
1
Quét mã QR trên đin thoi di động ng dng vào vic đim danh sinh viên - thc nghim  
ti Trường Cao đẳng Công nghThông tin  
Scanning QR code on mobile phones for classroom roll call - experiments at College of Information  
Technology  
Võ Hùng Cường  
5
10  
15  
Phân cm da trên logic mtrong kho sát thi gian sng cho mng cm biến không dây  
Clustering based on fuzzy logic for surveying lifetime in the wireless sensor network  
Phm ThDung, Lê Văn Sơn, Lê Thành Công, Đặng Hùng Vĩ  
Ti ưu hóa mô hình mTSK trích xut tmáy hc véc-tơ htrhi quy vi tham s  
Optimazing TSK fuzzy model extracted from support-vector-machines for regression with parameter  
Nguyn Đức Hin, Lê Mnh Thnh  
Gii pháp hthng hóa tên min và ngun tài liu khoa hc ca Đại hc Đà Nng  
Measures of systematizing website domain names and scientific literature resources of  
The University of Danang  
HPhan Hiếu, Trn Thanh Liêm  
20  
25  
30  
35  
Phân tích khnăng kim thchương trình hướng đối tượng Java  
Testability analysis of Java object - oriented programs  
Nguyn ThThúy Hoài, Nguyn Thanh Bình  
Chương trình dò tìm chuyn động ca môi cài đặt trên FPGA  
Lip tracking program implemented on FPGA  
Võ ThThu Hng, Lê Quc Bo Trí, Nguyn Ngc Tài, Lê Trung Hiếu  
ng dng sandbox phân tích mã độc trên môi trường phân tán  
Applying sandbox to malware analysis in a distributed environment  
Nguyn Tn Khôi, Trn Thanh Liêm  
Chia để tr: gii pháp hu hiu để tăng tc độ mô phng di tn trong tình hung thiên tai  
Divide and conquer approach: an efficient measure to accelerate simulation of evacuation in case of  
natural disasters  
Lê Văn Minh, Phm Tun Anh  
41  
45  
Nghiên cu gii pháp gim nhiu nâng cao cht lượng tiếng nói sdng blc kalman  
hiu chnh  
A study of measures for noise reduction to improve the quality of speech using adjustment kalman filter  
Dương Ngc Pháp  
Nghiên cu và xây dng môi trường qun lý, truy cp tài nguyên phc vxlý tiếng Vit và  
tiếng dân tc thiu số  
Researching and building an environment for accessing and managing resources for Vietnamese and  
ethnic minority language processing  
Hunh Công Pháp, Văn Đỗ Cm Vân  
49  
ng dng thut toán phân cm dliu để khai thác kết quthi nhm chun hóa cht lượng  
đề thi trc nghim  
Enhancing the quality of multiple-choice tests using clustering algorithm to mine test results  
Đặng Thái Thnh  
54  
58  
Mô phng thut toán lp lch trong tính toán lưới  
Simulation of scheduling algorithm in grid computing  
Trn HThy Tiên  
Xây dng gii pháp ca thông minh “CIT Smart Door” trên nn tng công nghkhông dây  
bluetooth và ng dng di động android  
Building up a smart door solution “CIT Smart Door” based on bluetooth wireless technology  
and android mobile application  
Nguyn Anh Tun, Lã Trung Kiên  
64  
69  
Mô hình hóa quỹ đạo ca electron trong ttrường ca ngun plasma lưỡng cc trên  
phn mm matlab  
Modelization of electron trajectories in the magnetic field of an elementary dipolar plasma source  
based on matlab software  
Trn Tn Vinh  
KHOA HC XÃ HI  
Vn dng phương pháp nghiên cu tình hung trong ging dy môn hc kế toán tài chính  
The application of case study method in teaching finance accounting  
Nguyn Linh Giang  
74  
Nghiên cu thc trng chuyn giá trn thuế ca các doanh nghip có vn đầu tư nước ngoài  
ti Vit Nam  
Studying the current situation of pricing transfer for tax evasion of foreign - invested enterprises in Vietnam  
Hunh ThKim Hà  
79  
84  
Thc trng qung bá du lch trc tuyến ti thành phố Đà Nng  
Current situation of online tourism advertising in Da Nang city  
Đào ThThu Hường  
ng dng lý thuyết tài chính hin đại vào đo lường ri ro hthng trong đầu tư cphiếu ti thị  
trường chng khoán Vit Nam  
Application of modern financial theory to measure the risks in investing shares on Vietnam's stock market  
Nguyn ThThanh Huyn  
89  
Nghiên cu nhân tố ảnh hưởng đến giá trcm nhn khách hàng vcác siêu thti  
thành phố Đà Nng  
A study of the factors that affect consumers’ perception value of supermarkets in Danang  
Đặng ThThanh Minh  
94  
100  
105  
109  
113  
Nghiên cu nhân tố ảnh hưởng đến ý định sdng dch vmobile banking ca khách hàng Đà Nng  
Researching into factors that affect intention to use mobile banking service of customers in Da Nang  
Nguyn ThThu Ngân, Nguyn ThThanh Nhàn, Đặng ThThanh Minh  
Qun lý thuế trong môi trường thương mi đin tti Vit Nam  
Tax administration in Vietnam’s E-commerce environment  
Nguyn ThKim Ngc, Hunh ThKim Hà  
Nghiên cu động cơ sdng dch vinternet banking ca khách hàng  
Researching into the motivation for using internet banking of customers  
Nguyn ThThanh Nhàn  
Bàn lun vmi quan hgia trách nhim xã hi và hiu quhot động ca doanh nghip  
Discussion on the relationship between social responsibilty and business efficiency of enterprises  
Lê Hà Như Tho  
ISSN 1859-1531 - TP CHÍ KHOA HC VÀ CÔNG NGHỆ ĐẠI HC ĐÀ NNG, S12(97).2015, QUYN 2  
1
NG DNG KTHUT PHÂN CM VÀ LUT KT HP  
KHAI PHÁ DLIU KHÁCH HÀNG SDNG DCH VKHÁCH SN  
APPLYING CLUSTERING TECHNIQUE AND ASSOCIATION RULE  
TO MINE DATA OF CUSTOMERS USING HOTEL SERVICES  
Nguyn Văn Chc, Đào ThGiang  
Trường Đại hc Kinh tế, Đại hc Đà Nng; chuc.nv@due.edu.vn, giang.dt37K14@gmail.com  
Tóm tt - Ngày nay, ngành công nghip du lch, đặc bit là kinh  
doanh khách sn đang phát trin mnh m. Dliu khách hàng lưu  
trú ti khách sn được lưu trcha rt nhiu tri thc giá tr. Tuy  
nhiên, dliu này li không được khai thác trit để. Trong khi đó, các  
nhà qun trkhách sn đang rt cn được htrvvn đề chăm  
sóc khách hàng, đưa ra chính sách ti ưu trong qun lý tnhng tri  
thc có được, nếu dliu ca khách hàng được khai thác và sử  
dng hiu qu. Bài báo tp trung nghiên cu kthut phân cm và  
lut kết hp trong khai phá dliu để phân tích dliu khách hàng  
lưu trú ti khách sn, giúp các nhà qun trcó thnm được đặc  
đim khách hàng và đưa ra được các quyết định kinh doanh hp  
lý.Trên cơ scác tri thc phát hin được, mt giao tiếp trên nn web  
được xây dng để người dùng sdng các tri thc này vào phân  
tích dliu khách hàng sdng dch vkhi lưu trú ti khách sn.  
Abstract - Nowadays, tourism industry, especially hospitality  
business has been developing strongly. Customer information  
saved in hotels contains much valuable knowledge. However, this  
data has not been exploited thoroughly. Meanwhile, the hospitality  
business managers are yearning for being supported in customer  
service to make optimal policies on hotel management from the  
knowledge if the data has been exploited and used effectively. This  
paper focuses on studying clustering technique and association  
rule in data mining to analyse customer data in hotels to help the  
managers understand customer characteristics and make better  
decisions in business. Based on the knowledge discovered, the  
research group also builds an interface on a web platform to help  
users use that knowledge for analysing data of customers using  
hotels services.  
Tkhóa - khai phá dliu; phân tích hành vi; phân cm; lut kết  
hp; dch vkhách sn.  
Key words - data mining; behavior analysis; clustering; association  
rule; hotel services.  
1. Đặt vn đề  
2. Sơ lược vkthut phân cm và lut kết hp  
2.1. Phân cm dliu  
Cùng vi sphát trin ca ngành du lch, các khách sn  
được liên tc xây dng vi nhiu quy mô khác nhau đã to  
nên scnh tranh không ngng. Để đáp ng nhu cu ngày  
càng cao ca khách du lch nước ngoài và ni địa, ngoài  
vic đáp ng nhu cu lưu trú ca khách hàng thì vn đề  
nâng cao cht lượng các dch vkhác ti khách sn cũng  
rt quan trng. Du khách sn sàng trthêm các khon chi  
phí hp lý cho các dch vcng thêm ca khách sn khi nó  
thc scn thiết hoc khiến hhài lòng. Để tn ti và phát  
trin trong thtrường đầy cnh tranh này, các doanh nghip  
kinh doanh khách sn cn hiu được đối tượng du khách  
thường xuyên lưu trú ti khách sn: Hlà ai và hmong  
mun nhng gì? Mang li đúng giá trmà du khách cn là  
phương pháp đơn gin nht để phc vdu khách ít tn kém  
chi phí nht và làm du khách hài lòng nht. Để làm được  
điu này, các nhà qun lý cn có mt chiến lược hp lý dài  
hn. Trên thc tế, các thông tin vkhách hàng lưu trú ti  
khách sn được lưu trvi rt nhiu tri thc có giá tr, song  
các dliu này li không được khai thác hiu qu. Do đó,  
rt cn có mt hthng giúp người dùng phân tích các  
thông tin lưu trú ca khách hàng ti khách sn. Từ đó, các  
nhà qun trcó thể đưa ra được mt sgii pháp htrợ  
chăm sóc khách hàng, giúp khách sn chủ động hơn vi  
khách hàng trong vic cung cp dch v, nhờ đó giúp tăng  
cht lượng dch v, nâng cao mc độ hài lòng ca khách  
hàng, tăng cơ hi kinh doanh cho khách sn. Bài báo tp  
trung nghiên cu vkthut phân cm và lut kết hp để  
tìm ra tìm ra được các đặc đim ca tng nhóm khách hàng,  
biết được mi quan hgia các thuc tính liên quan đến  
hành vi lưu trú ca khách hàng và dbáo được khnăng  
sdng dch vcũng như khnăng đặt tour du lch ca  
khách hàng ti khách sn.  
Phân cm dliu là qui trình tìm cách nhóm các đối  
tượng đã cho vào các cm (clusters), sao cho các đối tượng  
trong cùng 1 cm càng ging nhau (similar) càng tt và các  
đối tượng khác cm thì càng khác nhau nhau (Dissimilar)  
càng tt [3].  
Mc đích ca phân cm là tìm ra bn cht bên trong các  
nhóm ca dliu. Có rt nhiu kthut phân cm, như phân  
cm phân hoch, phân cm phân cp, phân cm da trên mt  
độ... Tuy nhiên, không có tiêu chí nào được xem là tt nht  
để đánh giá hiu quca phân tích phân cm, điu này phụ  
thuc vào mc đích ca bài toán phân cm [3].  
2.2. Lut kết hp  
Trong lĩnh vc Data Mining, mc đích ca lut kết hp  
(Association Rule - AR) là tìm ra các mi quan hgia các  
đối tượng trong khi lượng ln dliu. Ni dung cơ bn  
ca lut kết hp được tóm tt như dưới đây [3].  
Cho cơ sdliu giao dch T gm tp các giao dch t1,  
t2, …, tn.  
T = {t1, t2,…, tn}. Mi giao dch ti bao gm tp các đối  
tượng I (gi là itemset).  
I = {i1, i2, …, im}. Mt itemset gm k items gi là k-itemset.  
Mc đích ca lut kết hp là tìm ra skết hp (tương  
quan) gia các items.  
Nhng lut kết hp này có dng X Y  
Hai tiêu chí rt quan trng trong vic đánh giá lut kết  
hp đó là độ htr(support) và độ tin cy (confidence).  
Công thc tính độ htrđộ tin cy ca lut kết hp  
XY [1]:  
2
Nguyn Văn Chc, Đào ThGiang  
khách hàng  
ꢍꢇꢈ ∪ ꢉꢊ  
ꢁꢂꢃꢃꢄꢅꢆ ꢈ → ꢉ ꢋ ꢌ ꢈ ∪ ꢉ ꢋ  
3.2. Kch bn trin khai hthng phân tích dliu khách hàng:  
ꢍꢇꢈ ∪ ꢉꢊ  
Hthng phân tích dliu khách hàng được tiến hành  
theo các bước chính như Hình 1.  
ꢏꢄꢍꢐꢑꢒꢓꢍꢔꢓ ꢈ → ꢉ ꢋ ꢌ ꢉ|ꢈ ꢋ  
ꢍꢇꢈꢊ  
Trong đó:  
ꢍꢇꢈꢊ: Sgiao dch cha X  
N: Tng sgiao dch  
4. ng dng tri  
thc phát hin  
được vào dự đoán  
khách hàng sử  
dng dch vụ  
2. Xây  
dng mô  
hình phân  
cm và  
lut kết  
hp  
1. Thu  
thp và  
tin xử  
d  
3. Phát  
hin tri  
thc tmô  
hình dự  
đoán  
Các lut kết hp có độ htrđộ tin cy ln hơn hoc  
bng độ htrti thiu (min_sup) và độ tin cy ti thiu  
(min_conf) gi là các lut mnh.min_sup và min_conf gi  
là các giá trngưỡng (threshold) được xác định trước khi  
sinh các lut kết hp [1].  
liu  
khách sn  
3. Xây dng hthng khai phá dliu khách hàng sử  
dng dch vkhách sn  
Hình 1. Kch bn trin khai hthng phân tích dliu khách  
hàng sdng dch vkhách sn  
3.1. Mô ththng  
Bước 1. Thu thp và tin xlý dliu  
Mc đích: ng dng kthut phân cm và lut kết hp  
phân tích dliu khách hàng sdng dch vkhách sn.  
Dliu thu thp được gn 2000 mu, ththng qun  
lý khách sn Headway ca khách sn Thi Đại ở Đà Nng  
từ đầu năm 2014 đến 3/2015.  
Đầu vào: Gm các thông tin khách hàng sdng dch vụ  
khách sn: gii tính, quc tch, tui, ngun khách,…; thông  
tin vcác dch vkhách sn: git là, thuê xe, đặt tour….  
Dliu ban đầu gm rt nhiu thuc tính, sau quá trình  
tin xlý dliu (sdng phương pháp trích chn thuc  
tính) để đánh giá mc độ ảnh hưởng ca các thuc tính đến  
hành vi lưu trú ti khách sn ca khách hàng, mô hình xác  
định được các thuc tính như Bng 1.  
Đầu ra: Đưa ra đặc trưng ca tng nhóm khách hàng,  
dbáo khnăng sdng dch vvà mi liên hgia các  
thuc tính liên quan đến hành vi lưu trú ti khách sn ca  
Bng 1. Mô tdliu  
Min giá trị  
000001-002000  
STT  
Tên thuc tính  
Kiu dliu  
Nominal  
Nominal  
Interval  
Gii thích  
Mã khách hàng, khóa  
1
2
3
4
5
6
7
8
9
ID  
GioiTinh  
Nu, Nam  
Gii tính ca khách hàng  
Tuoi  
>=18  
Độ tui ca khách hàng  
QuocTich  
Nominal  
Nominal  
Nominal  
Nominal  
Interval  
VIE, USA, CHN, JPN, AUS, ….  
KhachLe, KhachDoan, CongTy  
DuLich, CongTac  
>=1, <=12  
Quc tch ca khách hàng  
Ngun khách hàng  
NguonKhach  
MucDichLuuTru  
ThoiGianLuuTru  
SoNgayLuuTru  
LoaiPhong  
Mc đích lưu trú ca khách hàng  
Thi gian lưu trú ca khách hàng (tháng lưu trú)  
Sngày lưu trú ti khách sn  
Loi phòng khách sn  
>=1  
Nominal  
StandardSingle, StandardDouble,  
StandardTwin, DeluxeSingle, DeluxeDouble,  
DeluxeTwin, VipSingle, VipDouble  
10 HinhThucThanhToan Nominal  
TienMat, The, ChuyenKhoan  
Co, Khong  
Hình thc thanh toán  
Dch vgit là  
11 GiatLa  
Nominal  
Nominal  
Nominal  
Nominal  
Nominal  
12 ThueXe  
Co, Khong  
Dch vthuê xe  
13 MuaVeMayBay  
14 DVMiniBar  
15 MuaDoGiupKhach  
Co, Không  
Dch vmua vé máy bay cho khách  
Dch vmini bar  
Co, Khong  
Co, Khong  
Dch vmua đồ giúp khách  
Dch vthanh toán hóa đơn cho khách  
Dch vụ đổi tin cho khách  
Đặt tour Huế  
16 ChenhLechHoaDon Nominal  
Co, Khong  
17 DoiTien  
Nominal  
Nominal  
Nominal  
Nominal  
Nominal  
Nominal  
Nominal  
Nominal  
Co, Khong  
18 DatTourHue  
19 DatTourBaNa  
20 DatTourNHS  
21 CityTour  
Co, Khong  
Co, Khong  
Đặt tour Bà Nà  
Co, Khong  
Đặt tour Ngũ Hành Sơn  
Đặt City tour  
Co, Khong  
22 DatTourSonTra  
23 DatTourHoiAn  
24 DatTourCLC  
Co, Khong  
Đặt tour Sơn Trà  
Co, Khong  
Đặt tour Hi An  
Co, Khong  
Đặt tour Cù Lao Chàm  
ISSN 1859-1531 - TP CHÍ KHOA HC VÀ CÔNG NGHỆ ĐẠI HC ĐÀ NNG, S12(97).2015, QUYN 2  
3
dng nhiu dch vnhư git là, minibar, mua vé..., thường  
đặt Citytour, tour Bà Nà, Hi An.  
Bước 2. Xây dng mô hình phân cm và lut kết hp  
Mô hình phân cm và lut kết hp phân tích dliu  
khách hàng sdng dch vkhách sn được xây dng trên  
Cm 3: Cm này đa slà khách l, đi công tác, tp  
công ckhai phá dliu Business Intelligence trung vào tháng 6 đến tháng 12, độ tui t18 đến 35,  
Development Studio (BIDS) ca Microsoft. BIDS là công thường loi phòng Deluxe, thanh toán bng thhoc  
crt mnh cho phép trin khai các mô hình khai phá dchuyn khon, sdng nhiu dch vnhư git là, thuê xe,  
liu, được sdng rng rãi hin nay bi khnăng kết ni đặt tour, đổi tin...  
ddàng vi nhiu ngun dliu, giao din dsdng và  
Cm 4: Cm này đa slà khách công ty, chlưu trú 1  
nht là khnăng biu din tri thc phát hin được rt trc  
ngày ti khách sn, vào tháng 1 đến tháng 5, thường thuê  
quan, dhiu, dsdng. BIDS được tích hp vào SQL  
xe, mua vé máy bay..., thanh toán chyếu bng tin mt  
SERVER 2005 trvsau trong các phiên bn Enterprise  
hoc chuyn khon.  
hoc Development [4].  
Cm 5: Cm này đa slà khách công ty, trong khong  
Sau khi thc hin các thao tác tin xlý dliu để phù  
thi gian ttháng 1 đến tháng 9, độ tui t26 đến 38,  
hp vi mô hình khai phá dliu, sdng Microsoft  
thường các phòng Single, thi gian lưu trú nhiu ngày,  
Clustering vi thut toán K-means và Microsoft  
nên ngoài mc đích công tác, khách hàng thuc nhóm này  
Association Rule vi thut toán Apriori trong BIDS để xây  
còn kết hp đi du lch, khách sn thường thanh toán chênh  
dng mô hình phân tích dliu khách hàng sdng dch  
lch hóa đơn cho nhóm khách này.  
vkhách sn.  
Cm 6: Cm này chyếu là khách đoàn Vit Nam, có  
thi gian lưu trú nhiu ngày, thường vào tháng 6 đến tháng  
Bước 3. Phát hin tri thc tmô hình phân cm và lut kết hp  
10, tp trung nhiu vào tháng 7, sdng nhiu dch vnhư  
git là, thuê xe, hthường đặt tour Bà Nà, Cù Lao Chàm,  
Hi An, hình thc thanh toán bng tin mt.  
a. Mô hình phân cm  
b. Mô hình lut kết hp  
Tmô hình lut kết hp đã xây dng, phát hin được  
tri thc vmi quan hgia các thuc tính liên quan đến  
hành vi lưu trú ca khách hàng ti khách sn. Sau đây là  
mt slut được trích ra tmô hình:  
L1: Khách hàng đặt tour Ngũ Hành Sơn, vào tháng 3  
đến tháng 6 thì đặt tour Hi An, vi độ tin cy100%.  
L2: Khách hàng là khách đoàn, lưu trú ti khách sn  
vào tháng 3 đến tháng 6 thì đặt tour Hi An, vi độ tin cy  
89,4%.  
L3: Khách loi phòng Deluxe Twin, vào tháng 3 đến  
tháng 6 thì đặt tour Hi An vi độ tin cy 87,4%.  
Hình 2. Kết quphân cm dliu  
L4: Khách hàng là khách đoàn, đặt City Tour thì sẽ đặt  
tour Cù Lao Chàm vi độ tin cy 82,4%.  
Hình 3. Đặc trưng tng cm dliu  
Tmô hình phân cm, cho ra được đặc trưng 6 nhóm  
khách hàng như sau:  
Hình 4. Kết qumô hình lut kết hp  
Cm 1: Cm này đa slà khách đoàn người nước  
ngoài, có thi gian lưu trú nhiu ngày, độ tui t20 đến 40,  
sdng nhiu dch vnhư git là, thuê xe, đặt tour, đổi  
tin...  
Bước 4. ng dng tri thc phát hin được vào phân tích  
dliu khách hàng lưu trú ti khách sn  
Da vào các tri thc phát hin được tmô hình phân  
cm và lut kết hp, mt hthng giao tiếp được xây dng  
trên nn web cho phép người dùng sdng để tìm ra đặc  
đim tng nhóm khách hàng, dbáo khnăng sdng dch  
vca khách hàng.  
Cm 2: Cm này đa slà khách lẻ đi du lch, lưu trú  
nhiu ngày, vào tháng 1 đến tháng 5, độ tui trên 30,  
thường loi phòng Deluxe, thanh toán bng tin mt, sử  
4
Nguyn Văn Chc, Đào ThGiang  
Hình 5. Giao tiếp người dùng  
vi hthng phân tích dliu khách hàng  
4. Kết lun và hướng phát trin  
Bài báo đã tìm hiu vlý thuyết kthut phân cm và  
lut kết hp, từ đó nghiên cu ng dng các kthut này  
vào xây dng mô hình khai phá dliu khách hàng lưu trú  
ti khách sn.  
Da vào mô hình khai phá dliu vi hai kthut phân  
cm dliu và phát hin lut kết hp đã xây dng, nhóm  
tác giả đã xây dng thành công mt giao tiếp trên nn web  
để htrvic ra quyết định ca các nhà qun lý khách sn,  
giúp đưa ra được các chính sách riêng cho tng nhóm  
khách hàng, dbáo hành vi sdng dch vkháchsn cũng  
như đặt tour du lch ca khách hàng. Trong thi gian ti sẽ  
nghiên cu mrng sang lĩnh vc du lch nhm nâng cao  
hiu qutrong vic phân tích hành vi du lch ca khách du  
lch ti các công ty du lch lhành.  
TÀI LIU THAM KHO  
[1] Nguyn Đức Thun, Nhp môn khai phá dliu và qun trtri thc  
,
NXB Thông tin và Truyn thông, 2013.  
[2] Trn ThKim Hng, ng dng khai phá dliu dự đoán bnh đái  
tháo đường, Lun văn 2014.  
[3] Jiawei Han and Micheline Kamber, Datamining: Concepts and  
Techniques, Simon Fraser University, 2011.  
[4] JamieMacLennan, Z.T., Bogdan Crivat, Data Mining with Microsoft  
SQL Server 2008, Indianapolis, Indiana: Wiley Publishing, Inc, 2008.  
(BBT nhn bài: 24/07/2015, phn bin xong: 23/09/2015)  
pdf 10 trang yennguyen 16/04/2022 5160
Bạn đang xem tài liệu "Ứng dụng kỹ thuật phân cụm và luật kết hợp khai phá dữ liệu khách hàng sử dụng dịch vụ khách sạn", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • pdfung_dung_ky_thuat_phan_cum_va_luat_ket_hop_khai_pha_du_lieu.pdf