Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử

Vietnam J. Agri. Sci. 2021, Vol. 19, No. 4: 520-534  
Tp chí Khoa hc Nông nghip Vit Nam 2021, 19(4): 520-534  
MT SPHƯƠNG PHÁP GI Ý VÀ NG DNG TRONG THƯƠNG MẠI ĐIN TỬ  
Hoàng Th1*, Ngô Nguyn Thc2  
1Khoa Công nghthông tin, Hc vin Nông nghip Vit Nam  
2Sinh viên K57 - Khoa Công nghthông tin, Hc vin Nông nghip Vit Nam  
*Tác giliên h: htha@vnua.edu.vn  
Ngày nhn bài: 20.07.2020  
Ngày chp nhận đăng: 29.03.2020  
TÓM TT  
Hgi ý (Recommender System) là công cụ được thiết kế nhm cung cp nhng khuyến nghhu ích vsn  
phm, dch vụ,…cho người dùng. Hgi ý da trên dliu vmi quan hgiữa người dùng, sn phm và các hành  
vi của người dùng trong quá khứ đối vi sn phẩm để đưa ra những gi ý thông minh, phù hp vi sthích ca  
tng khách hàng. Hgợi ý giúp khách hàng nhanh chóng định vị được nhng sn phm họ quan tâm để từ đó đưa  
ra quyết định đúng đắn khi mua sm online. Trong bài báo này, chúng tôi trình bày tng quan mt số phương pháp  
gợi ý, đánh giá điểm mạnh, điểm yếu, so sánh hiu quthc hin ca mỗi phương pháp. Chúng tôi chỉ ra li ích mà  
các hgi ý mang lại cho thương mại điện tử, đồng thi nêu ra nhng thách thc và gii pháp khc phc. Kết quả  
thc nghim ca chúng tôi trên 4 tp dliu chun (Movielens, Epinions, BookCrossing, LastFM) cho thy mi  
phương pháp đều có những ưu điểm và hn chế riêng, không có phương pháp nào là tốt nht trên tt ccác tiêu chí.  
Ngoài ra, chúng tôi cũng đưa ra quy trình chung để xây dng hgợi ý trong các website thương mại và thc hin tích  
hp các kthut hgợi ý trong website thương mại điện tkhc phc vấn đề người dùng mi, sn phm mi (vn  
đề này còn gi là “Cold start problem”) của các phương pháp gi ý cá nhân hóa.  
Tkhóa: Hgi ý, lc cng tác, gi ý da trên ni dung, hgi ý kết hợp, thương mại điện t.  
Some Methods of Recommender System and its Application in E-Commerce  
ABSTRACT  
The designed recommender system is a tool to provide important suggestions forusers or customers. Based on  
the datasets of user relationships, products, andprevious behavior of consumers, smart recommendations for the  
preferences of eachconsumer are given, which helps consumers tomake good decisions while shopping online. In  
this article, we present an overview of some methodologies of recommendation systems, techniques of recommender  
systems, and evaluate the strengths and weaknesses of each technique, as well as comparedsome benefits of  
recommender systems in e-commerce. Moreover, we report some challenges that the recommender systems are  
facing and list some solutions to solve these challenges. Our experimental results on the four datasets  
(Movielens100k, Epinions,BookCrossing, LastFM) showed that there was no best recommendation algorithm in all  
evaluation metrics. Finally, we built an e-commerce website that integrated some different techniques of  
recommender systems such as non-personalized methods, personalized methods to recommend the right product for  
each customer. The experimental system gives some diverse suggestions to overcome the problem "Cold start  
problem" of personalized methods.  
Keywords: Recommender systems, collaborative filtering, content-based filtering, hyper filtering, E-Commerce.  
đổi hình thĀc giao dðch truyn thng. Ngày càng  
1. ĐẶT VẤN ĐỀ  
có nhiều ngþąi lăa chn hình thĀc mua sím trăc  
tuyến. Trong khi đò, để mć rng thð trþąng kinh  
doanh, các doanh nghiệp đã xåy dăng Āng dýng  
thþĄng mäi điện tā và cung cçp rçt nhiu sân  
phèm trên website. Tuy nhiên, khi thông tin  
Trong nhĂng nëm gæn đåy, cùng vĆi să phổ  
biến cûa mäng Internet và máy tính, thþĄng  
mäi điện tā đã phát triển nhanh chóng trên  
phäm vi toàn cæu. ThþĄng mäi điện tā đã thay  
520  
Hoàng ThHà, Ngô Nguyn Thc  
quá nhiu, khách hàng stn thąi gian để tìm  
sân phèm hcæn. Điều này, làm giâm să hài  
lòng và să trung thành cûa khách. Để giâi quyết  
vçn đề này, ý tþćng chính cûa các chuyên gia  
thþĄng mäi điện tā là thiết lêp hthng gi ý  
thông minh nhìm khám phá ra các mt hàng  
phù hp nhçt cho tÿng ngþąi dùng. VĆi hthng  
gi ý tă động, khách hàng có thnhanh chóng  
truy cêp đþợc sân phèm hp vĆi sć thích và nhu  
cæu cûa h, tiết kim thąi gian tìm sân phèm  
cho ngþąi dùng (Thomas, 2006).  
động đþa ra nhĂng gi ý thông minh, đa däng  
tĆi ngþąi dùng.  
2. CÁC KTHUT HGI Ý  
Các kthuêt hgợi ý thþąng đþợc chia  
thành hai nhóm chính là: hgi ý cá nhân hóa  
và hgi ý không cá nhân hóa. Chúng tôi têp  
trung giĆi thiu tóm tít phþĄng pháp gợi ý  
không cá nhân hóa và mt sthuêt toán gi ý cá  
nhân hóa tiêu biểu thþąng đþợc sā dýng trong  
các trang thþĄng mäi điện tā.  
NhĂng nëm gæn đåy, các kthuêt hgợi đã  
và đang đþợc nghiên cĀu, Āng dýng ć nhiều lïnh  
văc. Trong thþĄng mäi điện tā, hgi ý mang  
läi nhiu li ích cho câ ngþąi cung cçp dðch vý  
và ngþąi sā dýng dðch vý (Ionos, 2017). Hæu hết  
các công ty thþĄng mäi lĆn nhþ: Amazon  
(Amazon.com), CDNOW (www.cdnow.com),  
2.1. Hgi ý không cá nhân hóa (non-  
personalized recommender systems )  
Là nhòm phþĄng pháp không dăa vào hồ sĄ  
cá nhân tÿng khách hàng mà chî dăa vào đặc  
tính cûa sân phèm (sân phèm mĆi) và đánh giá  
tÿ cộng đồng nhþ: sân phèm bán chäy nhçt, sân  
phèm đþợc đánh giá tốt nhçt,„ (Singh, 2019)  
eBay  
(eBay.com),  
Alibaba  
(Alibaba.com),  
MovieFinder (MovieFinder.com), Youtube.com,  
Facebook.com,„ đều sā dýng các kthuêt gi ý  
trong website cûa họ để nâng cao trâi nghim  
cho khách hàng, nâng cao chçt lþợng dðch vý và  
tëng doanh thu bán hàng. Tuy nhiên, ć Vit  
Nam - mt quc gia có rçt nhiu tiềm nëng về  
thþĄng mäi điện tā (Vin Thông, 2020) läi có số  
lþợng website thþĄng mäi tích hp hgi ý  
không nhiu (Nguyễn Hùng Düng & Nguyễn  
Thái Nghe, 2013). Hin Việt Nam đang cò 44%  
doanh nghiệp đã tham gia xåy dăng website  
thþĄng mäi, nhþng chî có 32% doanh nghip  
đþợc đánh giá cao kênh bán hàng thông qua  
trang web (Nguyễn Thanh Hþng, 2019).  
2.2. Hgi ý cá nhân hóa (personalized  
recommender systems)  
Nhòm phþĄng pháp này đþợc đánh giá là  
mang läi hiu quâ cao đối vĆi thþĄng mäi điện tā.  
Nếu doanh nghip hiu rõ tÿng khách hàng cûa  
mình dăa trên nhĂng gì họ tþĄng tác và mua  
hàng trên mäng, doanh nghip có thể tþ vçn cho  
khách hàng nhĂng sân phèm phù hp vĆi mong  
mun và sć thích cûa khách hĄn (Google &  
Temasek, 2018). Khách hàng stiết kiệm đþợc  
thąi gian tìm kiếm sân phèm, mua đþợc nhĂng  
mòn hàng đúng sć thích. Tÿ đò, doanh nghiệp sẽ  
tëng đþợc số lþợng ngþąi mua hàng, tëng giá trð  
đĄn hàng, tëng doanh số bán hàng.  
Bài báo này trình bày tng quan các  
phþĄng pháp gợi ý, đánh giá hiệu quâ cûa các  
thuêt toán gi ý (Content-based, user-based và  
item-based) trên mt stêp dĂ liu chuèn bao  
gm: Movielens, Epinions, BookCrossing và  
LastFM. Chúng tôi thâo luên nhĂng điểm  
mänh, điểm yếu cûa mỗi phþĄng pháp, thách  
thĀc và giâi pháp khíc phýc khi xây dăng hgi  
ý trong thþĄng mäi điện tā. Đồng thąi, chúng tôi  
đþa ra quy trình xåy dăng hgi ý trong các  
website thþĄng mäi và thăc hiện cài đặt các kỹ  
thuêt hgợi ý trong website thþĄng mäi điện tā.  
Kết quâ cài đặt cho thçy, khi website đþợc tích  
hp các phþĄng pháp hgi ý hthng stă  
Theo nghiên cĀu cûa Schafer & cs. (2001),  
nếu doanh nghip sā dýng phþĄng pháp gợi ý cá  
nhân hòa để gāi email tĆi khách hàng thì tlệ  
giao dðch thông qua email cao hĄn gçp hai læn  
so vĆi các email đþợc gāi không áp dýng phþĄng  
pháp này (Stephan, 2019). Do đò, các phþĄng  
pháp gi ý cá nhån hòa làm tëng mĀc độ tþĄng  
tác và chuyển đổi trong giao dðch thþĄng mäi  
điện tā.  
Mt số phþĄng pháp gợi ý thuc loäi cá  
nhân hóa nhþ sau:  
521  
Mt sphương pháp gi ý và ng dng trong thương mại điện tử  
ngþąi dùng đò kết hp quan điểm cûa nhĂng  
2.2.1. Gi ý da trên ni dung (Content-  
ngþąi dùng khác. Đåy là kỹ thuêt mänh và đã  
đþợc áp dýng khá thành công trong các hệ  
thống thþĄng mäi lĆn. Lc cng tác thu thêp  
phân hi tÿ nhiều ngþąi dùng đối vĆi sân phèm,  
lþu trĂ phân hi cûa ngþąi dùng dþĆi däng ma  
trên ngþąi dùng (users) - sân phèm (items). Mi  
dòng là một vectĄ chĀa giá trð phân hi cûa  
ngþąi dùng đối vĆi các sân phèm. Sau đò, tính  
độ tþĄng tă giĂa các users hoc giĂa các items  
trong hthng, tìm ra mối tþĄng quan và đþa  
ra gi ý phù hợp. Độ tþĄng tă giĂa các user hoc  
giĂa các item đþợc tính theo công thĀc Cosin  
hoc Pearson.  
based filtering)  
PhþĄng pháp gợi ý này dăa trên mô tâ cûa  
sân phèm và profile cûa tÿng ngþąi dùng  
(không quan tåm đến ngþąi dùng khác). Gi ý  
dăa trên ni dung sthu thêp hồ sĄ cûa ngþąi  
dùng: htên, giĆi tính, nghnghip... và tþĄng  
tác cûa cá nhån ngþąi dùng trên các sân phèm,  
sau đò so sánh đặc điểm các sân phèm trong cĄ  
sć dĂ liu vĆi đặc điểm các sân phèm mà khách  
hàng đã quan tåm để gi ý cho khách hàng.  
2.2.2.  
Lc  
cng  
tác  
(Collaborative  
Filtering - CF)  
Bâng 1 là ma trên biu diễn đánh giá cûa  
ngþąi dùng trên các sân phèm.  
Lc cng tác gi ý sân phèm tĆi ngþąi dùng  
dăa trên lðch sā tþĄng tác sân phèm cûa chính  
Hình 1. Mô hình hgi ý da trên ni dung  
Bâng 1. Ma trn biu diễn người dùng - sân phm ca tiếp cn lc cng tác  
522  
Hoàng ThHà, Ngô Nguyn Thc  
Cò hai phþĄng pháp lọc cng tác:  
mäi điện tā lĆn nhþ Amazon, Tiki, Youtube  
và Facebook.  
User-based: Dă đoán dăa trên să tþĄng tă  
giĂa các users. Ý tþćng quan trng cûa phþĄng  
pháp này là nhĂng khách hàng tþĄng tă có xu  
hþĆng sā dýng nhĂng sân phèm tþĄng tă  
(Singh & Pramod, 2019). Nếu hai khách hàng A,  
B có lðch sā đánh giá các sân phèm tþĄng tă  
nhau thì User-basedsdă đoán khách hàng A  
có khâ nëng sẽ quan tâm tĆi nhĂng sân phèm  
chþa đþợc trâi nghiệm nhþng đã đþợc khách  
hàng B thích và ngþợc läi. PhþĄng pháp này  
phân tích ma trên user-item để tìm ra nhĂng  
ngþąi dùng tþĄng tă.  
2.2.3.  
Phương  
pháp  
kết  
hp  
(hybrid method)  
PhþĄng pháp này kết hp giĂa kthuêt gi  
ý dăa trên ni dung và lc cng tác. Kthuêt  
này đþợc xem là khá hiu quâ và giâi quyết  
đþợc vçn đề “cold - start problem” trong rçt  
nhiu nghiên cĀu. Trang thþĄng mäi điện tā  
điển hình đã Āng dýng phþĄng pháp này là  
Spotify.com. Họ đã tích hợp phþĄng pháp hệ gi  
ý tng hợp để täo ra danh sách các bài hát hàng  
tuæn cho tÿng khách hàng riêng bit. Website  
đã tổng hp dĂ liệu ngþąi dùng dăa trên thói  
quen nghe nhäc và nhĂng ngþąi dùng tþĄng tă  
để täo ra một danh sách các bài hát độc đáo phù  
hp vĆi sć thích cûa tÿng khách hàng.  
Item-based : Dă đoán dăa trên să tþĄng tă  
giĂa các items. Hai sân phèm i và i’ đã đþợc  
cộng đồng đánh giá tþĄng tă nhau thì có thsẽ  
đþợc đánh giá tþĄng tă bći nhĂng ngþąi dùng  
còn läi. PhþĄng pháp này phån tích ma trên  
user-item để nhên din các sân phèm tþĄng tă.  
2.3. Mc tiêu của các phương pháp gợi ý  
Ngày nay, kthuêt lc cộng tác đþợc sā  
dýng khá phbiến trên các trang thþĄng  
Mýc tiêu cûa các phþĄng pháp gợi ý đþợc  
thhin trong bâng 2.  
Hình 2.Tiến trình lc cng tác  
Hình 3. Lc cng tác da trên User-based và Item-based  
523  
Mt sphương pháp gi ý và ng dng trong thương mại điện tử  
Hình 4. Mô hình hgi ý kết hp  
Bâng 2. Mc tiêu khái nim của các phương pháp gợi ý  
Phương pháp (Methods)  
Mục tiêu (concept goals)  
Đầu vào (Inputs)  
Gợi ý không cá nhân hóa  
(Non-personalized  
Gợi ý những sản phẩm mà người dùng có thể thích  
dựa trên sản phẩm mới hoặc ý kiến cộng đồng.  
recommender systems)  
Lọc dựa trên nội dung  
(Content-based filtering)  
Gợi ý những sản phẩm khách hàng có thể thích dựa  
trên hồ sơ cá nhân của người dùng và độ tương tự  
giữa các sản phẩm trong cơ sở dữ liệu với những sản  
phẩm mà khách hàng đã thích trong quá khứ.  
Thuộc tính (item attributes) của sản phẩm  
hoặc Profiles của người dùng.  
Lọc cộng tác (Collaborative Gợi ý những sản phẩm mà người dùng có thể thích  
Đánh giá của User + Đánh giá của cộng  
đồng  
Filtering)  
dựa trên những người dùng có sở thích tương tự.  
Phương pháp kết hợp  
(Hybrid method)  
Gợi ý những sản phẩm mà người dùng có thể thích  
dựa trên việc kết hợp Content-based filtering và  
Collaborative Filtering.  
Thuộc tính của sản phẩm+ đánh giá của  
Users và cộng đồng.  
- Xây dăng lòng trung thành (Building  
Loyalty): Trong chiến lþợc kinh doanh, việc đät  
đþợc lòng trung thành cûa ngþąi tiêu dùng là  
một điều cæn thiết. Khi lòng trung thành cûa  
khách hàng tëng lên, lợi nhuên cüng sẽ tëng lên  
(Reichheld & F., 1993). Các hthng gi ý câi  
tiếnlòng trung thành bìng cách tìm hiu, thu  
thêp thông tin, nhu cæu, sć thích và các mi  
quan tâm cûa khách. Tÿ đò, sā dýng các thuêt  
toán thông minh cá nhån hòa để gi ý phù hp  
chotÿng khách hàng, giúp hhài lòng, có nim  
tin quay läi trang web để mua hàng.  
3. VAI TRÒ CA HGI Ý TRONG  
THƯƠNG MẠI ĐIỆN TỬ  
Trong thþĄng mäi điện tā, hgợi ý đòng vai  
trñ nhþ một “chuyên gia” thông minh hỗ trợ  
khách hàng trong quá trình tìm và chn mua  
sân phèm. Hgợi ý thúc đèy thþĄng mäi điện tā  
(Schafer & cs., 2001) theo các cách sau:  
- Chuyn khách vãng lai thành ngþąi mua  
hàng (Converting Browsers into Buyers): Khách  
vãng lai thþąng ghé thëm website để xem trang  
web mà không mua hàng. Các hthng gi ý sẽ  
hiu nhu cæu cûa khách, hin thð nhĂng sân  
phèm mà khách thích, hoặc đang muốn tìm  
mua. Bìng cách này, hthng schuyn nhĂng  
khách vãng lai thành khách mua hàng.  
VĆi nhĂng khâ nëng trên, hệ gi ý mang läi  
trâi nghim tt cho khách hàng, giúp khách  
hàng giâm thąi gian tìm kiếm sân phèm, nâng  
cao tlchuyển đổi mua hàng, câi thin vic bó  
gió hàng và giĂ khách quay trć läi mua hàng.  
Tÿ đò, hệ gợi ý giúp các thþĄng nhån tëng giá  
trð đĄn hàng trung bình, tëng doanh thu  
bán hàng (Dias & cs., 2008; Jordan, 2016;  
Stephan, 2019).  
- Tëng cþąng bán chéo (Increasing Cross-  
sell): Các hthng gi ý câi thin bán chéo bìng  
cách đề xuçt các mặt hàng liên quan đến sân  
phèm, các sân phèm phý kin bsung cho  
khách mua hàng.  
524  
Hoàng ThHà, Ngô Nguyn Thc  
website, lþợng khách hàng đánh giá trênsân  
phèm rçt ít, nên các thuêt toán gợi ý khò đoán  
đþợc sć thích cûa ngþąi dùng. Đåy cüng là một  
vçn đề lĆn cûa các hgi ý (Sharma & Gera,  
2013). Bći dĂ liu phâi đû lĆn các thuêt toán gi  
ý mĆi có nhĂng gi ý chính xác. Các nhà khoa hc  
đã và đang cố gíng nghiên cĀu để làm giâm vçn  
đề này, nhþng hiện vén còn là mt bài toán khó  
cæn đþợc nghiên cĀu nhiều hĄn. DþĆi đåy là một  
sgiâi pháp đþợc đề xuçt (Khusro & cs., 2016):  
4. THÁCH THC CA HGI Ý TRONG  
THƯƠNG MẠI ĐIỆN TVÀ GII PHÁP  
KHC PHC  
4.1. Vấn đề khách hàng mi, sân phm mi  
(Cold-startproblem)  
Mt trong nhĂng thách thĀc đối vĆi bçt kỳ  
hthng gi ý nào là vçn đề ngþąi dùng mĆi (new  
user) hoc sân phèm mĆi (new item). Hồ sĄ cûa  
ngþąi dùng rng và họ chþa xếp häng bçt ksân  
phèm nào. Vì vêy, các giâi thuêt gi ý không thể  
hiểu đþợc khách hàng và không dă đoán đþợc sć  
thích, nhu cæu cûa h(Sharma & Gera, 2013).  
Vçn đề này gọi là “Cold start problem” và có thể  
đþợc giâi quyết bìng cách sā dýng hgi ý không  
cá nhån hòa để gi ý nhĂng sân phèm mĆi,  
nhĂng sân phèm bán chäy, nhĂng sân phèm  
đþợc nhiu ngþąi đánh giá cao,... (Schafer & cs.,  
2007; Mohamed & cs., 2019).  
Giâi pháp 1: Sā dýng mô hình gợi ý đa  
chiu (Adomavicius & cs., 2005) và sā dýng các  
kthuêt hiu quâ giâi quyết bài toán dă đoán  
đối vĆi ma trên thþa nhþ giâi pháp cûa Xue &  
cs. (2015), giâi pháp cûa Lei & cs. (2019).  
Giâi pháp 2: Dăa trên nhĂng phân hi tim  
èn cûa ngþąi dùng (implicit feedback) nhþ: lðch  
sā xem hàng, mua hàng„ để bsung dĂ liu vào  
ma trên ngþąi dùng - sân phèm nhìm hän chế  
mĀc độ thþa cûa ma trên ít ngþąi dùng đánh giá.  
4.2. Vấn đề khâ năng mở rng và hiu sut  
thi gian thc  
Giâi pháp 3: Chia sẻ thông tin ngþąi dùng  
giĂa các trang web không có cänh tranh, đặc  
bit có thkhai thác thêm dĂ liu tÿ các trang  
mäng xã hội. Thông tin ngþąi dùng càng nhiu,  
càng đæy đû sgiúp các thuêt toán gi ý hiu  
khách hàng hĄn và tþ vçn chính xác hĄn. Lþu ý,  
các bên khi chia sdĂ liệu ngþąi dùng phâi cam  
kết chî dùng dĂ liệu đþợc chia sẻ để phýc vý tþ  
vçn tốt hĄn và có trách nhim bâo vthông tin  
ngþąi dùng.  
Khi lþợng dĂ liu ngày càng lĆn dæn lên,  
làm thế nào để các hgi ý làm vic hiu quâ  
đang là mối quan tâm cûa các nhà khoa hc và  
cûa doanh nhân sā dýng hthống thþĄng mäi  
điện tā. VĆi website lĆn, hthng phâi täo ra  
các gợi ý trong vñng đĄn vð giây trong khi phýc  
vý hàng trëm hoặc hàng ngàn ngþąi tiêu dùng  
cùng mt lúc. Số lþợng yêu cæu gợi ý đồng thąi  
ngày càng lĆn, số lþợng sân phèm ngày càng  
tëng, hành vi tþĄng tác cûa ngþąi dùng trên các  
sân phèm ngày càng nhiu. Hin täi, để giâi  
quyết phæn nào vçn đề này ngoài việc đæu tþ n  
hĄn cho các hệ thng tính toán mänh cæn phâi  
áp dýng thêm các thuêt toán giâm chiu, xā lý  
song song và đặc bit nên chäy các thuêt toán  
offline để có thgợi ý online nhanh hĄn (Khusro  
& cs., 2016). Tuy nhiên, đåy là vçn đề khó và  
đang là mt thách thĀc cûa các hthng gi ý.  
5. ĐÁNH GIÁ CÁC PHƯƠNG PHÁP GI Ý  
5.1. Điểm mänh và điểm yếu ca các  
phương pháp hgi ý  
Bâng 3 là kết luên cûa chúng tôi vnhĂng  
þu điểm và hän chế cûa các phþĄng pháp hệ  
gi ý.  
5.2. Đánh giá độ chính xác ca các phương  
pháp gi ý  
4.3. Vấn đề thưa thớt ca dliệu đánh giá  
(Sparsity)  
5.2.1. Dliu thc nghim  
Chúng tôi đánh giá hiệu quâ thăc hin cûa  
các thuêt toán content-based, user-based, item  
based đã đþợc giĆi thiu ć trên bìng cách chäy  
thā nghim trên 4 têp dĂ liu chuèn: Movielens  
Mt thách thĀc nĂa đối vĆi hgi ý täi các  
trang thþĄng mäi điện tā là să thþa thĆt vdĂ  
liệu khách hàng đánh giá sân phèm. Rçt nhiu  
525  
Mt sphương pháp gi ý và ng dng trong thương mại điện tử  
(GroupLens, 1998), Epinions (Trademark  
Notice, 2003), BookCrossing (University of  
Freiburg, 2004), LastFM (GroupLens, 2011).  
RMSE  
Ratingmax Ratingmin  
NRMSE   
Trong đò:  
5.2.2. Phương pháp đánh giá và môi trường  
thnghim  
n
2
1
RMSE  
p r  
i   
n   
i
1
a. Phương pháp đánh giá  
vĆi n là squan sát, pi là giá trð dă đoán  
đánh giá cûa sân phèm i và ri là giá trð đánh giá  
thăc tế cûa sân phèm i.  
Chúng tôi chia têp dĂ liu ra làm 2 phæn,  
lçy ngéu nhiên 70% têp dĂ liu để training và  
30% dĂ liu còn läi để testing. Chúng tôi thăc  
hin 5 læn lp trên các têp dĂ liệu.Độ đo  
NRMSE (Normalized Root Mean Square Error)  
và thąi gian thăc hiện (time) đþợc chúng tôi sā  
dýng để đánh giá hiệu quâ cûa các thuêt toán.  
Ratingmax, Ratingmin læn lþợt là điểm lĆn nhçt  
và nhó nhçt cho phép ngþąi dùng đánh giá.  
b. Môi trưng thnghim  
Môi trþąng đþợc sā dýng thā nghim là  
máy tính Intel(R) Corei5-6300U, CPU  
2.5GHz, RAM 8GB và ngôn ngĂ Python trên hệ  
điều hành Microsoft Window 10.  
@
Độ đo NRMSE dùng để xác đðnh sai số  
chuèn hóa cûa các thuêt toán và đþợc xác đðnh  
bìng công thĀc:  
Bâng 3. Điểm mänh và điểm yếu của các phương pháp gợi ý  
STT  
1
Phương pháp  
Điểm mạnh  
Điểm yếu  
Gợi ý không cá nhân  
hóa (Non-personalized  
recommender  
1. Đơn giản  
1. Gợi ý chung chung, không cá nhân hóa  
đến từng khách hàng. Vì vậy mọi khách đều  
có kết quả gợi ý giống nhau.  
2. Gợi ý không phụ thuộc vào dữ liệu của  
khách hàng trên hệ thống nên áp dụng được  
cho mọi khách hàng, giúp tăng cơ hội chuyển  
đổi khách hàng.  
systems)  
2
Lọc dựa trên nội dung  
(Content-based  
filtering)  
1. Hệ thống không sử dụng dữ liệu của người  
dùng khác mà vẫn gợi ý được những sản  
phẩm phù hợp với sở thích của từng khác  
hhàng riêng biệt.  
1. Hệ thống phải phân tích và dò tìm tất cả  
các đặc trưng của sản phẩm để tạo ra danh  
sách gợi ý, nên có thể chậm hoặc nếu hồ sơ  
về sản phẩm không đúng có thể dẫn đến  
gợi ý sai.  
2. Có khả năng gợi ý được cả những sản  
phẩm mới cho người dùng.  
2. Không thể gợi ý nếu khách hàng không  
có lịch sử đánh giá xem/thích các sản phẩm  
trên hệ thống.Với khách hàng mới, hệ thống  
không thể cung cấp gợi ý phù hợp.  
3. Không gợi ý được thêm các sở thích mới  
của khách.  
4
Lọc cộng tác  
(Collaborative  
Filtering)  
1. Hệ thống không cần sử dụng đến hồ sơ  
nhân khẩu học của người dùng để gợi ý  
sản phẩm.  
1. Không thể gợi ý nếu khách hàng chưa  
từng tương tác với các mặt hàng.  
2. Không thể gợi ý được các sản phẩm mới  
hoặc sản phẩm chưa được ai đánh giá.  
2. Có khả năng dự đoán được sở thích và nhu  
cầu của người dùng mà không cần hiểu sản  
phẩm.  
3. Khi lượng sản phẩm lớn nhưng số lượng  
khách hàng đánh giá không nhiều thì  
phương pháp này không hiệu quả.  
3. Có thể gợi ý tới người dùng những sản  
phẩm bên ngoài sở thích đang có.  
Nhữngnhững sản phẩm này có thể phù hợp sở  
thích mới của họ.  
5
Phương pháp tổng  
hợp (Hybrid method)  
1. Kết hợp tất cả các ưu điểm của phương  
pháp Content-based filtering và Collaborative  
Filtering.  
1. Không thể gợi ý cho người dùng mới  
2. Khi lượng sản phẩm lớn nhưng số lượng  
khách hàng đánh giá không nhiều thì  
phương pháp này không hiệu quả.  
526  
Hoàng ThHà, Ngô Nguyn Thc  
Bâng 4. Thông tin các tp dliu thnghim  
Datasets  
#Items  
1,700  
#Users  
1,000  
# Rating  
100,000  
Range Rating  
1÷5  
Mô tả  
Movielens 100K  
Chứa đánh giá của người dùng trên các các  
bộ phim. Mỗi bộ phim có các đặc trưng (id,  
title, realise date, type, rating, time )  
Epinion  
138,738  
49,290  
139,738  
1÷5  
Chứa quan điểm của người dùng về các  
sản phẩm thương mại  
BookCrossing  
LastFM  
271,379  
17,632  
278,858  
1,892  
1,149,780  
92,834  
1÷10  
Chứa đánh giá của người dùng về sách.  
Số lần các bài hát  
được bật bởi  
users  
Chứa danh sách top những bài hát được  
người dùng nghe nhiều nhất (2100 users  
and 18,745)  
thuêt gợi ý cá nhån hòa nhþ: phþĄng pháp gợi ý  
dăa trên nội dung, phþĄng pháp gợi ý lc cng  
tác để thông báo cho khách hàng nhĂng sân  
phèm hcó ththích, htrkhách hàng trong  
quá trình tìm mua sân phèm.  
5.2.3. Kết quâ thnghim  
Kết quâ ć bâng 5 cho thçy, thuêt toán  
Content - based có thąi gian chäy nhanh hĄn  
User-based và Item-based, nhþng độ chính xác  
không cao. GiĂa thuêt toán User-based và  
Item-based, nếu xét vsai scûa dă đoán  
thìtiếp cên lc cng tác dăa trên sân phèm  
(Item-based) cho sai sthçp hĄn (hay cho độ  
chính xác cao hĄn) tiếp cên lc cng tác dăa  
trênngþąi dùng (User - based) vĆi tl3/4 têp  
dĂ liu. Tuy nhiên, xét vthąi gian thăc hin  
thì phþĄng pháp lc cng tác dăa trên ngþąi  
dùng thăc hiện nhanh hĄn nhiều so vĆi phþĄng  
pháp lc cng tác dăa trên sân phèm câ giai  
đoän huçn luyện (training) và giai đoän kim  
thā (testing) ć câ 4 têp dĂ liệu. Do đò, cò thể nói  
phþĄng pháp lọc cng tác dăa trên User - based  
scó khâ nëng mć rng (scability) tốt hĄn  
phþĄng pháp Item - based. Vì vêy, khó có thuêt  
toán nào là tt nhçt trên mi tiêu chí. Tùy theo  
mýc đích gợi ý và Āng dýng thăc tế để chn  
phþĄng pháp gợi ý phù hp.  
6.1. Tng quan vcách tiếp cn  
Cách tiếp cên tng quan cûa chúng tôi đþợc  
thhin trong hình 5.  
6.2. Lung xlý chính trong hthng  
Lung xā lý chính trong hthống đþợc thể  
hin trong hình 6.  
Giâi thích: Hthng skim tra xem khách  
hàng cò đëng nhêp hay không. Nếu khách hàng  
cò đëng nhêp, hthng skim tra xem khách  
hàng đã cò độ tþĄngtă vĆi ngþąi khác hay chþa,  
nếu có thì ssā dýng mô hình lc cộng tác để  
hin thð thông tin gợi ý, ngþợc läi hthng sẽ  
kim tra xem khách hàng có thông tin cá nhân  
để quyết đðnh lăa chn mô hình nhân khèu hc  
hoặc không cá nhån để đþa ra gợi ý cho khách  
hàng. Trþąng hp gi ý dăa trên mô hình không  
cá nhân thì sẽ đþa ra nhĂng sân phèm mĆi, sân  
phèm bán chäy, sân phèm đþợc nhiu khách  
hàng quan tâm.  
6. TÍCH HP HGI Ý TRONG HTHNG  
BÁN HÀNG TRC TUYN  
Để thā nghim trăc quan hgi ý Āng dýng  
trong thþĄng mäi điện tā, chúng tôi tiến hành  
xây dăng hthng bán sách trăc tuyến tích hp  
vĆi các thuêt toán gi ý đã trình bày ć trên.  
Trong trþąng hợp khách hàng không đëng  
nhêp, hthng skim tra lðch sā khách hàng  
đã tÿng truy cêp vào trang web dăa vào IP  
máy tính mà khách hàng truy cêp, hthng sẽ  
lþu vết läi lðch sā quá trình truy cêp. Nếu có  
thông tin dăa theo đða chî IP, hthng sẽ đþa  
ra gi ý vnhĂng sân phèm mà khách hàng đã  
tÿng xem.  
Hthng sā dýng thuêt toán gi ý không cá  
nhån hòa để hin thð các sân phèm mĆi, sân  
phèm bán chäy nhçt, sân phèm đþợc þa thích  
nhçt. Đặc bit, hthng tích hp mt skỹ  
527  
Mt sphương pháp gi ý và ng dng trong thương mại điện tử  
Bâng 5. Sai sdự đoán và thời gian thc hin trung bình 5 ln chäy  
ca các phương pháp lc cng tác  
Thời gian(sec)  
Dataset  
Thuật toán  
NRMSE  
Training  
0,093  
1,126  
0,147  
6,515  
7,518  
9,126  
20,142  
4,313  
39,326  
testing  
0,027  
Movielens (100K)  
Content - based  
User - based  
Item - based  
User - based  
Item - based  
User - based  
Item - based  
User - based  
Item - based  
0,317  
0,280  
0,288  
0,285  
0,254  
0,248  
0,282  
0,0131  
0,0103  
3,107  
7,793  
Epinion  
158,91  
3869,7  
171,73  
4030,5  
165,398  
4431,387  
BookCrossing  
LastFM  
Ghi chú: giá trtt nht ca các tiêu chí trên mi tp dliệu được tô đm.  
Thông tin  
vUsers  
Recommender System  
Thông tin vsn phm  
Tương tác ca User-item  
(User product interactions)  
(products cataluge)  
(products cataluge)  
Danh sách các sn phm  
gi ý cho khách  
Hình 5. Tng quan vcách tiếp cn  
sân phèm mĆi, sân phèm bán chäy, sân phèm  
đþợc nhiều ngþąi đánh giá.  
6.3. Tiến trình gi ý trong hthng website  
thương mäi  
- Nhóm 2: Sā dýng nhóm thuêt toán cá  
nhån hòa đã trình bày ć mýc 2.2 để gi ý cho  
khách hàng: thuêt toán nhân khèu hc, thuêt  
toán gi ý dăa trên ni dung (content - based),  
thuêt toán lc cng tác (Collaborative filtering)  
để đoán các sân phèm phù hp vĆi khách hàng.  
Tiến trình gi ý sân phèm trong hthng  
thþĄng mäi điện tā đþợc thhin trong hình 7.  
Tiến trình này bao gồm 3 giai đn:  
Giai đoän 1: Thu thêp thông tin ngþąi dùng  
Để có thdă đoán đþợc sć thích cûa ngþąi  
dùng, hthng phâi hc mt mô hình ngþąi  
dùng (User model). Mô hình ngþąi dùng mà  
chúng tôi thu thêp là các dĂ liu cûa ngþąi dùng  
nhþ: thông tin cá nhån, thông tin lðch sā tþĄng  
tác cûa ngþąi dùng trên sân phèm.  
Giai đoän 3: Gi ý: Giai đoän này, cën cĀ  
vào tÿng đặc điểm cûa khách hàng, hthng sẽ  
dă đoán và gợi ý nhĂng sân phèm mà khách  
hàng có ththích.  
Giai đoän 2: Sā dýng các thuêt toán gi ý:  
Giai đoän này, chúng tôi sā dýng dĂ liu thu  
thêp đþợc ć giai đoän 1 và dĂ liu sân phèm để  
chäy 2 nhóm thuêt toán:  
6.4. Mt sgiao din kết quâ chính ng vi  
3 giai đn gi ý ca hthng  
6.4.1. Trang đánh giá sản phm  
Giao diện đánh giá sân phèm đþợc thhin  
trong hình 8.  
- Nhóm 1: Sā dýng thuêt toán gi ý không  
cá nhân hóa (Non - personalized) để gi ý các  
528  
Hoàng ThHà, Ngô Nguyn Thc  
Hình 6. Lung xlý chính trong hthng  
Thu thp thông tin  
(Information collection)  
Phn hi  
(Feedback)  
Hc  
(Learning)  
Dự đoán/Gợi ý  
(Recommender System)  
Hình 7. Tiến trình gi ý trong hthng  
kiếm mt sân phèm, hthng shin thð danh  
6.4.2. Mt strang hun luyn mô hình  
- Trang thống kê đánh giá sân phèm cûa  
ngþąi dùng đþợc thhin trong hình hình 9.  
- Trang đo lþąng độ tþĄng tă giĂa các ngþąi  
dùng đþợc thhin trong hình 10.  
sách nhĂng sân phèm mĆi và nhĂng sân phèm  
tþĄng tă mà nhiều ngþąi quan tåm để gi ý cho  
khách hàng.  
b. Đối vi khách hàng thành viên  
Nếu khách hàng là thành viên cûa hệ  
thng, tÿng cò đánh giá sân phèm, website sẽ  
gi ý nhĂng sân phèm mĆi, sân phèm nhiu  
ngþąi quan tâm, sân phèm tþĄng tă. Ngoài ra,  
hthng còn dăa vào độ tþĄng tă giĂa các ngþąi  
6.4.3. Các kết qugi ý sn phm  
a. Đối vi khách hàng mi  
Nếu là khách hàng mĆi (khách hàng chþa  
đánh giá bçt ksân phèm nào), khi htìm  
529  
Mt sphương pháp gi ý và ng dng trong thương mại điện tử  
dùng để hin thð nhĂng sân phèm mà khách  
Nhþ vêy, bìng vic xây dăng mt Āng dýng  
thþĄng mäi điện tā có tích hợp đa däng các  
phþĄng pháp hệ gợi ý, website đã tă động đþa ra  
cho khách hàng các gợi ý khá thông minh, đa  
däng, trăc quan, phù hp vĆi tÿng cá nhân khách  
hàng và đã khíc phýc đþợc vçn đề ngþąi dùng  
mĆi, sân phèm mĆi. VĆi nhĂng khâ nëng trên cho  
thçy, hgi ý mang läi trâi nghim tt chokhách  
hàng, giúp khách hàng giâm thąi gian tìm kiếm  
sân phèm, tëng độ hài lñng, tëng cĄ hi mua  
hàng và nâng cao tlchuyển đi mua hàng.  
hàng chþa đþợc trâi nghim nhþng đã đþợc các  
khách hàng tþĄng tă khác đánh giá cao.  
- Trang gi ý nhĂng sân phèm ngþąi dùng  
có thể thích đþợc thhin trong hình 12.  
- Trang hin thð nhĂng sân phèm khách  
hàng đã xem hoặc đã mua đþợc thhin trong  
hình 13.  
- Trang gi ý sân phèm có thể đþợc mua  
cùng nhau đþợc thhin trong hình 14.  
Hình 8. Giao diện đánh giá sân phm của người dùng  
Hình 9. Giao din kết quâ đánh giá sân phm của người dùng  
530  
Hoàng ThHà, Ngô Nguyn Thc  
Hình 10. Giao diện đo lường độ tương tgiữa các người dùng  
Hình 11. Giao din gợi ý cho người dùng mi  
531  
Mt sphương pháp gi ý và ng dng trong thương mại điện tử  
Hình 12. Giao din gi ý các sân phẩm người dùng có ththích  
Hình 13. Giao din hin thnhng sân phẩm người dùng đã xem/mua  
Hình 14. Giao din gi ý các sân phm hay mua cùng nhau  
532  
Hoàng ThHà, Ngô Nguyn Thc  
TÀI LIU THAM KHO  
7. KT LUN  
Hgi ý có vai trò rçt quan trng trong  
Adomavicius G., Sankaranarayanan R., Sen S. &  
Tuzhilin A. (2005). Incorporating contextual  
information in recommender systems using a  
multidimensional approach.. ACM Transactions on  
Information Systems (TOIS). pp. 103-145.  
thþĄng mäi điện tā. Nó là mt trong nhĂng vü  
khí mänh mgiúp nhiu doanh nghiệp tëng  
doanh sbán hàng, là mt trong nhĂng nhân tố  
täo nên să thành công cûa các trang thþĄng mäi  
điện tā và sẽ đþợc Āng dýng rng rãi trong  
tþĄng lai.  
Dias M.B., Locher D., Li M., El-Deredy W. & Lisboa  
P.J. (2008). The value of personalised  
recommender systems to e-business: a case study.  
Proceedings of the 2008 ACM conference on  
Recommender systems. pp. 291-294.  
Trong nghiên cĀu này, chúng tôi đã trình  
bày tng quan vhgi ý, khám phá nhĂng tác  
động cûa hgợi ý đối vĆi thþĄng mäi điện tā.  
Bìng thăc nghiệm, chúng tôi đã so sánh đþợc  
hiu quâ thăc hin cûa các phþĄng pháp gợi ý  
Content-based, User-based và Item-based,  
đánh giá đþợc nhĂng đim mänh, điểm yếu cûa  
mỗi phþĄng pháp gợi ý. Ngoài ra, chúng tôi báo  
cáo thách thĀc cûa các phþĄng pháp gợi ý khi áp  
dýng trong thþĄng mäi điện tā và chî ra giâi  
pháp khíc phýc. Cuối cùng, chúng tôi đã xåy  
dăng thành công hthng bán hàng trăc tuyến  
có tích hợp các phþĄng pháp gợi ý khác nhau,  
bao gm kthuêt gi ý không cá nhân hóa  
(Non-personalized) và các kthuêt gi ý cá  
nhân hóa hiu quâ nhþ: gợi ý dăa trên ni dung  
(Content-based filtering), lc cng tác (User-  
based, Item-based). Qua đò, ngþąi đọc hiểu đþợc  
nn tâng lý thuyết hgợi ý, điểm mänh, điểm  
yếu cûa các hgợi ý cüng nhþ quy trình xåy  
dăng mt Āng dýng thþĄng mäi điện tā có tích  
hợp các phþĄng pháp gi ý trong thăc tế.  
GroupLens (1998). MovieLens 100K Dataset,  
movielens/ on October 03, 2020.  
Grouplens (2011). Last.FM. Retrieved from  
October 03, 2020.  
on  
Google & Temasek (2018). Báo cáoReport e-Conomy  
SEA 2018, Retrieved from  
.
Temasek_v.pdf on March 20, 2020.  
Ionos (2017). Recommendation systems in e-  
commerce. US: IONOS Inc. Retrieved from  
eting/online-sales/how-to-use-recommendation-  
systems-in-e-commerce on May 15, 2020.  
Jordan T. (2016). New insight from Experian  
Marketing Services helps brands prepare for the  
Khusro S., Ali Z. & Ullah I. (2016). Recommender  
systems: issues, challenges, and research  
opportunities. In Information Science and  
Applications (ICISA) 2016. Springer. In  
Information Science and Applications (ICISA).  
Lei Tang, Zongtao Duan, Yishui Zhu, Junchi Ma &  
Zihang Liu (2019). Recommendation for  
HþĆng nghiên cĀu trong tþĄng lai cûa lïnh  
văc này còn khá rng mć, đặc bit là các kỹ  
thuêt gi ý cá nhân hóa. Chúng tôi stiếp týc  
nghiên cĀu, câi tiến Āng dýng các thuêt toán gi  
Ridesharing  
Groups  
Through  
Destination  
Prediction on Trajectory Data. IEEE Transactions  
on Intelligent Transportation Systems. 99: 14.  
Mohamed M.H., Khafagy M.H. & Ibrahim M.H. (2019).  
Recommender Systems Challenges and Solutions  
survey. International Conference on Innovative  
Trends in Computer Engineering (ITCE)  
ý
trong lïnh văc e-commerce, lïnh văc  
e-learning để trợ giúp ngþąi dùng trong quá  
trình mua hàng, tìm kiếm tài liệu cüng nhþ hỗ  
trquá trình hc têp trăc tuyến.  
Nguyễn Hùng Dũng & Nguyễn Thái Nghe (2013). Hệ  
thng gi ý sn phm trong bán hàng trc tuyến sử  
dng kthut lc cng tác Tp chí Khoa hc,  
Trường Đại hc Cần Thơ. 31: 15.  
LI CẢM ƠN  
Nguyễn Thanh Hưng (2019). Báo cáo chsố thương  
mại điện t2019. Hip hội thương mại điện tử  
Vit Nam.  
Chúng tôi câm Ąn Khoa Công nghệ thông  
tin, Hc vin Nông nghip Việt Nam đã täo  
điều kin tt nhçt để chúng tôi thăc hin  
nghiên cĀu này.  
Reichheld & F.F. (1993). Loyalty-based management.  
Harvard business review. 71(2): 64-73.  
533  
Mt sphương pháp gi ý và ng dng trong thương mại điện tử  
International Conference Proceeding Series. ACM  
press. New York, USA. 8.  
Schafer Ben J., Joseph Konstan & John Riedl (2001).  
E-commence Recommendation Applications.  
Data Mining and Knowledge Discovery.  
5(1-2): 115-153.  
Trademark Notice (2003). Epinions dataset. Retrieved  
October 03, 2020.  
Sharma L.  
& Gera A. (2013). A survey of  
recommendation system: Research challenges.  
International Journal of Engineering Trends and  
Technology (IJETT). 4(5): 1989-1992.  
University of Freiburg (2004). BookCrossing,  
Retrieved  
from  
freiburg.de/~cziegler/BX/ on October 03, 2020  
Singh P. (2019). A Survey of Recommendation  
Systems in Electronic Commerce. Apress,  
Berkeley, CA. pp. 123-157.  
Viễn Thông (2020). Thương mại điện tVit Nam  
2020  
sẽ  
ra  
sao?  
Truy  
cp  
từ  
tu-viet-nam-2020-se-ra-sao-4045309.html, ngày10  
tháng 3 năm 2020.  
Stephan  
S.  
(2019).  
Personalized  
Product  
Recommendation Tips and Stats. Retrieved  
product-recommendations-stats/ on Feb 25, 2020.  
Xue A.Y., Qi J., Xie X., Zhang R., Huang J. & Li Y.  
(2015). Solving the data sparsity problem in  
destination prediction. The VLDB Journal.  
24(2): 219-243.  
Thomas T. (2006). Designing recommender systems  
for e-commerce: an integration approach. ACM  
534  
pdf 15 trang yennguyen 09/04/2022 4680
Bạn đang xem tài liệu "Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • pdfmot_so_phuong_phap_goi_y_va_ung_dung_trong_thuong_mai_dien_t.pdf