Đề tài Tìm hiểu và ứng dụng seo vào trang web Toancaumobile.vn

LỜI CAM ĐOAN  
Tôi cam đoan đây là công trình nghiên cu ca tôi. Nhng kết quvà các số  
liu trong chuyên đề chưa được ai công bdưới bt chình thc nào. Tôi hoàn  
toàn chu trách nhim trước nhà trường vscam đoan này.  
Huế, ngày 01 tháng 05 năm 2016  
Sinh viên thc hin  
Nguyn  
Tun  
Vũ  
Chuyên đề tốt nghiệp Đại học  
GVHD: Th.S Lê Văn Hòa  
MỤC LỤC  
SVTH: Nguyễn Tuấn Vũ  
i
Lớp: K46 TMĐT  
Chuyên đề tốt nghiệp Đại học  
GVHD: Th.S Lê Văn Hòa  
SVTH: Nguyễn Tuấn Vũ  
ii  
Lớp: K46 TMĐT  
Chuyên đề tốt nghiệp Đại học  
GVHD: Th.S Lê Văn Hòa  
DANH MỤC HÌNH  
SVTH: Nguyễn Tuấn Vũ  
iv  
Lớp: K46 TMĐT  
Chuyên đề tốt nghiệp Đại học  
GVHD: Th.S Lê Văn Hòa  
CHƯƠNG 1. TỔNG QUAN  
1.1. ĐẶT VẤN ĐỀ  
Website – ngôi nhà ca Doanh nghip trên Internet, nếu nói tên min là  
bng hiu ca mt Công ty thì website chính là văn phòng ca Công ty đó, là  
nơi khách hàng tìm kiếm các thông tin vdoanh nghip trước khi kí hp đồng, là  
nơi khách hàng và các đối tác liên hdoanh nghip, là bmt ca doanh nghip…  
Ngoài ra website còn to ra không ít li thế khác như :  
Hướng hot động ca doanh nghip từ nội địa hoc cc bra toàn cu.  
Website là nơi trưng bày, gii thiu sn phm, hàng hóa dịch vụ của Doanh  
nghip. Hot động lên tc 24x7, không gii hn thi gian và không gian.  
Website là kênh thông tin gii thiu sn phm, dịch vụ hoàn ho nht và hu  
dụng nht vi hình nh, các gii thiu, các media…  
Website còn là mt kho hàng khổng lồ, không gii hn vsức chứa.  
Hơn c, website là mt kênh bán hàng tốn ít chi phí nht.  
Thông qua website, doanh nghip có thtiếp thhình nh, thương hiu,  
dch v, sn phm ca mình ra ngoài phm vi, khu vc ca quc gia. Chính vì  
nhng li ích y, vic không có website đã là mt thit thòi so vi các đối thủ  
cnh tranh.  
Theo Tng cc Thng kê, tng sngười sdng Internet ti Vit Nam tính  
đến 2013 hơn39 triu người, ( chiếm hơn 43.9% dân sVit Nam) và hơn 8,5  
triu người dùng Internet băng thông rng (08/2014).  
Trong giai đon 2000 - 2010, tltăng trưởng người sdng Internet ti  
Vit Nam đạt mc 12%, tc độ tăng trưởng nhanh nht trong khu vc. Như vy  
sau gn 14 năm ktngày Vit Nam gia nhp cng đồng Internet toàn cu  
(1/12/1997), lượng người sdng Internet trong nước đã tăng nhanh mt cách  
đáng k.  
Nhìn chung, Internet là mt món ăn không ththiếu vi cuc sng ca  
mi người, vi thói quen sdng các bmáy tìm kiếm (Google, Bing,  
SVTH: Nguyễn Tuấn Vũ  
1
Lớp: K46 TMĐT  
   
Chuyên đề tốt nghiệp Đại học  
GVHD: Th.S Lê Văn Hòa  
Yahoo…) để tìm kiếm thông tin vdoanh nghip, tài liu hc tp, mua sm trc  
tuyến, np thẻ đin thoi, thanh toán hóa đơn…  
Theo thng kê, có đến hơn 86% lượng truy cp ca mt website đều đến từ  
các Search Engine ln như Google, Yahoo, MSN… Mi ngày có hàng triu người  
dùng lướt web sdng Search Engine để tìm nhng sn phm, dch vvà thông  
tin họ đang cn.Nhưng liu vi hàng twebsite hin đang tn ti, làm sao khách  
hàng có thtìm thy website ca bn trước mà không phi ca các đối thcnh  
tranh? Hu hết người sdng các bmáy tìm kiếm đều không kiên nhn, họ  
chtp trung vào các kết qutìm kiếm “Trang nht” trong hàng trăm, hàng  
triu kết qutrvkhi truy vn tìm kiếm.  
1.2. LỊCH SỬ GIẢI QUYẾT VẤN Đ  
Webmaster và các nhà cung cp dch vSEO đã bt đầu ti ưu hóa các  
trang web cho công ctìm kiếm vào gia nhng năm 1990. Ban đầu, các  
webmaster bt đầu gi link liên kết hay url ca trang web đến các công ctìm  
kiếm, các công cnày sgi mt spider đến trang website đó, website sẽ được  
thu thp dliu, sau đó được index lên máy chtìm kiếm, nơi đây các thông tin  
vwebsite sẽ được lưu trli, các tkhóa ca website, các link liên kết trong  
website đó, các spider này slàm vic index lên máy chtheo lch trình mà  
các công ctìm kiếm quy ước. Người shu trang web bt đầu để nhn ra  
nhng giá trca vic có các trang web ca hvà có thnhìn thy được xếp  
hng cao trong kết qucông ctìm kiếm. SEO chia ra làm hai dng đó là : SEO  
truyn thng (White Hat SEO) và SEO gian ln (Black Hat SEO).  
Theo nhà phân tích Danny Sullivan, cm t“Ti ưu hóa công ctìm kiếm”  
sdng rt nhiu trên mng vào năm 1997.  
Đầu phiên bn ca thut toán tìm kiếm da vào qun trtrang web cung cp  
thông tin như các thmeta tkhoá, hoc tp tin chmc như ALIWEB. Thmeta  
cung cp mt hướng dn đến ni dung ca mi trang.  
SVTH: Nguyễn Tuấn Vũ  
2
Lớp: K46 TMĐT  
 
Chuyên đề tốt nghiệp Đại học  
GVHD: Th.S Lê Văn Hòa  
Sdng dliu meta vào các trang chmc được tìm thy sẽ được ít hơn  
đáng tin cy, tuy nhiên, vì nhng sla chn ca webmastermà các thmeta có  
schính xác trong khnăng đưa thông tin website lên máy chtìm kiếm. Nhng  
dliu không chính xác, không đầy đủ, không nht quán trong thmeta có thể  
gây ra sxếp hng không đúng vtrí cho các tìm kiếm không liên quan. Vic  
cung cp ni dung được ti ưu hóa và mt sthuc tính trong mã ngun HTML  
đối vi mt trang web cn phi chính xác để được kết qutt trên công ctìm  
kiếm.  
Bng cách da quá nhiu vào các yếu tnhư mt độ tkhóa đó được độc  
quyn trong vòng kim soát ca mt webmaster, công ctìm kiếm sm blm  
dng vào thao tác xếp hng. Để cung cp kết qutt hơn cho người dùng ca h,  
công ctìm kiếm đã phi thích ng để đảm bo kết quca các trang đã cho thy  
các kết qutìm kiếm có liên quan nht, thay vì các trang không liên quan nhi vi  
tkhoá nhiu bi Black Hat SEO – nhóm Webmaster không bao gituân theo  
các qui định ca các bmáy tìm kiếm, hluôn lm dng quá mc các ththut.  
Các công ctìm kiếm đã phn ng li bng cách phát trin phc tp hơn thut  
toán xếp hng, có tính đến các yếu tbsung mà gây nhiu khó khăn cho qun trị  
web để thao tác.  
SEO ti Vit Nam bt đầu nhng nn móng phát trin đầu tiên khong vào  
thi đim gia năm 2006. Sau 5 năm, đến nay SEO đã là mt khái nim mà hu  
như bt kì mt nhà qun trwebsite nào cũng biết đến và tìm hiu nó dù ít hay  
nhiu. Thm chí, SEO còn được đưa vào hot động ca công ty như mt hướng  
đi chiến lược vi nhng kế hoch dài hơi. Đin hình, bn thddàng nhn ra  
FPT có bphn SEO riêng, Zing có bphn SEO riêng, VCCORP cũng bộ  
phn traffic riêng, Báo đin t24h…  
Như đã trình bày trên, hu hết người làm SEO chchú ý đến vic là sao để  
mt website Thương mi được lên trang nht ca bmáy tìm kiếm. Vn đề đặt  
ra: có tháp dng SEO cho mt website phi li nhun, mang tính giáo dc và  
Cng đồng không ? Liu SEO cho mt trang web phi thương mi có khnăng  
thành công không…  
SVTH: Nguyễn Tuấn Vũ  
3
Lớp: K46 TMĐT  
Chuyên đề tốt nghiệp Đại học  
GVHD: Th.S Lê Văn Hòa  
Chuyên đề đề tài “TÌM HIU VÀ NG DNG SEO VÀO TRANG WEB  
TOANCAUMOBILE.VN” là mt minh chng cthnht cho vic áp dng  
phương pháp SEO vào mt website phi li nhun, mt website bán hàng đin tử  
đin thoi  
.
1.3. MỤC TIÊU CẦN ĐẠT ĐƯỢC  
1.3.1. Về thuyết  
Sau khi hoàn thành chuyên đề, sinh viên có các kĩ năng sau:  
Tìm hiu bộ máy tìm kiếm.  
Hiu thế nào là SEO, các bin pháp để tiến hành SEO mt trang web.  
1.3.2. Về ứng dụng  
Sau khi áp dng lý thuyết đạt được vào thc tin, sinh viên có được cách để:  
Đưa website vào top 3 của bộ máy tìm kiếm với từ khóa “điện thoại toàn cầu”  
Phương pháp duy trì top 10 khi seo đã thành công  
SVTH: Nguyễn Tuấn Vũ  
4
Lớp: K46 TMĐT  
     
Chuyên đề tốt nghiệp Đại học  
CHƯƠNG 2. KHẢO SÁT HIỆN TRẠNG  
2.1. Phương pháp nghiên cứu giải quyết vấn đề  
GVHD: Th.S Lê Văn Hòa  
Vic đầu tiên trước khi SEO mt website đã được định hướng đúng đắn  
bng nhng tưởng độc đáo và mã ngun tt thì chúng ta phi biết được SEO  
ý
là gì?Và các phương pháp la chn nhng thành phn htrcho website đó.Mt  
website được SEO tt khi và chkhi webmaster có được hiu biết đúng đắn, tránh  
rơi vào tình trng Black Hat SEO.  
Nhìn chung, quá trình nghiên cu được phân thành 04 giai đon, các giai  
đon này được thc hin liên tc cho đến khi SEO thành công.  
Hình 2. 1: Tổng quan quá trình nghiên cứu giải quyết vấn đề  
Bước 1: Xây dng ý tưởng, la chn mã nguồn, xây dng website có nội dung  
riêng bit, hỗ trngười dùng tối đa.  
Bước 2: Bắt đầu phát triển website, song song với vic phát trin cvề nội  
dung ln nguồn, tác giả bt đầu áp dụng các biện pháp để ti ưu hóa  
website.  
Bước 3: Thng kê, theo dõi các từ khóa, lượng người truy cp.  
Bước 4: Theo dõi các báo cáo cụ thể, duy trì công vic hin ti nếu SEO thành  
công hoc sa chữa khi SEO chưa thành công  
SVTH: Nguyễn Tuấn Vũ  
5
Lớp: K46 TMĐT  
     
Chuyên đề tốt nghiệp Đại học  
2.1.2. Kế hoạch làm việc  
Tun  
GVHD: Th.S Lê Văn Hòa  
Công vic  
Nghiên cứu về Search Engines, cách thức hot động, cách thc thu  
1 -  
3 -  
2
4
thp thông tin.  
Nghiên cu về SEO, các cách gii quyết vn đề vSEO.  
Ti ưu hóa website.  
Qung bá website da trên các mng xã hội.  
5 -  
7
Phân tích theo dõi bng các công cmin phí ca các Search Engines  
cung cp. Xác định hướng đi đúng đắn cho Website.  
8
9
Theo dõi, điu chỉnh từ khóa, các ni dung không phù hp  
Viết báo cáo.  
10  
Hoàn thành.  
2.2. Bố cục  
Chương 1: Tổng quan.  
Ti chương này, tác gisẽ đề cp đến các khái nim cơ bn vSEO, các  
hiu biết ban đầu vSEO.  
Cũng trong chương này, tác gigii thiu đề tài chuyên đề là: “Tìm hiu và  
ng dng SEO - Search Engine Optimization vào website ToanCauMobile.vn” –  
Mt website bán hàng đin t:đin thoi,phkin,âm thanh. Đây là mt hướng đi  
mi khi làm SEO.  
Qua chương 1, tác gigii thiu toàn cnh về đề tài.Cách thc nghiên cu,  
tiếp cn đề tài và các mc tiêu đạt được khi hoàn thành tt chuyên đề  
Chương 2: Cơ sthuyết.  
.
Vcơ slý thuyết, tác gitìm hiu cách thc làm vic chung ca các bộ  
máy tìm kiếm, các cách thc thu thp thông tin, cách thc để mt bmáy tìm  
kiếm có ththy được trang web.  
SVTH: Nguyễn Tuấn Vũ  
6
Lớp: K46 TMĐT  
   
Chuyên đề tốt nghiệp Đại học  
GVHD: Th.S Lê Văn Hòa  
Trong chương này, tác gicũng gii thiu vhai phương thc đánh giá  
thhng ca website là Alexa và GoogleRank, hai phương thc này đã và đang  
là thước đo quan trng trong vic phát trin trang web.  
Cũng trong chương này, tác gigii thiu SEO, giúp cho người đọc có cái  
nhìn rõ ràng hơn vSEO.  
Chương 3: ng dụng.  
Sau khi đã tìm hiu và nm rõ các phương thc tìm kiếm, các tiêu chí đánh  
giá xếp hng ti Chương 2, tác giáp dng nhng hiu biết trên cơ slý thuyết đó  
để bt đầu SEO trang web ToanCauMobile.vn.  
Vì vy, chương này, chúng ta snghiên cu các phương pháp cơ bn  
nht, chính qui nht để có thti ưu hóa mt website, nhm đưa website lên các  
thhng cao khi người dùng truy vn.  
Sau khi đã áp dng các phương pháp cơ bn và chính qui, tác gisthng  
kê các sliu và so sánh lúc chưa áp dng SEO và sau khi áp dng SEO.  
Mt sphương pháp, kĩ năng mm mà tác giả đã áp dng để SEO thành  
công trang web  
Chương 4: Kết luận – hướng phát trin.  
Ni dung ca chương 4 slà tng hp kết qucác công vic đã làm các  
chương trước. Các kết quả đã đạt được sau khi hoàn thành lun văn.  
Nhng nhược đim ca SEO.  
Hướng phát trin, đề xut các phương pháp đễ gicác vtrí cao khi SEO  
thành công, cũng như cách thc qung bá website để có ththu li nhun, tnuôi  
sng website.  
SVTH: Nguyễn Tuấn Vũ  
7
Lớp: K46 TMĐT  
Chuyên đề tốt nghiệp Đại học  
GVHD: Th.S Lê Văn Hòa  
CHƯƠNG 3. CỞ SỞ THUYẾT  
3.1. TỔNG QUAN BỘ MÁY TÌM KIẾM  
3.1.1. Bộ máy tìm kiếm hoạt động như thế nào?  
Search Engine hay còn gi là công ctìm kiếm, bmáy tìm kiếm giúp  
người xem tìm thy nhng thông tin mt cách liên quan nht. Người dùng có  
thtìm kiếm thông tin theo tkhoá, hình nh, địa đim… trên search engine. Khi  
nhn được câu lnh yêu cu tìm kiếm, search engine sphân tích yêu cu đó,  
đánh giá, xếp hng và trvkết quliên quan nht. Search engine hot động  
theo quy trình như sau  
:
Ban đầu, SE sgi các Spider (hay còn gi là con b, Crawler) để tiến hành  
kho sát mt website khi nó được upload lên. Các Spider này được lp trình để có  
thtự động ln theo liên kết để đi đến các website khác nhau, sau khi dng li ở  
mt website nào đó, Spider này sthu thp, đánh giá các thông tin trên website  
đó trước khi tự động ln theo các liên kết đến các website  
khác…  
Sau khi nhn được các thông tin tSpider, SE có nhim vlưu trli trước  
khi phân tích chúng bng các thut toán riêng bit để trvcác kết qukhi người  
dùng truy vn đúng vào ni dung. Ta có ththam kho cách thc làm vic chung  
ca SE ti hình dưới đây:  
Hình 3. 1: Tổng quan cách thức là, việc của bộ máy tìm kiếm  
SVTH: Nguyễn Tuấn Vũ  
8
Lớp: K46 TMĐT  
       
Chuyên đề tốt nghiệp Đại học  
Trong đó:  
GVHD: Th.S Lê Văn Hòa  
Kho sát – Crawl: là mt giai đon rt quan trng để search engine tham  
quan, thu thp thông tin trên website ca bn. Search engine có nhng con bọ  
(spider hay crawler) được lp trình để có thtự động theo các liên kết (link) để  
đến các website khác nhau, thu thp đánh giá các thông tin trên website  
đó.  
Lưu tr- Index: là giai đon search engine lưu li thông tin sau khi đã  
crawl. Vi khi lượng lưu trvô hn, các search engine có thcha hàng tkết  
quliên quan. Mt trang web thể được index nhanhn hoc chm tuthuc vào  
tc độ crawl, độ trust ca website và nhiu yếu tố  
khác.  
Phân tích – Analysis: giai đon này search engine slàm vic trên các dữ  
liu mà nó thu thp được. Sau đó tính toán độ liên quan ca dliu so vi yêu cu  
ca người dùng. Các search engine khác nhau có nhng thut toán phân tích  
khác nhau từ đây to ra skhác bit gia các search engine. Giai đon phân tích  
sto tin đề cho giai đon phía sau – Trvkết qu.  
Kết qu- Results: Các kết quliên quan sẽ được hin thtrong giai đon  
này. Nhng kết quliên quan thường được sp phía trên, cao hơn nhng kết  
quít liên quan.Mc dù không phi lúc nào các kết qucũng thomãn được  
yêu cu ca người tìm kiếm.Nhưng cho đến hin nay, người dùng khá hài lòng  
vi nhng gì mà search engine trv.  
Tuy bc tranh hot động ca search engine bên ngoài nhìn chung khá đơn  
gin nhưng bên trong là tp hp rt nhiu thut toán phc tp. Search engine  
nào thomãn nhiu nht nhu cu tìm kiếm người sdng sẽ được sdng rng  
rãi và phát trin mnh mtrong tương lai. Ai là vua trong thtrường tìm kiếm  
trc tuyến đầy tim năng này?  
SVTH: Nguyễn Tuấn Vũ  
9
Lớp: K46 TMĐT  
Chuyên đề tốt nghiệp Đại học  
GVHD: Th.S Lê Văn Hòa  
3.1.2. Giới thiệu vcác search engine thông dụng  
Hin nay trên thế gii có rt nhiu search engine đang hot động. Trong đó,  
phi kđến ba chàng khng lồ đang chi phi 98% thphn tìm kiếmtheo thông  
kê ca SEO MOD tháng 01/2014.  
Hình 3. 2: Biểu đồ thị phần search engine từ seomoz.org  
Google là search engine được nhiu người sdng nht vi 80% sngười sử  
dng. Tiếp theo là Yahoo 9.5% và Bing 8.5%, còn li sphn trăm ít i dành cho  
các search engine khác.  
Hin nay, Vit Nam đa smi người cũng sdng Google để tìm kiếm  
thông tin.Nên vic SEO trên Google là ưu tiên hàng đầu đối vi các website.  
3.2. CẤU TẠO CHUNG CÁC BỘ MÁY TÌM KIẾM  
Bmáy tìm kiếm thường cu to bi 3 bphn đó là: Bthu thp thông  
tin, Blp chmc và btìm kiếm thông tin, được hot động theo mô hình sau:  
Hình 3. 3: Cấu tạo Search Engine  
SVTH: Nguyễn Tuấn Vũ  
10  
Lớp: K46 TMĐT  
       
Chuyên đề tốt nghiệp Đại học  
GVHD: Th.S Lê Văn Hòa  
Robot – bthu thp thông tin: Robot được biết đến dưới nhiu tên gi  
khác nhau: spider, bot, crawler, hoc web worm…Vbn cht robot chlà mt  
chương trình duyt và thu thp thông tin tcác website trên mng, nó tự động  
duyt qua các cu trúc siêu liên kết và trvcác danh mc kết quca công cụ  
tìm kiếm. Nhng trình duyt thông thường không được xem robot do thiếu tính  
chủ động, chúng chduyt web khi có stác động ca con người.  
Index – blp chmc: Các trang web sau khi thu thp vsẽ được phân  
tích, trích chn nhng thông tin cn thiết (thường là các từ đơn, tghép, cm từ  
quan trng) để lưu trtrong cơ sdliu nhm phc vcho nhu cu tìm kiếm  
sau này.  
Search Engine – Btìm kiếm thông tin: Tưởng tượng ta mun tìm vài  
quyn sách trong mt thư vin rt ln. Vi sc lc cá nhân ta không thxem  
qua hết tt csách, vì vy ta cn mt danh mc sách. Tương t, tn ti hàng triu  
trang web trên thế gii và mi phút trôi qua slượng được đẩy lên càng nhiu  
hơn, cho dù ta có trong tay mt công clướt web tuyt vi đến đâu cũng không  
thduyt hết. Tuy nhiên, vi strgiúp ca SE, ta có ththm chí xác định  
được vtrí ca nhng tcn tìm trong các trang web khp nơi trên thế gii.  
3.2.1. Robot  
Robot được chia làm 2 loi đó là: Robot thu thp thông tin, và robot chmc.  
3.2.1.1. Robot thu thập thông tin có nhiệm vụ  
Phân tích – thng kê - Statistical Analysis: Robot đầu tiên được dùng để  
đếm slượng web server, stài liu trung bình ca mt server, tlcác dng file  
khác nhau, kích thước trung bình ca mt trang web,độ kết dính…  
Duy trì siêu liên kết – Maintenance: Mt trong nhng khó khăn ca vic  
duy trì mt siêu liên kết là nó liên kết vi nhng trang bhng (dead links) khi  
nhng trang này bthay đổi hoc thm chí bxóa. Tht không may vn chưa có  
cơ chế nào cnh báo các bduy trì vsthay đổi này. Trên thc tế khi các tác  
ginhn ra tài liu ca mình cha nhng liên kết hng, hsthông báo cho  
nhau, hoc thnh thong độc githông báo cho hbng email. Mt srobot có  
SVTH: Nguyễn Tuấn Vũ  
11  
Lớp: K46 TMĐT  
   
Chuyên đề tốt nghiệp Đại học  
GVHD: Th.S Lê Văn Hòa  
thtrgiúp tác giphát hin các liên kết hng cũng như duy trì các cu trúc  
siêu liên kết cùng ni dung ca mt trang web. Chc năng này lp li liên tc  
mi khi mt tài liu được cp nht, nhđó mi vn đề xy ra sẽ được gii quyết  
nhanh chóng.  
Ánh xạ địa chweb – Mirroring: Mirroring: là mt kthut phbiến  
trong vic duy trì các kho dliu. Mt ánh x(mirror) ssao chép toàn bcu  
trúc cây thư mc và thường xuyên cp nht nhng file bthay đổi. Điu này cho  
phép nhiu người cùng truy xut mt ngun dliu, gim sliên kết btht  
bi, nhanh hơn và ít chi phí hơn so vi truy cp trc tiếp vào site thc scha  
các dliu này.  
Phát hin tài nguyên: Có lẽ ứng dng thú vnht ca robot là dùng nó để  
phát hin tài nguyên. Con người không thkim soát ni mt khi lượng thông tin  
khng ltrong môi trường mng. Robot sgiúp thu thp tài liu, to và duy trì  
cơ sdliu, phát hin và xoá bcác liên kết hng nếu có, kết hp vi công cụ  
tìm kiếm cung cp thông tin cn thiết cho con người.  
Kết hp các công dng trên - Combined uses: Mt robot có thể đảm nhn  
nhiu chc năng như: va thng kê slượng tài liu thu được va to cơ sdữ  
liu…. Tuy nhiên nhng ng dng như thế còn khá ít i.  
3.2.1.2.  
Robot chỉ mục – Robot Indexing  
Trong quá trình thu thp thông tin phc vcho vic lp chmc , ta cn gii  
quyết vn đề sau:  
Trong môi trường mng,robot ly thông tin tcác site.Vy robot sbt đầu từ  
site nào? Điu này hoàn toàn phthuc vào robot.Mi robot khác nhau có  
nhng chiến lược khác nhau.Thường thì robot sviếng thăm các site phbiến  
hoc nhng site có nhiu liên kết dn đến  
nó.  
Ai scung cp địa chca các site này cho robot ?Có 2 ngun; Mt là  
Robot nhn các URL ban đầu tuser.Hai là Robot phân tích các trang web để  
ly các URL mi, đến lượt các URL này trthành địa chỉ đầu vào cho robot.Quá  
trình này được lp li liên tc.  
SVTH: Nguyễn Tuấn Vũ  
12  
Lớp: K46 TMĐT  
 
Chuyên đề tốt nghiệp Đại học  
GVHD: Th.S Lê Văn Hòa  
Chn dliu nào trong tài liu để lp chmc? Quyết định chn dliu nào  
trong tài liu cũng hoàn toàn phthuc vào robot, thường thì nhng từ được lit kê  
như sau được xem là quan trng  
:
góc cao ca tài liu.  
Trong các đề mc.  
Được in đậm.  
Trong URLTrong tiêu đề (quan trọng).  
Trong phn miêu ttrang web (Description)  
Trong các thdành cho hình nh (ALT).  
Trong các thcha tkhóa.  
.
Trong các text liên kết.  
Mt srobot lp chmc trên tiêu đề, hoc mt số đon văn bn đầu tiên  
hoc toàn btài liu (full text). Mt skhác li lp chmc trên các thẻ  
META(META tags) hoc các thn, nhvy tác gica trang web được quyn  
n định tkhoá cho tài liu ca mình. Tuy nhiên chc năng này blm dng quá  
nhiu do đó các thMETA không còn giữ được giá trban đầu ca chúng na  
(Black Hat SEO).  
SVTH: Nguyễn Tuấn Vũ  
13  
Lớp: K46 TMĐT  
Chuyên đề tốt nghiệp Đại học  
3.2.2. Index – bộ lập chỉ mục  
GVHD: Th.S Lê Văn Hòa  
3.2.2.1. Mô hình xtổng quát của một hthng lập chỉ mc  
Hình 3. 4: Mô hình xử tổng quát hệ thống lập chỉ mục  
Lp chmc là quá trình phân tích và xác định các t, cm tthích hp  
ct lõi có khnăng đại din cho ni dung ca tài liu.Như vy, vn đề đặt ra là  
phi rút trích ra nhng thông tin chính, có khnăng đại din cho ni dung ca tài  
liu.  
Thông tin này phi “va đủ”, nghĩa là không thiếu để trra kết quả đầy đủ so  
vi nhu cu tìm kiếm, nhưng cũng phi không dư để gim chi phí lưu trvà chi  
phí tìm kiếm và để loi bkết qudư tha không phù hp.  
Vic rút trích này chính là vic lp chmc trên tài liu. Trước đây, quá trình  
này thường được các chuyên viên đã qua đào to thc hin mt cách “thcông “  
nên có độ chính xác cao. Nhưng trong môi trường hin đại ngày nay, vi lượng  
thông tin khng lthì vic lp chmc bng tay không còn phù hp, phương  
pháp lp chmc tự động mang li hiu qucao hơn.  
Mt thtc lp chmc tự động cơ bn:  
SVTH: Nguyễn Tuấn Vũ  
14  
Lớp: K46 TMĐT  
     
Tải về để xem bản đầy đủ
docx 58 trang yennguyen 30/03/2022 6300
Bạn đang xem 20 trang mẫu của tài liệu "Đề tài Tìm hiểu và ứng dụng seo vào trang web Toancaumobile.vn", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • docxde_tai_tim_hieu_va_ung_dung_seo_vao_trang_web_toancaumobile.docx