Giáo trình Công nghệ XML - Nghề: Hệ thống thông tin

ỦY BAN NHÂN DÂN THÀNH PHỐ HỒ CHÍ MINH  
TRƯỜNG CAO ĐẲNG KINH TẾ KỸ THUẬT  
THÀNH PHỐ HỒ CHÍ MINH  
  
GIÁO TRÌNH  
MÔN HỌC : CÔNG NGHỆ XML  
NGHỀ: HỆ THỐNG THÔNG TIN  
TRÌNH ĐỘ: CAO ĐẲNG  
(Ban hành kèm theo Quyết định số:  
/QĐ-CĐKTKT ngày  
tháng  
năm 20  
của Hiệu trưởng Trường Cao đẳng Kinh tế - Kỹ thuật Thành phố Hồ Chí Minh)  
Thành phố Hồ Chí Minh, năm 2020  
ỦY BAN NHÂN DÂN THÀNH PHỐ HỒ CHÍ MINH  
TRƯỜNG CAO ĐẲNG KINH TẾ KỸ THUẬT  
THÀNH PHỐ HỒ CHÍ MINH  
  
GIÁO TRÌNH  
MÔN HỌC: CÔNG NGHỆ XML  
NGHỀ: HỆ THỐNG THÔNG TIN  
TRÌNH ĐỘ: CAO ĐẲNG  
THÔNG TIN CHỦ NHIỆM ĐỀ TÀI  
Họ tên: Huỳnh Khắc Duy  
Học vị: Thạc sỹ  
Đơn v: Khoa Công Nghệ Thông Tin  
Email: huynhkhacduy@gmail.com  
TRƯỞNG KHOA  
TỔ TRƯỞNG  
BỘ MÔN  
CHỦ NHIỆM  
ĐỀ TÀI  
Huỳnh Khắc Duy  
HIỆU TRƯỞNG  
DUYỆT  
Năm 2020  
KHOA CÔNG NGHỆ THÔNG TIN  
2
TUYÊN BỐ BẢN QUYỀN  
Tài liệu này thuộc loại sách giáo trình nên các nguồn thông tin có thể được phép  
dùng nguyên bản hoặc trích dùng cho các mục đích về đào tạo và tham khảo.  
Mọi mục đích khác mang tính lệch lạc hoặc sử dụng với mục đích kinh doanh  
thiếu lành mạnh sẽ bị nghiêm cấm.  
KHOA CÔNG NGHỆ THÔNG TIN  
3
LỜI GIỚI THIỆU  
Hiện nay việc ứng dụng Công nghệ thông tin vào các ngành nghề khác trở nên phổ  
biến, trong nhiều lĩnh vực. Công nghệ thông tin đã góp phần làm cho công việc trở nên  
thuận lợi.  
Môn công nghệ XML là môn học giúp sinh viên có kiến thức nền tảng công nghệ  
XML các ứng dụng của XML để xây dựng các ứng dụng thực tế.  
Giáo trình này sẽ cung cấp cho người học các kiến thức từ cơ bản cho đến chuyên sâu  
về công nghệ XML.  
…………., ngày……tháng……năm………  
Tham gia biên soạn  
1. Huỳnh Khắc Duy  
KHOA CÔNG NGHỆ THÔNG TIN  
4
MỤC LỤC  
KHOA CÔNG NGHỆ THÔNG TIN  
5
GIÁO TRÌNH MÔN HỌC/MÔ ĐUN  
Tên môn học: Công nghệ XML  
Mã môn học: MH3101343  
Vị trí, tính chất, ý nghĩa và vai trò của môn học:  
- Vị trí: là môn học chuyên ngành, học kỳ 4.  
- Tính chất: môn học lý thuyết, môn bắt buộc.  
- Ý nghĩa và vai trò của môn học:  
Mục tiêu của môn học:  
- Về kiến thức:  
+ Phân tích được cấu trúc của một tài liệu XML.  
+ Phân biệt được DTDs và lược đồ XML.  
+ Liệt kê được các bước xử lý tài liệu XML bằng DOM, SAX, Xquery, Xpath.  
+ Xác định được các vần đề cần thiết cho một web service.  
+ Đưa ra được các bước suy luận giữa cơ sở dữ liệu với XML.  
- Về kỹ năng:  
+ Tạo được tài liệu XML.  
+ Chuyển thể tài liệu XML với XSLT.  
+ Đặc tả cấu trúc XML với DTD và Schema.  
+ Phát triển được chương trình làm việc giữa cơ sở dữ liệu với XML.  
+ Xây dựng được web service.  
- Về năng lực tự chủ và trách nhiệm:  
+ Rèn luyện thói quen tự giác nghiên cứu bài học trước khi đến lớp.  
+ Tạo thói quen làm bài tập thực hành thường xuyên.  
KHOA CÔNG NGHỆ THÔNG TIN  
6
III. Nội dung môn học:  
1. Nội dung tổng quát và phân bổ thời gian:  
Thời gian (giờ)  
Số  
TT  
Kiể  
m
Tra  
Tên chương, mục  
Tổng  
số  
Lý  
thuyết  
Thực hành  
10  
2
8
Chương 1. Giới thiệu XML  
1.1. Thế giới XML  
1
1.2. Trình soạn thảo  
1.3 Cấu trúc tài liệu XML  
1.4 Không gian tên XML  
Chương 2. Sự hợp lệ  
2.1. Document Type Definition (DTD)  
2.2. Lược đồ XML (XML Schemas)  
Chương 3. Xử lý tài liệu XML  
3.1. Mô hình DOM  
10  
10  
2
2
8
6
2
3
2
3.2. Ngôn ngữ Xpath  
3.3. XSLT  
10  
10  
15  
2
2
3
8
8
Chương 4. Cơ sở dữ liệu  
4.1. XQuery  
4.2. XML và cơ sở dữ liệu  
Chương 5. Lập trình  
5.1 Lập trình hướng sự kiện  
5.2 LINQ to XML  
Chương 6. Giao tiếp  
6.1 RSS ATOM và CONTENT  
Syndication  
6.2 Web service  
6.3 SOAP và WSDL  
6.4 AJAX  
Chương 7. Hiển thị  
4
5
10  
2
6
7
10  
2
8
7.1 XHTML và HTML 5  
7.2 Scalable vector Graphics (SVG)  
Cộng  
75  
15  
56  
4
2. Nội dung chi tiết:  
Chương 1. Giới thiệu XML  
Thời gian: 10 giờ  
Mục tiêu:  
- Phát biểu được sự hình thành và phát triển của XML.  
- Trình bày được cấu trúc của một tài liệu XML và kiểm tra được khuôn dạng  
của nó.  
- Khai báo được không gian tên trong trang XML.  
KHOA CÔNG NGHỆ THÔNG TIN  
7
-Vận dụng trình soạn thảo để tạo tập tin XML.  
Nội dung:  
1.1. Thế giới XML  
1.2. Trình soạn thảo  
1.3 Cấu trúc tài liệu XML  
1.4 Không gian tên XML  
Chương 2. Sự hợp lệ  
Mục tiêu:  
Thời gian: 10 giờ  
- Trình bày khái niệm về DTD và XML Schemas và lợi ích của chúng.  
- Sử dụng được DTD và XML Schemas để đặc tả cấu trúc của tài liệu XML.  
Nội dung:  
2.1. Document Type Definition (DTD)  
2.2. Lược đồ XML (XML Schemas)  
Chương 3. Xử lý tài liệu XML  
Mục tiêu:  
Thời gian: 10 giờ  
- Truy xuất được tài liệu XML bằng mô hình DOM và ngôn ngữ Xpath.  
- Định dạng được tài liệu XML bằng XSLT.  
Nội dung:  
3.1. Mô hình DOM  
3.2. Ngôn ngữ Xpath  
3.3. XSLT  
Chương 4. Cơ sở dữ liệu  
Mục tiêu:  
Thời gian: 10 giờ  
- Trình bày được cú pháp của ngôn nghữ Xquery và mối quan hệ giữa Xquery,  
Xpath và XSLT.  
- Hiểu được tại sao cơ sở dữ liệu cần XML.  
- Sử dụng các cơ sở dữ liệu MySQL, SQL server, Exist với XML.  
Nội dung:  
4.1. XQuery  
4.2. XML và cơ sở dữ liệu  
Chương 5. Lập trình  
Mục tiêu:  
Thời gian: 10 giờ  
KHOA CÔNG NGHỆ THÔNG TIN  
8
- Phát biểu được khái niệm lập trình hướng sự kiện.  
- Truy xuất được tài liệu XML bằng SAX và LINQ.  
Nội dung:  
5.1 Lập trình hướng sự kiện  
5.2 LINQ to XML  
Chương 6. Giao tiếp  
Thời gian: 15 giờ  
Mục tiêu:  
- Phát biểu được các loại giao tiếp giữa các hệ thống thông tin.  
- Tạo được RSS, web service loại SOAP và WDSL.  
- Kết nối được AJAX và XML trên trang web.  
Nội dung:  
6.1 RSS ATOM và CONTENT Syndication  
6.2 Web service  
6.3 SOAP và WSDL  
6.4 AJAX  
Chương 7. Hiển thị  
Thời gian: 10 giờ  
Mục tiêu:  
- Phân biệt được XML, HTML và XHTML.  
- Sử dụng Javascript với XML.  
- Tạo được tập tin SVG.  
Nội dung:  
7.1 XHTML và HTML 5  
7.2 Scalable vector Graphics (SVG)  
IV. Điều kiện thực hiện môn học:  
1. Phòng học chuyên môn hóa/nhà xưởng: Phòng học thực hành.  
2. Trang thiết bị máy móc: Máy chiếu, máy tính có phần mềm Dreamweaver,  
Trình duyệt Web.  
3. Học liệu, dụng cụ, nguyên vật liệu: Bảng, bút viết bảng.  
4. Các điều kiện khác: máy tính có kết nối Internet.  
V. Nội dung và phương pháp, đánh giá:  
1. Nội dung:  
KHOA CÔNG NGHỆ THÔNG TIN  
9
- Kiến thức:  
Được đánh giá qua bài kiểm tra và thực hành cuối môn đạt được các yêu cầu  
sau:  
+
+
Trình bày được các khái niệm cơ bản, các công cụ sử dụng XML.  
Phân tích các thành phần trong XML.  
- Kỹ năng:  
Đánh giá kỹ năng thực hành của sinh viên trong các bài thực hành:  
+
+
+
Tạo được tập tin XML.  
Sử dụng được các công cụ kết nối XML.  
Tạo được ứng dụng sử dụng XML hoàn chỉnh dựa trên các kiến thức đã  
học.  
- Năng lực tự chủ và trách nhiệm:  
Nhận thức được tầm quan trọng của việc sử dụng XML.  
+
2. Phương pháp:  
Thi gian  
STT  
Phương pháp  
Hình thức  
Số cột  
thi  
Thực hành trên  
máy tính  
Thực hành trên  
máy tính  
01 Kiểm tra thường xuyên  
2
2
90 phút  
02 Kiểm tra định kỳ  
03 Thi kết thúc môn học  
Báo cáo tiểu luận  
VI. Hướng dẫn thực hiện môn học:  
1. Phạm vi áp dụng môn học: Áp dụng cho khóa học trình độ cao đẳng.  
2. Hướng dẫn về phương pháp giảng dạy, học tập môn học:  
- Đối với giáo viên, giảng viên:  
+ Giáo viên có thể vận dụng phương pháp thuyết trình, giảng giải kết hợp  
phương pháp gợi mở, phát vấn để người học nghề có thể tham gia tích cực vào  
bài giảng.  
+ Phương tiện, dụng cụ giảng dạy: Ngoài phương tiện giảng dạy truyền  
thống giáo viên còn có thể sử dụng Máy chiếu Projector, Laptop, sơ đồ, tranh  
ảnh minh hoạ giúp làm rõ và sinh động nội dung bài học.  
+ Trong điều kiện có thể kết hợp giảng dạy lý thuyết và thực hành trong  
cùng một phòng học chuyên môn hoá có máy tính được nối mạng LAN và  
mạng Internet, có sử dụng các phương tiện dạy học bằng hình ảnh.  
- Đối với người học:  
+ Thực hiện đầy đủ và nghiêm túc các qui định đối với môn học và của  
giáo viên.  
+ Hoàn thành đầy đủ các bài thực hành và tham dự các buổi kiểm tra trên  
KHOA CÔNG NGHỆ THÔNG TIN  
10  
lớp.  
+ Kết thúc khóa học, người học sẽ nộp bài tiểu luận và báo cáo để xác định  
việc họ có hoàn thành chương trình học hay không  
+ Học sinh tham gia đầy đủ các buổi lên lớp (không nghỉ quá 30% thời  
lượng học)  
3. Những trọng tâm cần chú ý:  
- Trình độ giáo viên: ít nhất phải có bằng cử nhân hoặc bằng cấp tương  
đương tính theo kinh nghiệm dạy học trước đó. Có chứng chỉ dạy nghề.  
- Nguồn lực đào tạo: Những nguồn lực sau đây được khuyến khích sử dụng  
để bổ trợ những phương pháp giảng dạy đề xuất.  
+ Cơ sở vật chất, trang thiết bị giảng dạy: Lớp học có đầy đủ máy vi tính cho  
học sinh thực tập.  
+ Sách, giáo trình và tài liệu tham khảo.  
+ Kế hoạch giảng dạy và giáo án chi tiết của giáo viên đóng vai trò tài liệu  
chính được sử dụng trong quá trình giảng dạy.  
- Phương pháp đào tạo: Giáo viên kết hợp nhiều chiến lược giảng dạy để  
giúp tất cả người học thuộc mọi đối tượng có những tiến bộ nhất định nào đó.  
KHOA CÔNG NGHỆ THÔNG TIN  
11  
Chương 1. Giới thiệu xml  
CHƯƠNG 1. GIỚI THIỆU XML  
1.1 Thế giới XML  
Hiện nay XML (eXtensible Markup Language) chiếm vị trí rất quan trọng trong  
việc chuyển tải, trao đổi dữ liệu và liên lạc giữa các ứng dụng. Điều này càng  
được khẳng định khi các hệ điều hành từ WindowsXP trở đi và các hệ điều hành  
khác bên trong nó chứa rất nhiều tập tin XML. Hơn nữa khi bộ .Net ra đời càng  
làm cho XML trở nên thịnh hành và ngày càng được ứng dụng rộng rãi.  
Sử dụng kỹ thuật XML không chỉ có tập đoàn Microsoft mà ngay cả Sun, IBM,  
Oracles điều hỗ trợ XML sử dụng nó trong các hệ điều hành và các ứng dụng.  
XML là ngôn ngữ xây dựng cấu trúc tài liệu văn bản, dựa theo chuẩn SGML  
(Standard Generalized Markup Language: siêu ngôn ngữ có khả năng sinh ngôn  
ngữ khác). SGML được phát triển cho việc định cấu trúc và nội dung tài liệu điện  
tử, do tổ chức ISO (International Organization for Standards) chuẩn hóa năm  
1986.  
SGML do IBM đưa ra, song không thể không kể đến những đóng góp của các  
công ty khác. XML được W3C (World Wide Web Consortium - tổ chức độc lập  
định ra tiêu chuẩn cho trình duyệt Web, máy chủ và ngôn ngữ) phát triển, nhưng  
đặc tả XML lại do Netscape, Microsoft và các thành viên của dự án Text  
Encoding Initiative  
(TEI) xây dựng. Tổ chức W3C XML Special Interest Group có đại diện từ hơn  
100 công ty cùng nhiều chuyên gia được mời khác.  
Lý do ra đời của XML vì SGML rất rắc rối khó sử dụng và HTML có nhiều  
giới hạn nên năm 1996 tổ chức W3C thiết kế XML. XML version 1.0 được định  
nghĩa trong hồ sơ February 1998 W3C Recommendation.  
Điểm quan trọng của kỹ thuật XML là nó không thuộc riêng về một công ty?  
nào, nó là một sản phẩm mà trí tuệ của nó thuộc về cả thế giới, là một tiêu chuẩn  
được mọi người công nhận vì được soạn ra bởi W3C (World Wide Web  
Consortium).  
Bản thân của XML rất đơn giản, nhưng các công cụ chuẩn được định ra để làm  
việc với XML như Document Object Model - DOM, XPath, XSL,... thì lại rất  
hữu hiệu, và chính các chuẩn này được phát triển không ngừng.  
XML cũng giống như HTML đều là ngôn ngữ đánh dấu, nhưng điều cần nói ở  
đây là sự ra đời của XML nhằm để khắc phục một số mặt hạn chế của HTML.  
HTML và XML đều sử dụng các thẻ nhưng các thẻ của HTML là một bộ dữ  
liệu được xây dựng và định nghĩa trước, nghĩa là người lập trình phải tuân thủ  
theo các thẻ đã định nghĩa của HTML, hiện HTML có khoản hơn 400 thẻ, để nhớ  
hết 400 thẻ này cũng không có gì khó khăn đối với người lập trình web chuyên  
nghiệp nhưng thật khó đối với những người không chuyên. Hơn nữa, các thẻ của  
HTML không nói lên được mô tả dữ liệu trong đó. Nhưng đối với XML thì hoàn  
toàn khác bởi vì tag trong XML là do người lập trình tự định nghĩa và mỗi thẻ là  
một mô tả dữ liệu mà người lập trình muốn truyền đạt.  
Ngôn ngữ định dạng  
Ngôn ngữ định dạng (Markup Language ) là tất cả những gì dùng để mô tả nội  
dung một tài liệu, đó là cách mà nội dung của tài liệu được diễn dịch. Tuy nhiên,  
ngôn ngữ định dạng chúng ta thường sử dụng trước đây là HTML.  
Ví dụ: Tạo tập tin document.html  
KHOA CÔNG NGHỆ THÔNG TIN  
12  
   
Chương 1. Giới thiệu xml  
<HTML>  
<HEAD> <TITLE> Hello HTML</TITLE> <HEAD>  
<BODY>  
<CENTER>  
<H1> Hello From HTML <H1>  
</CENTER>  
Well come to the wild and woolly word of HTML  
</BODY>  
</HTML>  
Kết quả của tập tin document.html hiển thị trên trình duyệt:  
HTML và XML có mối quan hệ rất gần với nhau. Cả hai đều dựa trên chuẩn  
ngôn ngữ định dạng tổng quát SGML. Câu hỏi đặt ra là: XML sẽ được sử dụng  
và nó hiển thị trên trình duyệt như thế nào?  
Sau đây chúng ta sẽ chuyển nội dung tập tin document.html sang thành tập tin  
document.xml như sau:  
<?xml version ="1.0" encoding="UTF-8"?>  
<DOCUMENT>  
<GREETING>  
Hello From XML  
</GREETING>  
<MESSAGE>  
Well come to the wild and woolly word of HTML  
</MESSAGE>  
</DOCUMENT>  
Kết quả hiển thị trên trình duyệt của tập tin document.xml  
KHOA CÔNG NGHỆ THÔNG TIN  
13  
Chương 1. Giới thiệu xml  
Hai kết quả hoàn toàn khác nhau. Đối với tập tin document.xml thì chúng sẽ hiển  
thị đúng với tập tin gốc bởi vì trình duyệt không hiểu được các thẻ do ta tự định  
nghĩa. Chính vì vậy, để trình duyệt có thể hiểu được các thẻ do ta định nghĩa và  
hiển thị chúng, ta phải dùng bảng định kiểu (Style Sheet)  
Có 2 cách chỉ ra bảng định kiểu khi định dạng:  
- Dùng CSS (Cascade Style Sheet)  
- Dùng XSL (Extensible Style Language)  
Ví dụ: Ta dùng bảng định kiểu CSS để hiển thị nội dung tập tin document.xml  
trên  
Bước 1:Ta thêm đoạn code (in đậm) vào tập tin document.xml trên như sau:  
<?xml version ="1.0" encoding="UTF-8"?>  
<?xml-stylesheet type="text/css"href="document.css"?>  
<DOCUMENT>  
<GREETING>  
Hello From XML  
</GREETING>  
<MESSAGE>  
Well come to the wild and woolly word of HTML  
</MESSAGE>  
</DOCUMENT>  
Bước 2:Tạo tiếp tập tin document.css:  
GREETING  
{
display:block; font-size:18pt;  
color:#FF0000; text-align:center;  
}
MASSAGE {display:block; font-size:18pt; color:#000000;}  
Bây giờ, kết quả khi chạy tập tin document.xml trên trình duyệt sẽ có hình dạng  
sau và không còn hiển thị nội dung tập tin gốc nữa.  
KHOA CÔNG NGHỆ THÔNG TIN  
14  
Chương 1. Giới thiệu xml  
1.2 Trình soạn thảo  
1.3 Cấu trúc tài liệu XML  
Khái niệm về cấu trúc tài liệu XML và đặc tả cấu trúc tài liệu XML:  
Về cấu trúc tài liệu XML":  
– Chỉ tương ứng cấu trúc của nội dung chính.  
– Cách thức tổ chức, sắp xếp của các thẻ (có hay không có nội dung) trong nội dung  
chính.  
Về đặc tả cấu trúc tài liệu XML:  
– Mô tả ngắn gọn, chính xác cấu trúc tài liệu XML.  
– Mô tả ngắn gọn, chính xác cách thức tổ chức, sắp xếp của các thẻ.  
Ngôn ngữ đặc tả cấu trúc:  
KHOA CÔNG NGHỆ THÔNG TIN  
15  
   
Chương 1. Giới thiệu xml  
Có rất nhiều ngôn ngữ được đề xuất để mô tả tài liệu XML như DTD, XML Schema,  
XML-Data, Schematron, RELAX NG,… Trong số đó có 2 ngôn ngữ thông dụng là  
DTD và XML Schema.  
Đặc điếm của DTD:  
– Ra đời rất sớm.  
– Cho phép mô tả văn bản có cấu trúc bất kì.  
– Đơn giản, dễ học và sử dụng.  
– Chỉ cho phép đặc tả một số “kiểu dữ liệu đơn giản” trong nội dung chính của tài liệu  
XML.  
Đặc điểm của XML Schema:  
– Được đề xuất bởi W3C.  
– Chỉ áp dụng cho tài liệu XML.  
– Khó học và khó sử dụng hơn DTD.  
– Cho phép đặc tả chi tiết về các “kiểu dữ liệu” được sử dụng trong nội dung chính của  
tài liệu XML.  
Hãy xét qua ví dụ sau:  
<?xml version=“1.0” encoding=“utf-8” ?>  
<PHAN_SO>  
<Tu_so>4</Tu_so>  
<Mau_so>3</Mau_so>  
</PHAN_SO>  
Đặc tả tài liệu trên với DTD:  
<!DOCTYPE PHAN_SO [  
<!ELEMENT PHAN_SO (Tu_so, Mau_so) >  
<!ELEMENT Tu_so #PCDATA >  
<!– Tu_so : Số nguyên // > 0 –>  
<!ELEMENT Mau_so #PCDATA>  
<!– Mau_so : Số nguyên // > 0 –>  
]>  
Đặc tả với XML Schema:  
<?xml version=“1.0” encoding=“utf-8”?>  
<xs:schema id=“PHAN_SO” targetNamespace=“http://tempuri.org/PHAN_SO.xsd”  
xmlns:xs=“http://www.w3.org/2001/XMLSchema”>  
<xs:elementname=“PHAN_SO” type=“PHAN_SO” />  
<xs:complexType name=“PHAN_SO”>  
<xs:sequence>  
<xs:elementname=“Tu_so” type=“SO_NGUYEN_DUONG”  
minOccurs=“1” maxOccurs=“1” />  
KHOA CÔNG NGHỆ THÔNG TIN  
16  
Chương 1. Giới thiệu xml  
<xs:elementname=“Mau_so” type=“SO_NGUYEN_DUONG”  
minOccurs=“1” maxOccurs=“1” />  
</xs:sequence>  
</xs:complexType>  
<xs:simpleTye name=“SO_NGUYEN_DUONG”>  
<xs;restriction base=“xs:int”>  
<xs:minExclusive value=“0” />  
</xs:restriction>  
</xs:simpleType>  
</xs:schema>  
Sử dụng đặc tả cấu trúc:  
Có 2 trường hợp chính cần thiết sử dụng các tài liệu đặc tả cấn trúc:  
– Trường hợp 1: sử dụng cho việc trao đổi thông tin giữa người – người.  
– Trường hợp 2: sử dụng cho việc trao đổi thông tin giữa người – hệ thống xử lý.  
Trường hợp 1 là trường hợp phổ biến nhất, với trường hợp này, tài liệu đặc tả cấu trúc  
+ được sử dụng như phương tiện giao tiếp giữa chuyên viên tin học có liên quan đến  
tài liệu XML tương ứng.  
+ có thể được lưu trữ theo bất kì định dạng nào thích hợp cho việc sử dụng (trình bày,  
xem, báo cáo,…)  
Trường hợp 2 chỉ được sử dụng khi  
+ có hệ thống xử lý (phần mềm, hàm, đối tượng thư viện) “hiểu” và thực hiện các xử  
lý tương ứng nào đó với tài liệu đặc tả cấu trúc (xứ lý thông dụng nhất là kiểm tra một  
tài liệu XML có theo đúng cấu trúc được mô tả trong tài liệu đặc tả cấu trúc hay  
không).  
+ thật sự có nhu cầu cần đến các xử lý của hệ thống xử lý nói trên.  
Một số kĩ thuật đặc tả nội dung:  
1. Sử dụng thẻ thực thể:  
Ý nghĩa chung của các thẻ thực thể là cho phép tài liệu XML tham chiếu đến một tập  
hợp các giá trị đã chuẩn bị trước dưới dạng một tên gợi nhớ (tên thực thể).  
Mỗi cách thức tham chiếu và “loại” của tập hợp giá trị được tham chiếu tương ứng với  
một ý nghĩa/mục tiêu (dạng sử dụng) riêng và sẽ yêu cầu dạng thẻ khai báo thực thể  
thích hợp.  
Có 4 dạng sử dụng chính của các thực thể:  
– Tham chiếu đến một chuỗi giá trị bên trong tài liệu XML đang xét.  
– Tham chiếu đến các kí tự đặc biệt được định nghĩa trước.  
– Tham chiếu đến một tập hợp các giá trị bên ngoài tài liệu.  
Tham chiếu đến một tài liệu XML khác.  
*Cách thức khai báo và sử dụng chung các thẻ khai báo thực thể (cho cả 4 dạng trên)  
như sau:  
Khai báo:  
KHOA CÔNG NGHỆ THÔNG TIN  
17  
Chương 1. Giới thiệu xml  
<!DOCTYPE Ten_goc [  
Khai báo thực thể X  
Khai báo thực thể Y  
]>  
Sử dụng  
&X; <– Sử dụng tham chiếu của X >  
&Y; <– Sử dụng tham chiếu của Y –>  
– Dạng 1: ý nghĩa  
+ tăng cường tính dễ đọc của tài liệu XML.  
+ tăng cường tính dễ bảo trì của tài liệu XML.  
Dạng khai báo và sử dụng:  
<?xml version=“1.0” encoding=“utf-8”?>  
<!DOCTYPE Goc [  
<!ENTITY Ten_1 “Chuoi_1”>  
<!ENTITY Ten_2 “Chuoi_2”>  
]>  
<Goc>  
<A X=“&Ten_1;”>  
<B>  
&Ten_2;  
</B>  
</A>  
<C Y=“&Ten_1;”>&Ten_2</C>  
<D Y>&Ten_2;</D>  
</Goc>  
Tài liệu XML trên khai báo và sử dụng 2 thực thể:  
Thực thể thứ nhất: Tên là Ten_1 và được sử dụng trong thuộc tính của 2 thẻ A, C.  
Thực thể thứ hai: Tên là Ten_2 và được sử dụng trong nội dung của 3 thẻ B, C, D.  
– Dạng 2: ý nghĩa là cho phép sử dụng một số kí tự đặc biệt.  
Sử dụng kí tự đặc biệt được định nghĩa trước  
&lt; kí tự <  
&gt; kí tự >  
&quot; kí tự “  
&apos; kí tự ‘  
&amp; kí tự &  
Sử dụng các kí tự thông qua mã số trong cách mã hóa.  
+ Nếu dùng hệ thập phân:  
&#So_thap_phan; kí tự có mã số là số thập phân  
KHOA CÔNG NGHỆ THÔNG TIN  
18  
Chương 1. Giới thiệu xml  
Ví dụ: 0 kí số 0  
a kí tự a  
+ Nếu dùng hệ thập lục phân:  
&#xSo_thap_luc_phan; kí tự có mã số là số thập lục phân  
Ví dụ: 0 kí số 0  
A kí tự a  
– Dạng 3: ý nghĩa là cho phép tham chiếu đến tập tin chưa giá trị cần sử dụng nào đó.  
Các giá trị này không nhất thiết phải theo định chuẩn XML. Cách sử dụng này của  
thực thể thông thường để bổ sung vào nội dung các hình ảnh, âm thanh,…  
Dạng khai báo thông dụng: <!ENTITY Ten_thuc_the SYSTEM Ten_tap_tin >  
Thực thể Ten_thuc_the tham chiếu đến tập tin có vị trí được cho bởi Ten_tap_tin.  
Ghi chú: + Ten_tap_tin bao hàm cả đường dẫn.  
+ Có thể dùng địa chỉ URL như Ten_tap_tin.  
Ví dụ: Giả sử đã có tập tin hinh.jpg lưu trữ hình ảnh của một nhân viên trong thư mục  
hiện hành  
<!DOCTYPE NHAN_VIEN [  
<!ENTITY Hinh_nhan_vien SYSTEM “hinh.jpg” >  
]>  
<NHAN_VIEN Hinh=“&Hinh_nhan_vien;” … >  
</NHAN_VIEN>  
– Dạng 4: ý nghĩa là cho phép phân rã tài liệu XML thành các tài liệu con được lưu trữ  
trong các tập tin độc lập.  
Dạng khai báo thông dụng: <!ENTITY Ten_thuc_the SYSTEM Ten_tap_tin >  
dụ: Giả sử đã có các tập tin Thu_tien_1.xml, Thu_tien_2.xml,… Thu_tien_12.xml  
lưu trữ thông tin về các phiếu thu tiền trong tháng 1, 2,… 12 của năm đang xét.  
Tập tin Thu_tien.xml lưu trữ thông tin về các phiếu thu trong năm đang xét như sau  
<!DOCTYPE THU_TIEN [  
<!ENTITY Thu_tien_1 SYSTEM “Thu_tien_1.xml” >  
<!ENTITY Thu_tien_2 SYSTEM “Thu_tien_2.xml” >  
<!ENTITY Thu_tien_12 SYSTEM “Thu_tien_12.xml” >  
]>  
<THU_TIEN>  
&Thu_tien_1;  
&Thu_tien_2;  
&Thu_tien_12;  
</THU_TIEN>  
KHOA CÔNG NGHỆ THÔNG TIN  
19  
Chương 1. Giới thiệu xml  
2. Sử dụng tên:  
Tên thẻ, tên các thuộc tính trong tài liệu XML thuộc về 1 trong 2 loại sau:  
– Tên không có tiền tố: mô tả đầy đủ các quy tắc đặt tên cho các tên thẻ, thuộc tính là  
công việc không đơn giản và đặc biệt là cũng không cần thiết. Chẳng hạn, tên là chuỗi  
bao gồm các kí tự a-z, A-Z, kí số 0-9, một số kí tự như -”, “_”, “.”,…  
– Tên có tiền tố: có dạng 2 chuỗi kí tự cách nhau bởi kí tự “:” Chuoi_tien_to :  
Chuoi_ten  
Ví dụ:  
<A:MAT_HANG … />  
<B:MAT_HANG … />  
Nếu chỉ sử dụng tài liệu XML đơn lẻ, riêng cho các ứng dụng cục bộ thì không cần  
thiết dùng tiền tố trong tên. Tuy nhiên, nếu cần thiết tiếp nhận. kết xuất toàn bộ/một  
phần tài liệu XML từ/đến một ứng dụng khác thì việc tên với tiền tố là rất cần thiết.  
Tiền tố của tên sẽ dùng để phân biệt được nguồn gốc của một thẻ trong tài liệu XML  
được tạo thành từ nhiều tài liệu XML khác có các thẻ trùng phần tên không tiền tố.  
Xét tài liệu XML với việc sử dụng các tiền tố A tương ứng tên công ty A trong giao  
dịch thương mại điện tử.  
<A:The_goc>  
<A:The_1 … />  
<A:The_2 … >  
Nội dung  
</A:The_2>  
<A:The_2>  
Nội dung  
</A:The_2>  
<A:The_3 … />  
</A:The_goc>  
Việc sử dụng thuộc tính xmlns cho phép đơn giản hóa tài liệu XML trên  
<The_goc xmlns=“A”>  
<The_1 … />  
<The_2>  
Nội dung  
</The_2>  
<The_2>  
KHOA CÔNG NGHỆ THÔNG TIN  
20  
Tải về để xem bản đầy đủ
pdf 197 trang yennguyen 08/04/2022 4140
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Công nghệ XML - Nghề: Hệ thống thông tin", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • pdfgiao_trinh_cong_nghe_xml_nghe_he_thong_thong_tin.pdf