Luận văn Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NoSQL

ĐẠI HỌC QUỐC GIA HÀ NỘI  
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ  
Nguyễn Văn Định  
ĐÁNH GIÁ HIỆU NĂNG MỘT SỐ HỆ QUẢN TRỊ  
CƠ SỞ DỮ LIỆU NOSQL  
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH  
HÀ NỘI - 2020  
ĐẠI HỌC QUỐC GIA HÀ NỘI  
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ  
Nguyễn Văn Định  
ĐÁNH GIÁ HIỆU NĂNG MỘT SỐ HỆ QUẢN TRỊ  
CƠ SỞ DỮ LIỆU NOSQL  
Ngành: Công Nghệ Thông Tin  
Chuyên ngành: Khoa Học Máy Tính  
Mã số: 8480101.01  
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH  
NGƯỜI HƯỚNG DẪN KHOA HỌC: 1. PGS.TS. Nguyễn Hoài Sơn  
2. TS. Phạm Mạnh Linh  
HÀ NỘI - 2020  
LỜI CAM ĐOAN  
Những nội dung trình bày trong luận văn là những kiến thức của riêng cá  
nhân tôi tích lũy trong quá trình học tập, nghiên cứu, không sao chép lại một  
công trình nghiên cứu hay luận văn của bất cứ tác giả nào khác.  
Trong nội dung của nội dung của luận văn, những phần tôi nghiên cứu,  
trích dẫn đều được nêu trong phần các tài liệu tham khảo, có nguồn gốc, xuất  
xứ, tên tuổi của các tác giả, nhà xuất bản rõ ràng.  
Những điều tôi cam kết hoàn toàn là sự thật, nếu sai, tôi xin chịu mọi hình  
thức xử lý kỷ luật theo quy định.  
Hà Nội, Ngày tháng 9 năm 2020  
Tác giả luận văn  
Nguyễn Văn Định  
i
 
LI CẢM ƠN  
Em xin bày tỏ lòng biết ơn chân thành và sâu sắc đến PGS.TS Nguyễn  
Hoài Sơn và TS Phạm Mạnh Linh, khoa Công nghệ thông tin - Trường Đại học  
Công nghệ - Đại học Quốc gia Hà Nội, các thầy đã dành nhiều thời gian tận tình  
chỉ bảo, hướng dẫn em trong suốt quá trình tìm hiểu, triển khai và nghiên cứu đề  
tài. Hai thầy là người đã định hướng và đưa ra nhiều góp ý quý báu trong quá  
trình em thực hiện luận văn này.  
Em xin chân thành cảm ơn chân thành tới toàn thể các thầy giáo, cô giáo  
trong khoa Công nghệ thông tin - Trường Đại học Công nghệ Hà Nội - Đại học  
Quốc gia Hà Nội đã dạy bảo tận tình, trang bị cho em những kiến thức quý báu,  
bổ ích và tạo điều kiện thuận lợi trong suốt quá trình em học tập và nghiên cứu  
tại trường.  
Do có nhiều hạn chế về thời gian và kiến thức nên luận văn không tránh  
khỏi những thiếu sót, rất mong nhận được những ý kiến đóng góp quý báu của  
quý thầy cô và các bạn cùng quan tâm.  
Luận văn này được tài trợ bởi Học viện Khoa học và Công nghệ và Viện  
Công nghệ thông tin, Viện hàn lâm Khoa học và Công nghệ Việt Nam từ đề tài  
mã số GUST.STS.ĐT2019-TT02.  
Cuối cùng em xin gửi lời chúc sức khỏe và thành đạt tới tất cả quý thầy  
cô, quý đồng nghiệp cùng toàn thể gia đình và bạn bè.  
Xin chân thành cảm ơn!  
ii  
 
DANH MC CÁC THUT NG, CHVIT TT  
ACID Atomicity, Consistency, Isolation, and durability.  
Artificial Intelligence  
AI  
API  
Application Programming Interface  
AWS Amazon Web Services  
BLOB Binary large object  
BSON Binary JSON  
CAP  
CPU  
CQL  
Consistency, Availability and Partition Tolerance.  
Platform as a Service  
Cassandra Query Language  
CRUD Create, Read, Update, Delete  
EBS  
EC2  
FTP  
Elastic Block  
Elastic Compute Cloud  
File Transfer Protocol  
HDFS Hadoop Distributed File System  
IBM International Business Machines  
IoMT Internet of Medical Things  
IoT Internet of Things  
iii  
 
JSON JavaScript Object Notation  
NIST National Institute of Standards and Technology  
OLTP On-line Transactional Processing  
OLTP  
On-line transactional processing  
RDBMS Relational Database Management System  
Rhino  
DHT  
Lưu trữ liên tục & phân tán  
RM  
RPC  
TPC  
TPS  
URI  
VM  
Readmodify-write  
Remote Procedure Calls  
Transaction Processing Performance Council  
transaction per second  
Uniform Resource Identifier  
Virtual machine  
XML eXtensible Markup Language  
YAML YAML Ain't Markup Language  
YCSB Yahoo Cloud Serving Benchmark  
iv  
DANH SÁCH CÁC BNG  
Bảng 2.1: Phân loại hệ quản trị cơ sở dữ liệu NoSQL  
Bảng 3.1: Bảng thông số cấu hình máy tính  
Bảng 3.2: Bảng thông số phiên bản NoSQL  
Bảng 4.1: Các ứng dụng của một sộ hệ quản trị dữ liệu NoSQL.  
v
 
DANH SÁCH CÁC HÌNH VẼ  
Hình 1.2 Cảm biến  
Hình 1.3 Lưới điện thông minh  
Hình 1.4 Y tế thông minh  
Hình 1.5 Đầu đọc mã vạch thông minh  
Hình 2.1 Suy giảm sự thống trị của SQL  
Hình 2.2 So sánh ACID và BASE  
Hình 2.3 Nguyên lý định lý CAP  
Hình 2.4 Loại cơ sở dữ liệu Khóa – giá trị  
Hình 2.5 Loại cơ sở dữ liệu Cột quan hệ  
Hình 2.6 Loại cơ sở dữ liệu Siêu cột  
Hình 2.7 Loại cơ sở dữ liệu đồ thị  
Hình 2.8 Ví dụ về các nút trong một hệ quản trị cơ sở dữ liệu đồ thị  
Hình 3.1.1 Kiến trúc YCSB  
Hình 3.1.2 Kết quả chạy thử ngiệm  
Hình 3.2.1 Kết quả chạy hoạt động đọc và chèn của MongoDB  
Hình 3.2.2 Kết quả của hoạt động đọc đọc và sửa ghi của MongoDB  
Hình 3.2.3 Kết quả hoạt động đọc – cập nhật MongoDB  
Hình 3.2.4 Kết quả hoạt động quét - chèn MongoDB  
Hình 3.2.5 Kết quả chạy hoạt động đọc và chèn của OrientDB  
Hình 3.2.6 Kết quả chạy của hoạt động đọc đọc và sửa ghi của OrientDB  
Hình 3.2.7 Kết quả hoạt động đọc và cập nhật OrientDB  
Hình 3.2.8 Kết quả hoạt động quét và chèn OrientDB.  
Hình 3.2.9 Kết quả hoạt động đọc và chèn của Redis  
Hình 3.2.10 Kết quả hoạt động đọc đọc và sửa ghi của Redis  
Hình 3.2.11 Kết quả hoạt động đọc và cập nhật của Redis  
Hình 3.2.12 Kết quả hoạt động quét và chèn của Redis  
Hình 3.2.13 Kết quả hoạt động đọc và chèn của Cassandra  
Hình 3.2.14 Kết quả hoạt động đọc đọc và sửa ghi của Cassandra  
vi  
 
Hình 3.2.15 Kết quả hoạt động đọc và cập nhật của Cassandra  
Hình 3.2.16 Kết quả hoạt động quét và chèn của Cassandra  
Hình 3.3.1 Kết quả thời gian chèn  
Hình 3.3.2 Thông lượng hoạt động chèn  
Hình 3.3.3 Kết quả thời gian chạy của hoạt động đọc  
Hình 3.3.4 Kết quả thông lượng của hoạt động đọc  
Hình 3.3.5 Kết quả thời gian chạy 10% đọc - 90%-chèn  
Hình 3.3.6 Kết quả thông lượng 10% đọc - 90% chèn  
Hình 3.3.7 Kết quả thời gian chạy 50% đọc - 50% chèn  
Hình 3.3.8 Kết quả thông lượng 50% đọc - 50% chèn  
Hình 3.3.9 Kết quả thời gian chạy 90% đọc - 10% chèn  
Hình 3.3.10 Kết quả thông lượng 90% đọc - 10% chèn  
Hình 3.3.11 Kết quả thời gian chạy 10% đọc và 90% cập nhật  
Hình 3.3.12 Kết quả thông lượng 10% đọc - 90% cập nhật  
Hình 3.3.13 Thơi gian chạy 50% đọc - 50% cập nhật  
Hình 3.3.14 thông lượng 50% đọc - 50% cập nhật  
Hình 3.3.15 Thời gian chạy 10% đọc - 90% cập nhật  
Hình 3.3.16 Thông lượng 10% đọc - 90% cập nhật  
Hình 3.3.17 Kết quả thời gian chạy 10% quét - 90% chèn  
Hình 3.3.18 Kết quả thông lượng 10% quét 90% chèn  
Hình 3.3.19 Kết quả thời gian chạy: 50% quét 50% chèn  
Hình 3.3.20 Kết quả thông lượng 50% quét 50% chèn  
Hình 3.3.20 Kết quả thông lượng 50% quét 50% chèn  
Hình 3.3.21 Kết quả thời gian chạy: 10% quét 90% chèn  
Hình 3.3.22 Kết quả thông lượng: 10%quét 90%chèn  
vii  
MỤC LỤC  
viii  
 
LI MỞ ĐẦU  
Hệ quản trị cơ sở dữ liệu quan hệ truyền thống của những năm 1970 được  
thiết kế để phù hợp với các yêu cầu của các ứng dụng xử lý giao dịch trực tuyến  
(OLTP) như là các giải pháp “một kích thước phù hợp với tất cả”[13]. Các hệ  
thống này thường được lưu trữ trên một máy chủ duy nhất, nơi quản trị cơ sở dữ  
liệu đáp ứng với sự tăng trưởng dữ liệu bằng cách tăng tốc độc xử lý của CPU,  
dung lượng bộ nhớ và tốc độ của đĩa cứng trên máy chủ duy nhất đó, tức là bằng  
cách mở rộng theo chiều dọc. Hệ quản trị cơ sở dữ liệu quan hệ vẫn còn phù hợp  
trong môi trường máy tính hiện đại ngày nay, tuy nhiên, những hạn chế của khả  
năng mở rộng theo chiều dọc là mối quan tâm lớn nhất.  
Khối lượng dữ liệu được sử dụng bởi nhiều tổ chức trong những năm gần  
đây đã lớn hơn dung lượng của một máy chủ duy nhất, do sự bùng nổ của web.  
Do đó, các công nghệ và kỹ thuật mới đã được phát triển để giải quyết những  
vấn đề của dữ liệu. Năm 2010, người ta tuyên bố rằng Facebook đã lưu trữ kho  
dữ liệu lớn nhất thế giới được lưu trữ trên HDFS (hệ thống phân tán của  
Hadoop), bao gồm 2000 máy chủ, tiêu thụ 21 Petabyte (PB) dung lượng lưu trữ  
[15], nhanh chóng tăng lên 100 PB vào đầu năm 2012 [3].  
Tình hình này còn phức tạp hơn bởi thực tế các ứng dụng OLTP truyền  
thống chỉ là một tập hợp con của các trường hợp sử dụng mà các công nghệ mới  
này phải tạo điều kiện thuận lợi bởi một loạt các yêu cầu ứng dụng hiện đại của  
ngành công nghiệp [10]. Do đó, các công nghệ dữ liệu lớn được yêu cầu mở  
rộng quy mô theo một cách khác để khắc phục các hạn chế về tốc độ xử lý, dung  
lượng bộ nhớ và tốc độ ghi của đĩa. Khả năng mở rộng theo chiều ngang đã trở  
thành trọng tâm mới cho các hệ thống lưu trữ dữ liệu; cung cấp khả năng truyền  
dữ liệu từ nhiều máy chủ.  
Độ co giãn là một thuộc tính của khả năng mở rộng theo chiều ngang, cho  
phép tăng thông lượng tuyến tính khi nhiều máy được thêm vào một cụm. Môi  
trường điện toán hiện đại cũng chứng kiến sự gia tăng số lượng các nhà cung  
cấp dịch vụ điện toán đám mây. Nhiều trong số đó vốn có tính đàn hồi, ví dụ  
như AWS của Amazon [2] và Rackspace [14], cung cấp khả năng mở rộng theo  
chiều ngang một cách dễ dàng và với chi phí thấp cho người dùng.  
Nhiều kho dữ liệu mới đã được thiết kế với suy nghĩ về sự thay đổi cảnh  
quan này, một số trong số đó thậm chí còn được thiết kế để hoạt động độc lập  
1
 
trên điện toán đám mây, ví dụ PNUTS của Yahoo, BigTable của Google và  
Amazon của DynamoDB. Các hệ thống lưu trữ dữ liệu mới này thường được gọi  
là kho dữ liệu NoSQL, viết tắt của “Not Only SQL”; vì chúng không sử dụng  
ngôn ngữ truy vấn có cấu trúc (SQL) hoặc có mô hình quan hệ. Hewitt [9] đề  
xuất rằng thuật ngữ này cũng có nghĩa là các hệ thống truyền thống không nên là  
lựa chọn duy nhất để lưu trữ dữ liệu.  
Hiện nay, có rất nhiều giải pháp lưu trữ dữ liệu NoSQL một số công ty  
sử dụng các giải pháp này để giải quyết với những thách thức về khả năng mở  
rộng dữ liệu và chọn giải pháp tốt nhất cho trường hợp sử dụng cụ thể của mình.  
Dữ liệu mà các công ty thu thập có giá trị cao và việc truy vấn dữ liệu này cần  
có tính sẵn sàng cao [15]. Nhu cầu về tính khả dụng cao của dữ liệu trở nên đặc  
biệt rõ ràng trong các ứng dụng Web mà bản thân chúng có thể đã quen với việc  
tương tác hàng ngày, ví dụ như các nền tảng truyền thông xã hội như Facebook  
và Twitter.  
Một tính năng của khả năng mở rộng theo chiều ngang là thêm các máy  
chủ tạo thành một cụm. Số lượng máy chủ lớn cũng làm tăng tần suất các nút  
gặp sự cố. Cơ chế chính mà dữ liệu NoSQL lưu trữ ở mức độ sẵn sàng cao để  
khắc phục tỷ lệ lỗi cao và đáp ứng kỳ vọng thông qua việc mở rộng. Việc sao  
chép không chỉ mang lại khả năng dự phòng cao hơn trong trường hợp hỏng hóc  
mà còn có thể giúp tránh mất dữ liệu (bằng cách khôi phục dữ liệu bị mất từ một  
bản sao) và cải thiện hiệu suất (bằng cách dàn trải tải trên nhiều bản sao) [4].  
Như đã đề cập về nhiều tính năng và lợi thế của việc sử dụng một số hệ  
quản trị cơ sở dữ liệu NoSQL nhưng điều đó không có nghĩa là nó phù hợp với  
mọi loại ứng dụng. NoSQL cũng có một số nhược điểm, vì vậy việc lựa chọn  
một số hệ quản trị cơ sở dữ liệu phù hợp tùy thuộc vào loại ứng dụng của chúng  
ta hoặc bản chất của dữ liệu. Một số dự án phù hợp hơn với việc sử dụng hệ  
quản trị cơ sở dữ liệu SQL, trong khi những dự án khác hoạt động tốt với  
NoSQL. Một số có thể sử dụng thay thế cả hai. Nếu ứng dụng đang lưu trữ dữ  
liệu giao dịch thì SQL là lựa chọn tốt nhất. Hệ quản trị cơ sở dữ liệu quan hệ  
được tạo ra để xử lý các giao dịch và chúng hoạt động rất tốt với điều đó. Nếu  
dữ liệu là phân tích thì hãy nghĩ về NoSQL, SQL không bao giờ dành cho phân  
tích dữ liệu và với một lượng lớn dữ liệu có thể trở thành một vấn đề.  
Trong luận văn này, tôi sẽ đánh giá về hiệu suất của bốn hệ quản trị cơ sở  
dữ liệu NoSQL khác nhau như MongoDB, Cassandra, Redis và OrientDB bằng  
2
cách chạy một loạt các kịch bản được tùy chỉnh để mô hình hóa các khối lượng  
truy vấn CURD trong thế giới thực khác nhau. Tôi so sánh hiệu suất của các hệ  
quản trị cơ sở dữ liệu NoSQL này liên quan đến hiệu suất truy vấn, dựa trên kịch  
bản đọc, chèn, quét và cập nhật bằng cách chạy các kịch bản bằng công cụ  
Yahoo! Cloud Serving Benchmark (YCSB) và đưa ra nhận xét về bốn hệ quản  
trị cơ sở dữ liệu này.  
3
Chương 1: Dliu ln và các công cụ đánh giá hiêu năng  
Chương này cung cấp kiến thức tổng quan và nền tảng về dữ liệu lớn và  
mối quan hệ giữa chúng. Giới thiệu các công cụ đánh giá hiệu năng cho dữ liệu  
lớn phổ biến hiện nay và tìm hiểu về các thuộc tính của từng loại.  
1.1 Dliu ln  
Mạng xã hội, phân tích web, thương mại điện tử thông minh thường cần  
quản lý dữ liệu ở quy mô quá lớn đối với hệ quản trị cơ sở dữ liệu quan hệ  
truyền thống (RDBMS). Mặc dù các nhà cung cấp hệ quản trị cơ sở dữ liệu đã  
cố gắng xử lý và lưu trữ khối lượng lớn dữ liệu với hiệu suất tốt hơn nhưng  
trong thập kỷ qua, sự gia tăng đáng kể về kích thước dữ liệu đã gây ra một số  
vấn đề để xử lý và lưu trữ dữ liệu với khả năng truy cập nhanh hơn và chi phí  
lưu trữ thấp hơn. Hệ quản trị cơ sở dữ liệu NoSQL được coi là một thành phần  
quan trọng của dữ liệu lớn khi truy xuất và lưu trữ một lượng lớn dữ liệu với chi  
phí lưu trữ giảm [10]. Ví dụ: theo báo cáo, chi phí lưu trữ RDBMS truyền thống  
trung bình là $30.000+ cho mỗi terabyte, trong khi lưu trữ cho hệ quản trị cơ sở  
dữ liệu NoSQL trung bình $1000 mỗi terabyte.  
Từ điển tiếng Anh Oxford định nghĩa dữ liệu lớn như sau [19]:  
Các tập dữ liệu cực lớn có thể được phân tích tính toán để tiết lộ các mẫu,  
xu hướng và liên kết, đặc biệt liên quan đến hành vi và tương tác của con  
người”  
Dữ liệu lớn đang đóng một vai trò quan trọng để cải thiện xã hội hiện đại.  
Mọi người có thể sử dụng các công nghệ và công cụ mới để cải thiện mọi khía  
cạnh của cuộc sống, bao gồm sức khỏe, chăm sóc y tế, để tăng tốc khám phá và  
đổi mới. Bên cạnh sự cải tiến và những khía cạnh tích cực này, Dữ liệu lớn đang  
đặt ra nhiều thách thức khác nhau cho cả Chính phủ và Người dân vì những  
công nghệ dữ liệu này đang trở nên rất phổ biến và khó hiểu. Ngoài ra, có nguy  
cơ lạm dụng và lạm dụng các bộ dữ liệu lớn này. Vì vậy, có nhiều vấn đề khác  
nhau cũng phải đối mặt do sự gia tăng mạnh mẽ của các tập dữ liệu dẫn đến dữ  
liệu lớn. Điều rất quan trọng là phải đưa ra các sáng kiến để bảo mật các tập dữ  
liệu và thông tin nhạy cảm này và cũng để đảm bảo rằng các công nghệ cơ sở dữ  
liệu được sử dụng một cách hiệu quả và có trách nhiệm [5].  
Sự xuất hiện của mạng cảm biến không dây đã giúp tăng nhanh lượng dữ  
liệu được lưu trữ. Các mạng cảm biến không dây này liên tục truyền dữ liệu và  
4
   
đã sinh ra thuật ngữ dữ liệu lớn, xu hướng được công nhận rộng rãi hiện nay.  
Thuật ngữ dữ liệu lớn này không chỉ liên quan đến khối lượng dữ liệu mà còn  
với tốc độ truyền tải cao và nhiều thông tin khác nhau khó thu thập, lưu trữ, đọc  
cập nhật và xóa bằng các giải pháp lưu trữ có sẵn khác nhau. Tất cả dữ liệu được  
thu thập và tạo ra bởi các cảm biến riêng lẻ không được coi là quan trọng và loại  
dữ liệu này được tạo và thu thập bởi các cảm biến khác nhau có khả năng tạo ra  
một lượng lớn khối lượng dữ liệu có thể khó xử lý cho các hoạt động CRUD cổ  
điển (Tạo, Đọc, Cập nhật và Xóa) một cách hiệu quả [13].  
Khối lượng dữ liệu đang tràn ngập với tốc độ rất cao và tăng gấp đôi sau  
mỗi 18 tháng [9]. Các công cụ và công nghệ khác nhau có sẵn để nắm bắt và  
phân tích thông tin nhưng các tổ chức đang cố gắng đưa việc sử dụng dữ liệu lên  
cấp độ mới để đạt được hiệu suất và tính khả dụng tốt hơn theo cách tiết kiệm  
chi phí đang trở thành một thách thức lớn. Tốc độ tăng sẽ tăng nhanh hơn trong  
những tháng tiếp theo do việc sử dụng các thiết bị IoT liên tục gửi dữ liệu khiến  
lượng dữ liệu tràn ngập mỗi giây.  
1.2 Internet of Things (IoT)  
Chuỗi giá trị Internet of Things bao gồm tất cả các thiết bị thông minh và  
được kết nối. IoT là thuật ngữ đề cập đến xu hướng ngày càng tăng của việc sử  
dụng các cảm biến trong các thiết bị và vật thể để làm cho chúng có khả năng  
giao tiếp và gửi hoặc nhận thông tin [7]. Các lý do có thể khác nhau đối với việc  
các tổ chức ngày càng sử dụng nhiều cảm biến trong thiết bị. Cảm biến được sử  
dụng từ các thiết bị nhỏ, ví dụ: điện thoại thông minh cho đến loại lớn hơn như  
xe cộ, v.v. Cảm biến có thể khác nhau về loại, hình dạng và kích thước. Trong  
một động cơ ô tô, có nhiều loại cảm biến khác nhau, ví dụ như cảm biến nhiệt độ  
trong động cơ tạo ra cảnh báo nếu nhiệt độ của động cơ vượt qua ngưỡng cài đặt  
để thông báo cho người lái xe rằng có điều gì đó không ổn.  
Có những ngành công nghiệp khác cũng được hưởng lợi từ cảm biến. Một số  
cảm biến có khả năng gửi dữ liệu đến nhà sản xuất để thông báo cho họ về lỗi  
hoặc các vấn đề trong thiết bị của họ để có thể giải quyết. Trong tương lai, việc  
sử dụng các cảm biến sẽ tăng lên rất nhiều. Cisco đã dự đoán và đưa ra một báo  
cáo vào năm 2011 rằng sẽ có 25 tỷ thiết bị trên Internet vào năm 2015, con số  
này sẽ tăng lên gấp đôi (50 tỷ) vào năm 2020 [16].  
5
 
Ngày nay, Big Blue, biệt danh của IBM, đang đưa công nghệ nhỏ bé đó vào  
hoạt động, phát triển một cảm biến khí đa ứng dụng có thể giúp các sân bay phát  
hiện và theo dõi các mối đe dọa sinh hóa, xác định xem miếng bít tết trong tủ  
lạnh có bị hư hỏng hay không. chẩn đoán ung thư vú và các bệnh khác đơn giản  
bằng cách phân tích hơi thở của con người.  
Cảnh quan công nghệ đang tiếp tục phát triển nhanh chóng. Facebook chạm  
mốc 500 triệu người dùng, người dùng điện thoại di động đạt 4 tỷ người, và  
lượng người dùng internet trên môi trường di động cũng đạt 450 triệu người.  
Tương tự như vậy, công nghệ thông tin cũng đã thay đổi cách triển khai như  
tăng cường sử dụng điện toán đám mây và ảo hóa. Sự thay đổi nhanh chóng của  
môi trường công nghệ cũng đã thúc đẩy một thuật ngữ Internet of Things (IoT)  
có khả năng nắm bắt, tính toán, giao tiếp và cộng tác. Các thiết bị IoT này được  
nhúng với các cảm biến, bộ truyền động và khả năng giao tiếp và sẽ sớm có thể  
gửi một lượng lớn dữ liệu khổng lồ trên quy mô lớn [9].  
Với sự xuất hiện của tiêu chuẩn an toàn, một số công nghệ cốt lõi cho IoT  
đang được sử dụng rộng rãi hơn. Các công ty bảo hiểm ô tô ở Châu Âu và Hoa  
Kỳ đang thử nghiệm và lắp đặt các cảm biến trên xe của khách hàng để có thể  
cảm nhận được hành vi lái xe của tài xế để tính phí theo đó. Ngoài ra, một số  
nhà sản xuất ô tô hạng sang đang sử dụng các cảm biến tiên tiến để phản ứng tự  
động trong tình huống sắp xảy ra tai nạn. [9]  
Các ứng dụng của IoT:  
IoT Cảm biến  
Cảm biến IoT bao gồm các cảm biến thủ công hoặc kỹ thuật số được kết nối  
với bảng mạch như Arduino Uno hoặc Raspberry Pi 2. Bảng mạch có thể được  
lập trình để đo một loạt dữ liệu được thu thập từ thiết bị cảm biến như carbon  
monoxide, nhiệt độ, độ ẩm, áp suất, độ rung và chuyển động.  
Điều khác biệt giữa các cảm biến IoT với các cảm biến đơn giản là chúng  
không chỉ có thể thu thập dữ liệu tại các môi trường vật lý khác nhau mà còn gửi  
dữ liệu đến các thiết bị được kết nối.  
6
Hình 1.2 Cảm biến [27]  
Các cảm biến IoT cho phép kiểm soát dữ liệu liền mạch thông qua tự động  
hóa cung cấp thông tin chi tiết hữu ích. Chúng có thể được các doanh nghiệp sử  
dụng để bảo trì dự đoán, nâng cao hiệu quả và giảm chi phí.  
Lưới điện thông minh:  
Lưới điện thông minh là một ứng dụng công nghiệp khác của IoT. Lưới điện  
cho phép theo dõi thời gian thực các dữ liệu liên quan đến cung và cầu điện.  
Nó liên quan đến việc áp dụng trí thông minh máy tính để quản lý hiệu quả  
các nguồn lực.  
Các công ty tiện ích có thể sử dụng các công nghệ lưới điện thông minh IoT  
để quản lý cúp điện hiệu quả hơn. Họ có thể sử dụng công nghệ để xác định  
phân bố tải và cải thiện độ tin cậy. Công nghệ này cũng có thể hỗ trợ phát  
hiện lỗi và sửa chữa.  
Hình 1.3 Lưới điện thông minh [27]  
Với lưới điện thông minh, các tiện ích có thể kết nối tất cả các tài sản của họ  
bao gồm cả công tơ và trạm biến áp. Việc áp dụng các công nghệ IoT vào hệ  
7
sinh thái lưới điện cho phép các công ty tiện ích thực hiện quyền kiểm soát  
tốt hơn đối với cơ sở hạ tầng và tài nguyên điện. Hơn nữa, chúng cho phép  
người tiêu dùng tiếp cận năng lượng với chất lượng tốt hơn.  
Hệ thống chăm sóc sức khỏe:  
IoT có rất nhiều ứng dụng trong ngành chăm sóc sức khỏe. Công nghệ  
này có thể được sử dụng để cung cấp các dịch vụ y tế chất lượng cao bằng  
các thiết bị y tế thông minh.  
Còn được gọi là Internet of Medical Things (IoMT), công nghệ này có thể  
giúp theo dõi và hỗ trợ các dữ liệu quan trọng có thể giúp đưa ra các quyết định  
lâm sàng. Với các thiết bị y tế IoT, các dịch vụ y tế có thể được phổ biến rộng  
rãi hơn.  
Các thiết bị y tế IoT có thể giúp theo dõi bệnh nhân từ xa theo thời gian thực.  
Các thiết bị này có thể thông báo trường hợp khẩn cấp như lên cơn suyễn, suy  
tim, v.v., ngay lập tức cho bác sĩ. Điều này có thể giúp cứu sống nhiều cá nhân.  
Hình 1.4 Y tế thông minh [27]  
Các thiết bị IoT có thể thu thập dữ liệu chăm sóc sức khỏe bao gồm huyết áp,  
lượng đường, oxy và cân nặng. Dữ liệu được lưu trữ trực tuyến và bác sĩ có thể  
truy cập bất cứ lúc nào. IoT tự động hóa quy trình làm việc bằng cách cho phép  
cung cấp các dịch vụ chăm sóc sức khỏe hiệu quả cho bệnh nhân.  
Đầu đọc mã vạch thông minh  
Máy đọc mã vạch IoT có thể giúp quản lý hàng tồn kho tốt hơn cho các  
nhà bán lẻ. Các đầu đọc hỗ trợ xử lý tín hiệu kỹ thuật số dựa trên AI. Những  
8
thiết bị này có thể tối ưu hóa hoạt động của nhiều lĩnh vực bao gồm bán lẻ,  
hậu cần, kho hàng, v.v.  
Đầu đọc thẻ thanh dựa trên IoT có tính năng kết nối dữ liệu đám mây để  
kết nối với các hệ thống khác. Sử dụng đầu đọc mã vạch được kết nối sẽ dễ  
dàng hơn trong quá trình quản lý hàng tồn kho.  
Hình 1.5 Đầu đọc mã vạch thông minh [27]  
Đầu đọc mã vạch IoT có thể được kết hợp vào xe đẩy hàng. Người đọc sử  
dụng cảm biến dựa trên AI để phát hiện sản phẩm khi chúng được đánh rơi  
hoặc lấy ra khỏi giỏ hàng. Đầu đọc có thể chuyển dữ liệu sang máy tính tự  
động và điều đó có thể tiết kiệm rất nhiều thời gian trong quá trình thanh  
toán, dẫn đến cải thiện trải nghiệm cho khách hàng.  
1.3 Các công đánh giá hiệu năng  
Có một số công cụ đánh giá phổ biến được thiết kế chủ yếu cho các hệ hệ  
quản trị cơ sở dữ liệu truyền thống bao gồm bộ đánh giá TPC [10] và Wisconsin  
[7], cả hai công cụ sẽ được mô tả bên dưới. Tuy nhiên, Binning et al. [5] lập  
luận rằng các công cụ đánh giá truyền thống không phù hợp để phân tích các  
dịch vụ đám mây, đề xuất một số ý tưởng giúp cải thiện khả năng mở rộng và  
đặc tính chịu lỗi của điện toán đám mây. Tiếp theo, một số công cụ đo lường  
được thiết kế đặc biệt dành cho các hệ quản trị cơ sở dữ liệu NoSQL.  
1.3.1 Các công cụ đánh giá hiệu năng truyền thống  
Mỗi tiêu chuẩn đo lường TPC được thiết kế để mô hình hóa một ứng dụng  
cụ thể trong thế giới thực bao gồm các ứng dụng xử lý giao dịch (OLTP) với  
tiêu chuẩn TPC-C và TPC-E, hệ thống hỗ trợ quyết định với tiêu chuẩn TPC-D  
và TPC-H, hệ quản trị cơ sở dữ liệu được lưu trữ trong môi trường ảo hóa với  
9
   
Tải về để xem bản đầy đủ
pdf 71 trang yennguyen 29/03/2022 90840
Bạn đang xem 20 trang mẫu của tài liệu "Luận văn Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NoSQL", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • pdfluan_van_danh_gia_hieu_nang_mot_so_he_quan_tri_co_so_du_lieu.pdf