Đồ án môn Xử lý ảnh

Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
LỜI MỞ ĐẦU  
Ngày nay, cùng với sự phát triển mạnh mẽ của ngành khoa học công nghệ  
thông tin, internet đã trở thành một nhu cầu, phương tiện không thể thiếu đối với mọi  
người, nhu cầu trao đổi thông tin qua mạng ngày càng lớn. với lượng thông tin lớn  
như vậy được truyền qua mạng thì nguy cơ dữ liệu bị truy cập trái phép cũng tăng lên  
vậy vấn đề bảo đảm an toàn và bảo mật thông tin cho dữ liệu truyền trên mạng rất  
cần thiết. Nhiều kỹ thuật đã được nghiên cứu nhằm giải quyết vấn đề này. Một trong  
những kỹ thuật quan trọng nhất là mã hóa thông tin. Tuy nhiên một thông điệp bị mã  
hóa dễ gây ra sự chú ý và một khi các thông tin mã hóa bị phát hiện thì các tin tặc sẽ  
tìm mọi cách để giải mã.  
Một công nghệ mới phần nào giải quyết được những khó khăn trên là giấu  
thông tin trong các nguồn đa phương tiện như các nguồn âm thanh, hinh ảnh … Xét  
theo khía cạnh tổng quát thì giấu thông tin cũng một dạng mật nhằm đảm bảo  
tính an toàn của thông tin, nhưng phương pháp này ưu điểm ở chổ giảm được khả  
năng phát hiện ra sự tồn tại của thông tin trong các nguồn mang.  
Giấu thông tin là một kỹ thuật còn tương đối mới đanh phát triển rất nhanh,  
thu hút được cả sự quan tâm của giới khoa học giới công nghiệp cũng còn nhiều  
thách thức. Nội dung của báo cáo này chủ yếu nghiên cứu về kỹ thuật giấu tin nói  
chung và giấu tin trong văn bản nói riêng  
1
 
Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
MỤC LỤC  
2
 
Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
CHƯƠNG 1. TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN  
1.1.Khái niệm  
Môi trường giấu tin (hay còn gọi vật mang tin): là đối tượng được dùng để  
giấu tin như văn bản, ảnh, audio, video,…  
Giấu tin trong ảnh: Thông tin sẽ được giấu vào dữ liệu ảnh nhưng chất lượng  
ảnh ít thay đổi và “khó” biết được đằng sau ảnh đó mang những thông tin có ý ngĩa gì.  
Trong ảnh thông tin mật cho nhau mà người khác khô thể biết được.  
Giấu tin trong audio: Giấu tin trong audio lại phụ thuộc vào hệ thống thính  
giác. Giấu thông tin trong audio đòi hỏi yêu cầu rất cao về tính đồng bộ và tính an toàn  
của thông tin. Các phương pháp giấu tin trong audio đều lợi dụng điểm yếu trong thính  
giác con người.  
Giấu tin trong video: Cũng giống như giấu tin trong ảnh hay trong audio, giấu  
tin trong video cũng được quan tâm và được phát tiển mạnh mẽ cho nhiều ứng dụng  
như điều khiển truy cập thông tin, xác thực thông tin và bảo vệ quyền tác giả. Ý tưởng  
cơ bản của phương pháp là phân phối thông tin giấu dàn trải thheo tần số của dữ liệu  
gốc.  
- Dữ liệu sẽ được giấu một lượng thông tin mang ý nghĩa nào đó tùy thuộc  
vào mục đích của người sử dụng.  
- Giấu tin là nhúng mẩu tin mật vào một vật mang tin khác, sao cho mắt thường  
“khó” phát hiện ra mẩu tin đó, mặt khác khó nhận biết được vật mang tin đã được giấu  
một tin mật.  
1.2.Mục đích của việc giấu tin  
- Mục đích của việc giấu tin là đảm bảo an toàn và bảo mật thông tin. Có 2  
khía cạnh cần được quan tâm đó là:  
+ Bảo mật cho dữ liệu được đem giấu .  
+ Bảo mật cho chính đối tượng được đem giấu thông tin .  
- Ngày nay nghệ thuật giấu tin được nghiên cứu để phục vụ các mục đích tích  
cực như: bảo vệ bản quyền các tài liệu số hóa (dùng thuỷ ấn số), hay giấu các thông tin  
mật về quân sự và kinh tế.  
- Sự phát triển của công nghệ thông tin đã tạo ra những môi trường giấu tin mới  
vô cùng tiện lợi và phong phú. Người ta có thể giấu tin trong các văn bản, hình ảnh,  
âm thanh. Cũng thể giấu tin ngay trong các khoảng trống hay các phân vùng ẩn của  
môi trường lưu trữ như đĩa cứng, đĩa mềm. Các gói tin truyền đi trên mạng cũng là  
môi trường giấu tin thuận lợi. Các tiện ích phần mềm cũng là môi trường tưởng để  
gài các thông tin quan trọng, để xác nhận bản quyền.  
4
     
Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
1.3.Phân loại các kỹ thuật giấu tin  
thể chia kỹ thuật giấu tin ra làm 2: steganography và watermarking.  
Hình 1.1.Phân loại các kỹ thuật giấn tin  
1.2.1.Giấu tin mật (Seganography )  
Giấu tin mật (Seganography ) quan tâm tới việc giấu các tin sao cho thông tin  
giấu được càng nhiều càng tốt và quan trọng người khác khó phát hiện được một đối  
tượng bị giấu tin bên trong hay không bằng kỹ thuật thông thường.  
1.2.2.Thủy vân số (Watermaking )  
Thủy vân số (Watermaking ) đánh giấu vào đối tượng nhằm khẳng định bản  
quyền sở hữu hay phát hiện xuyên tạc thông tin. Thủy vân số được phân thành 2 loại  
thủy vân bền vững thủy vân dễ vỡ.  
- Thuỷ vân bền vững: thường được ứng dụng trong các ứng dụng bảo vệ bản  
quyền. Thuỷ vân được nhúng trong sản phẩm như một hình thức dán tem bản quyền.  
Trong trường hợp này, thuỷ vân phải tồn tại bền vững cùng với sản phẩm nhằm chống  
việc tẩy xoá, làm giả hay biến đổi phá huỷ thuỷ vân.  
+ Thuỷ vân ẩn: cũng giống như giấu tin, bằng mắt thường không thể nhìn thấy  
thuỷ vân.  
+ Thuỷ vân hiện: loại thuỷ vân được hiện ngay trên sản phẩm người dùng  
thể nhìn thấy được.  
- Thủy vân dễ vỡ: kỹ thuật nhúng thuỷ vân vào trong ảnh sao cho khi phân bố  
sản phẩm trong môi trường mở nếu bất cứ một phép biến đổi nào làm thay đổi đối  
tượng sản phẩm gốc thì thuỷ vân đã được giấu trong đối tượng sẽ không còn nguyên  
vẹn như trước khi dấu nữa (dễ vỡ).  
So sánh giữa steganography và watermarking:  
5
       
Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
Steganography  
Watermaking  
Mục đích - Che giấu sự hiện hữu của thông điệp -Thêm vào thông tin bản  
- Thông tin che giấu độc lập với vỏ quyền  
bọc  
- Che giấu thông tin gắn với  
đối tượng vỏ bọc  
Yêu cầu  
- Không phát hiện được thông điệp bị Tiêu chuẩn bền vững  
che giấu  
- Dung lượng tin được dấu  
Tấn công Phát hiện ra thông điệp mật bị che Watermaking bị phá vỡ  
thành công giấu  
1.4.Một số ứng dụng  
*Ứng dụng của thủy vân số(Watermaking):  
- Tự động giám sát các bản sao và theo dõi các bản sao, viết tài liệu trên web.  
(Ví dụ 1 robot tìm kiếm trên web với 1 tài liệu được đánh dấu và do đó tiềm năng  
xác đinh vấn đề bất hợp pháp).  
- Tự động kiểm tra 1 đài phát thanh truyền đi.  
6
 
Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
CHƯƠNG 2. ĐỊNH DẠNG ẢNH BITMAP  
Đối tượng ảnh đầu tiên mà các chương trình giấu tin nhắm tới ảnh Bitmap.  
ảnh này phổ biến trên mạng Internet, dung lượng giấu tin cao và các phương pháp  
giấu tin đơn giản.  
2.1.Tổng quan  
Các ảnh số thường được lưu dưới dạng tệp ảnh 24-bit hay 8-bit cho một điểm  
ảnh. Ảnh 24-bit còn được gọi ảnh true colour cung cấp nhiều chỗ giấu thông tin  
hơn; tuy nhiên ảnh 24-bit lớn, dụ một ảnh 24-bit cỡ 1024 x 768 pixels có kích  
thước trên 2 MB, nên dễ bị gây chú ý khi tải qua mạng. Thường những ảnh đó cần  
được nén, nhưng nén ảnh thể làm mất tin mật. Một phương án khác là có thể dùng  
ảnh 8-bit màu để giấu thông tin.  
Trong các ảnh 8-bit (như ảnh GIF), mỗi điểm ảnh được thể hiện bằng một byte.  
Mỗi điểm đơn thuần trỏ đến một bảng chỉ mục các màu (palette), với 256 khả năng  
màu. Điểm ảnh chứa trị nằm giữa 0 và 255. Các phần mềm chỉ đơn thuần vẽ màu cần  
biểu thị lên màn hình tại vị trí lựa chọn. Nếu dùng một ảnh 8-bit làm ảnh phủ, rất  
nhiều chuyên gia về giấu tin trong ảnh khuyên nên dùng ảnh 256 cấp xám vì bảng màu  
của ảnh xám thay đổi đồng đều giữa làm tăng khả năng giấu tin. Giấu tin trong ảnh 8-  
bit cần xem xét cả ảnh lẫn bảng màu. Một ảnh khối lớn các màu đồng nhất khó giấu  
hơn dễ bị nhận biết. Sau khi chọn ảnh phủ, bước tiếp theo là chọn phương pháp mã  
hoá ảnh.  
2.2.Bảng màu  
Bảng màu là một mảng 1 chiều chứa chỉ mục các màu của ảnh. Sau đó mỗi  
điểm ảnh chỉ việc trỏ đến một màu chỉ mục nào đó trên bảng màu.  
Hình 2.1.Bảng màu và các điểm ảnh dùng bảng màu  
- Trong bảng màu, 1 màu ứng với một bộ ba hay bộ bốn.  
- Kích thước của bảng màu được tính từ độ sâu điểm ảnh (pixel depth):  
4-bit pixel: 3 byte/màu * 16 (= 24) màu = 48 byte  
8-bit pixel: 3 byte/màu * 256 màu = 768 byte  
7
       
Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
15-bit pixel: 3 byte/màu * 32768 màu = 96 kbyte  
16-bit pixel: 3 byte/màu * 65536 màu = 192 kbyte  
- Một số loại ảnh giảm bớt số màu trong bảng màu, vì không phải tất cả các  
màu được dùng trong ảnh (CGM, TGA).  
- Các giá trị điểm được cất trong 2 byte (16 bit):  
16 bit = 2 byte = (8 bit, 8 bit) -> (5,6,5) = (R,G,B)  
- Có các cách bố trí:  
+ Theo điểm ảnh (pixel-orientiert) (RGB) (RGB) (RGB) (RGB) (RGB)  
+ Theo mặt phẳng màu (plane-orientiert) (RRRRR ..... GGGGG ..... BBBBB)  
Hình 2.2.Các cách bố trí bảng màu  
Một số phương pháp giấu tin trong ảnh dựa vào việc sắp xếp lại bảng màu,  
trong khi các phương pháp khác thêm bớt các màu vào bảng màu.  
2.3.Mô tả ảnh  
Để xử hoặc nghiên cứu về ảnh người ta phải mô hình hoá chúng. Tuỳ theo  
quan điểm, mô hình mà có thể áp dụng các phép xử lý khác nhau trên mô hình đó.  
- Ảnh như một bản đồ bít: quan điểm ảnh mành như một bản đồ các bít tạo  
nền tảng để chúng ta áp dụng các phép toán về bit.  
- Ảnh như một hàm toán học: để xử ảnh trong máy tính dùng các công cụ  
toán học, người ta tìm cách biểu diễn ảnh như một hàm rời rạc f(x,y) trong đó x, y là  
toạ độ của điểm ảnh còn f là giá trị xám hoặc độ sáng của ảnh. f nhận các giá trị rời rạc  
trong khoảng từ 0 đến fmax. Trong ảnh 8 bit thì fmax = 28= 256. Trong ảnh màu  
người ta có thể tả màu qua ba hàm biểu diễn các thành phần đỏ, lục và lam.  
dụ r(x,y); g(x,y); b(x,y).  
- nh như một môi trường vật lý: Một ảnh f(x,y) cũng một môi trường vật  
lý nên có thể dùng áp dụng các phép biến đổi vật lý trên ảnh.  
dụ mức năng lượng của điểm ảnh, dải tần số của nhiễu ảnh, dải phổ,..  
8
   
Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
- Mô tả ảnh như một mô hình thống kê: Các giá trị của điểm ảnh (mức xám,  
độ sáng hay trị màu) được coi như biến ngẫu nghiên, do đó chúng ta có thể tính  
được phân bố xác suất của chúng. Ví dụ người ta có thể dùng biểu đồ cột (histogram)  
để biểu diễn độ xám hay các trị màu. Trong xử ảnh người ta có thể dùng biểu đồ cột  
để làm các việc như lọc nhiễu.Còn trong giấu tin thì ta có thể qua đó biết đâu là  
vùng ảnh thể giấu tin tốt nhất.  
Hình 2.3.Biểu đồ cột của một ảnh trong Paint Shop Pro 7  
Chính các quan điểm khác nhau về ảnh đã làm nền tảng để được những kỹ  
thuật khác giấu tin khác nhau.  
2.4.Cấu trúc ảnh  
Ảnh Bitmap do Microsoft phát triển, do vậy còn được gọi là Microsoft  
Windows Bitmap (BMP, DIB, Windows BMP, Windows DIB, Compatible Bitmap)  
được lưu trữ độc lập với thiết bị hiển thị (DIB). Ảnh này được sử dụng rộng rãi trên  
Windows. Có thể có 1-, 4-, 8-, 16-, 24-, hay 32-bit mầu. Ảnh này thường sử dụng  
phương pháp mã hoá loạt dài RLE. Kích thước tối đa là 32Kx32K và 2Gx2G pixel.  
Ảnh bitmap không cho phép chứa nhiều ảnh trong một tệp.  
Cấu tạo của ảnh bitmap gồm các phần : 1. Header  
2. Palette  
3. Bitmap Data  
4. Footer  
Để đọc xử ảnh Bitmap người ta cần nắm được các cấu trúc của ảnh được  
lưu trong phần Header.  
dụ: Header của Microsoft Windows Bitmap Version 1.x có cấu trúc như sau:  
Header Palette  
Bitmap Index  
Palette 1  
File Identifier  
9
   
Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
File Version  
Number of Lines per Image  
Number of Pixels per Line  
Number of Bits per Pixel  
Number of Color Planes  
Compression Type  
X Origin of Image  
Y Origin of Image  
Text Description  
Unused SpaceẢnh Bitmap Microsoft Windows 1.x có phần Header gồm 10-byte :  
TYPEDEF struct _Win1xHeader  
{
WORD Type; /* File type identifier (always 0) */  
WORD Width; /* Width of the bitmap in pixels */  
WORD Height; /* Height of the bitmap in scan lines */  
WORD ByteWidth; /* Width of bitmap in bytes */  
BYTE Planes; /* Number of color planes */  
BYTE BitsPerPixel; /* Number of bits per pixel */  
} WIN1XHEADER;  
Dữ liệu ảnh Bitmap được ghi vào tệp theo 2 cách:  
- Quét từng dòng theo trật tự điểm ảnh như chúng được hiển thị trên thiết bị  
theo từng mặt phẳng mầu (plane)  
* Chi tiết cấu trúc các ảnh BITMAP  
- Bitmap header:  
1-2 Nhận dạng file Kiểu arrayp1..2] of char:chứa tự BM  
3-6 Kích thướ file Kiểu Longint: tính bằng byte  
7-10 Reserve nt : tôi chưa biết(có lẽ là tên file thừa)  
11-14 Byte bắt đầu Kiểu longint, vị trí byte bắt đầu vùng data kể từ đầu file  
10  
Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
- BitmapInfor :  
1-4 Số byte trong vùng info Kiểu Longint, hiện tại có giá trị 40  
5-8 Chiều rộng bitmap Kiểu longint tính bằng pixel  
9-12 Chiều cao bitmap Kiểu longint tính bằng pixel  
13-14 Số Planes màu Kiểu Word số bảng màu  
15-16 Số bits cho một pixel Kiểu Word, các giá trị thể có  
1: Đen/trắng,  
4:16 màu,  
8:256 màu,  
24: 24bit màu  
17-20 Kiểu nén dữ liệu Kiểu Longint có giá trị là  
0: Không nén  
1: Nén runlength+8bit/pixel  
2: Nén runlength+4bit/pixel  
21-24 Kích thước ảnh Kiểu Longint, bằng số byte của ảnh  
25-28 Độ phân giải ngang Kiểu Longint, tính bằng pixel  
29-32 Độ phân giải dọc Kiểu Longint, tính bằng pixel  
33-36 Số màu được sử dụng Kiểu Longint trong ảnh  
37-40 Số màu được sử dụng Kiểu Longint khi hiện ảnh  
- Bitmap palette:  
Tiếp theo sau vùng info là palette màu của BMP, gồm nhiều bộ có kích thước  
bằng 4 byte xếp liền nhau theo cấu trúc Blue-Green-Red và một Byte dành riêng cho  
Itensity. Kích thước của vùng Palette màu bằng 4*số màu của ảnh. Vì Palette màu của  
màn hình có cấu tạo theo thứ tự Red-Green-Blue, nên khi đọc palette màu của ảnh  
BMP vào ta phải chuyển đổi lại cho phù hợp. Số màu của ảnh được biết dựa trên số bít  
cho 1 pixel cụ thể là: 8.bits/pixel: ảnh 256 màu,  
4bits/pixel: ảnh 16 màu, 24bits/pixelảnh 24 bít màu  
- BitmapData:  
Phần này kề tiếp ngay sau Palette màu của BMP. Đây phần chứa các giá trị  
màu của các điểm ảnh trong BMP. Các điểm ảnh được lưu theo thứ tự từ trái qua phải  
trên một dòng và các dòng lại được lưu theo thứ tự dưới lên trên. Mỗi Byte trong vùng  
BitmapData biểu diễn 1 hoặc nhiều điểm ảnh tùy theo số bits cho một pixel.  
+ Khi là 1 bit màu: Các bitmap là Đơn sắc, bảng màu có chứa hai mục. Mỗi  
bit trong bitmap mảng đại diện cho một điểm ảnh. Nếu bit, rõ ràng, các điểm ảnh sẽ  
được hiển thị với màu sắc của các mục đầu tiên trong bảng màu, nếu các bit, được thiết  
lập, các điểm ảnh có màu sắc của các mục nhập thứ hai trong bảng.  
11  
Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
+ Khi là 4 bit màu: Các bitmap đã tối đa là 16 màu sắc, và các bảng màu  
chứa lên đến 16 mục. Mỗi điểm ảnh trong bitmap được thể hiện bằng một 4-bit, chỉ  
mục vào các bảng màu. Ví dụ, nếu người đầu tiên byte trong bitmap là 1Fh, các byte  
đại diện cho hai pixel. Đầu tiên chứa các điểm ảnh màu trong bảng màu mục nhập thứ  
hai, và lần thứ hai chứa các điểm ảnh màu trong bảng màu 16 mục.  
+ Khi là 8 bit màu: Các bitmap đã tối đa là 256 màu sắc, và các bảng màu  
chứa tối đa 256 mục. Trong trường hợp này, mỗi byte trong mảng đại diện cho một  
điểm ảnh.  
+ Khi là 16 bit màu: Các bitmap đã tối đa là 216 màu. Nếu các lĩnh vực của  
nén tập tin bitmap được thiết lập để BI_RGB, các lĩnh vực Palette không chứa bất kỳ  
mục. Mỗi từ trong mảng bitmap đại diện cho một điểm ảnh. Các thân nhân của  
intensities đỏ, xanh, xanh và được đại diện với 5 bit cho mỗi thành phần màu sắc. Các  
giá trị cho màu xanh là đáng kể trong ít nhất 5 bit, sau 5 bit cho mỗi màu xanh và đỏ,  
tương ứng. Trọng nhất không phải là ít được sử dụng.  
Nếu các lĩnh vực của nén tập tin bitmap được thiết lập để BI_BITFIELDS, các  
lĩnh vực Palette có chứa ba dword màu mặt nạ chỉ định màu đỏ, màu xanh, màu  
xanh và các thành phần, tương ứng, trong mỗi điểm ảnh. Mỗi từ trong mảng bitmap  
đại diện cho một điểm ảnh.  
Windows NT, cụ thể: Khi nén lĩnh vực được thiết lập để BI_BITFIELDS, thiết  
lập bit trong mỗi dword mask phải được tác và không nên chồng chéo các bit của một  
khách mask. Tất cả các bit trong các điểm ảnh không cần phải được sử dụng.  
Windows 95 cụ thể: Khi nén lĩnh vực được thiết lập để BI_BITFIELDS,  
Windows 95 chỉ hỗ trợ sau đây 16bpp màu mặt nạ: Một 5-5-5 16-bit, hình ảnh, nơi mà  
màu xanh mask là 0x001F, cácmàu xanh lá cây mask là 0x03E0, và màu đỏ mask là  
0x7C00; và 5-6-5 16-bit, hình ảnh, nơi mà màu xanh mask là 0x001F, các màu xanh lá  
cây mask là 0x07E0, và màu đỏ là 0xF800 mask.  
+ Khi là 24 bit màu: Các bitmap đã tối đa là 224 màu sắc, và các lĩnh vực  
Palette không chứa bất kỳ mục. Mỗi 3-byte ban tam ca trong mảng bitmap đại diện  
cho thân nhân của intensities màu xanh, màu xanh lá cây, và đỏ, tương ứng, cho một  
điểm ảnh.  
+ Khi lĩnh vực này là bằng 32: Các bitmap đã tối đa là 232 màu. Nếu các  
lĩnh vực nén của bitmap được thiết lập để BI_RGB, các lĩnh vực Palette không chứa  
bất kỳ mục. Mỗi dword trong mảng bitmap đại diện cho thân nhân của intensities màu  
xanh, màu xanh lá cây, và đỏ, tương ứng, cho một điểm ảnh. Cao byte trong mỗi  
dword là không sử dụng.  
12  
Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
Nếu các lĩnh vực nén của bitmap được thiết lập để BI_BITFIELDS, các lĩnh  
vực Palette có chứa ba dword màu mặt nạ chỉ định màu đỏ, màu xanh, màu xanh  
và các thành phần, tương ứng, trong mỗi điểm ảnh. Mỗi dword trong mảng bitmap đại  
diện cho một điểm ảnh.  
13  
Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
CHƯƠNG 3. KỸ THUẬT GIẤU TIN TRONG ẢNH  
3. 1.Các kĩ thuật giấu tin trong ảnh BITMAP  
Việc giấu tin trong ảnh màu thì có rất nhiều thuận lợi so với việc giấu tin trong  
ảnh đen trắng nó có một ưu điểm như sau:  
Giấu được nhiều thông tin hơn so với ảnh đen trắng cùng kích cỡ  
Độ an toàn cao hơn so với ảnh đen trắng vì có rất ít sự thay đổi so với ảnh gốc  
ban đầu.  
3.1.1.Ảnh nhỏ hơn hoặc bằng 8 bit màu  
Không phải tất cả những ảnh nhỏ hơn hoặc bằng 8 bit màu đều bảngmàu  
được sắp xếp, do vậy việc sắp xếp LSB rất khó khăn. Ta cần sắp xếp lại bảng màu:  
Chọn một màu bất kỳ giả sử màu có dạng: A(x, y, z) tđưa vào vị trí đầu tiên  
Duyệt tất cả các màu B(m, n, p) còn lại và tính:  
S(A, B) =sqrt((x-m)2 +(y-n)2+(z-p)2)  
Ta sẽ chọn màu B có S(A, B) nhỏ nhất để sắp xếp cạn màu A sau đó lại tiếp tục  
bước 2.  
Quy trình kết thúc khi bảng màu đã được sắp xếp.  
Lưu ý: Các điểm ảnh chỉ số màu là 15 phải được đổi thành chỉ số 853. 1. 2  
3.1.2.Ảnh 16 bit màu  
Thực tế chỉ có 15 bit được dùng để biểu diễn cho một điểm ảnh :  
5 bit dùng để biểu diễn cường độ tương đối màu đỏ  
5 bit dùng để biểu diễn cường độ tương đối màu xanh lơ  
5 bit dùng để biểu diễn cường độ tương đối màu xanh lam  
Còn 1 bit không dùng đến là bit cao nhất ở byte thứ 2, đó chính là bit LSB của ảnh 16  
bit màu. Nếu chỉ lấy một bit này thì lượng thông tin giấu rất ít do đó cần lầy thêm  
một số bit nữa.  
3.1.3.Ảnh 24 bit màu  
Mỗi một điểm ảnh được biểu diễn bằng 3 byte  
1 byte dùng để biểu diễn cường độ tương đối màu đỏ  
1 byte dùng để biểu diễn cường độ tương đối màu xanh lơ  
1 byte dùng để biểu diễn cường độ tương đối màu xanh lam  
Trong mỗi byte các bít nằm càng về cuối càng ít ảnh hưởng đến phần dữ liệu  
ảnh. Thông thường để tăng lượng thông tin được giấu người ta thường lấy 4 bít cuối  
mỗi byte để giấu thông tin.  
Bằng thực nghiệm cho thấy nếu thay toàn bộ bít cuối của một byte thì ảnh kết  
qủa cũng không khác nhiều lắm so với ảnh ban đầu. Điều này là vô cùng có ý nghĩa vì  
ta có thể giấu được nhiều thông tin trong ảnh .  
14  
         
Đồ án môn: XỬ ẢNH  
3.2. Kỹ thuật dùng hệ số DCT  
3.2.1.Nền tảng kỹ thuật  
Ngành công nghệ thông tin  
Các ảnh JPEG có tỷ lệ nén cao, chất lượng tốt, do đó chúng được sử dụng nhiều  
trên mạng. Tuy nhiên các tệp ảnh JPEG không phù hợp với xử lý bít như các ảnh dựa  
trên bảng mầu, tuy vậy vẫn thể dùng chúng để giấu dữ liệu.  
Ảnh JPEG sử dụng biến đổi Cosin rời rạc để thực hiện nén ảnh Biến đổi cosin  
rời rạc là phép biến đổi mất dữ liệu vì không thể tính chính xác các giá trị cosin, cũng  
như thể có các lỗi làm tròn. Độ lệch giữa dữ liệu gốc dữ liệu phục hồi lại sau khi  
biến đổi phụ thuộc vào các giá trị phương pháp sử dụng để tính các trị cosin rời rạc.  
Cũng thể xử ảnh dùng biến đổi Fourier nhanh hoặc biến đổi sóng con  
(wavelet transformation). Thuật toán JPEG làm việc bằng cách chia ảnh ra thành các  
ma trận 8x8. Sau đó tính hệ số biến đổi cosin rời rạc cho từng ma trận. Bước tiếp theo  
các hệ số này được nhân với một ma trận lượng hoá. Kết quả thu được sẽ được làm  
tròn đến số nguyên gần nhất, cuối cùng các số nguyên này được nén và lưu lại.  
Các cấu tử DCT chính là nơi chúng ta có thể giấu dữ liệu. Cách tiếp cận phổ  
biến chọn các hệ số DCT lớn sử đi chút ít. Vì hệ số lớn tức mức "năng lượng"  
cao nên ít làm thay đổi ảnh nhất. Một hướng khác là chọn các hệ số DCT trong các  
vùng mà mắt người không nhìn thấy.  
Các thuật toán JPEG nổi tiếng áp dụng trong F5 và JSteg đều dùng cách sửa  
DCT để nhúng dữ liệu. Cả hai phương pháp này đều qua được mắt thường nhưng  
không qua được các phương pháp phân tích thống kê.  
Dung lượng giấu :  
Dung lượng giấu không cao, và vì vậy phù hợp hơn với thuỷ ấn.  
3.2.2.Phép biến đổi cosin rời rạc (DCT)  
Biến đổi cosin rời rạc viết tắt là DCT-Discrete Cosine Transform được đưa ra  
bởi Ahmed và các đồng nghiệp của ông vào năm 1974. Phép biến đổi DCT đã được  
dùng trong dạng chuẩn ảnh JPEG.  Định nghĩa biến đổi cosin rời rạc hai chiều:  
- Biến đổi DCT hai chiều tổng quát là biến đổi trên khối hai chiều bất kỳ m x n,  
trong đó các khối kích thước 8*8, 16*16 được sử dụng nhiều nhất. Tuy nhiên, chúng ta  
sẽ chỉ tìm hiểu phép biến đổi DCT trên khối 8*8 được sử dụng trong chuẩn nén ảnh  
JPEG.  
- Phép biến đổi thuận DCT 8*8 được định nghĩa như sau:  
15  
     
Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
3.2.3.Đặc điểm của phép biến đổi DCT hai chiều  
- Thể hiện đặc tính nội dung về tần số thông tin ảnh. Hệ số góc trên là lớn và  
đặc trưng cho giá trị trung bình thành phần một chiều gọi hệ số DC, còn các hệ số  
khác có giá trị nhỏ hơn biểu diễn cho các thành phần tần số cao theo hướng ngang và  
theo hướng thẳng đứng gọi hệ số AC.  
- Bản thân biến đổi DCT không nén được dữ liệu cũng sinh ra 64 hệ số.  
- Theo nguyên lý chung, khi biến đổi chi tiết giữa các điểm ảnh càng lớn theo  
một hướng nào đó trong khối các điểm ảnh, hướng ngang, hướng thẳng đứng hay theo  
hướng đường chéo thì tương ứng theo các hướng đó, các biến đổi DCT càng lớn.  
- Theo nguyên lý chung, khi biến đổi chi tiết giữa các điểm ảnh càng lớn theo  
một hướng nào đó trong khối các điểm ảnh, hướng ngang, hướng thẳng đứng hay theo  
hướng đường chéo thì tương ứng theo các hướng đó, các biến đổi DCT càng lớn.  
- DCT làm giảm độ tương quan không gian của thông tin trong khối ảnh. Nhờ  
các đặc tính tần số không gian của hệ thống nhìn của mắt người, các hệ số DCT có thể  
được mã hoá phù hợp, chỉ các hệ số DCT quan trọng nhất mới được mã hoá để truyền  
đi.  
- Khối hệ số DCT có thể chia thành 3 miền: miền tần số thấp, miền tần số cao,  
miền tần số giữa:  
+ Miền tần số thấp: chứa các thông tin quan trọng ảnh hưởng đến tri giác.  
+ Miền tần số cao: các thông tin trong miền tần số cao thường không mang tính  
tri giác cao, khi nén JPEG thì thường loại bỏ thông tin trong miền này. Trong các thuật  
toán thuỷ vân, miền hệ số DCT tần số cao thường không được sử dụng do nó thường  
không bền vững với các phép xử ảnh, hoặc nén ảnh JPEG. Miền tần số cao cũng  
khó được sử dụng do một sự thay đổi nhỏ trong miền này cũng dẫn đến chất lượng  
tri giác của ảnh.  
+ Miền tần số giữa: thường hay được sử dụng nhất cũng cho kết quả tốt nhất.  
Trong thuật toán đề xuất cũng sử dụng miền tần số ở giữa.  
16  
 
Đồ án môn: XỬ ẢNH  
Ngành công nghệ thông tin  
3.3. Kỹ thuật giấu tin trong miền biến đổi DCT  
Thuật toán dưới đây sẽ sử dụng phương pháp nhúng thuỷ vân trong miền tần số  
của ảnh, giải tần được sử dụng để chứa tín hiệu thuỷ vân là miền tần số ở giữa của một  
khối DCT 8x8. Trong đó, các khối DCT 8x8 là những khối ảnh cùng kích thước đã  
được chọn ra ngẫu nhiên từ ảnh ban đầu được áp dụng phép biến đổi cosin rời rạc  
DCT để chuyển sang miền tần số. Mỗi tín hiệu thuỷ vân sẽ được chứa trong một khối.  
3.3.1.Mô tả thuật toán  
- Input:  
Watermark: Một chuỗi các bit b.  
Một ảnh F.  
- Output:  
Một ảnh sau khi thuỷ vân, F’.  
Khoá để giải mã K.  
3.3.2.Quá trình Watermarking  
Một ảnh có kích m x n sẽ được chia thành (m x n)/64 khối 8 x 8, mỗi bit sẽ  
được giấu trong một khối. Chọn một khối bất kỳ B và biến đổi DCT khối đó thu được  
B’. Chọn hai hệ số ở vị trí bất kỳ trong miền tần số ở giữa của khối DCT, giả sử đó là  
b’(i,j) và b’(p,q). Ta tính:  
d = || b’(i,j) - |b’(p,q)|| mod a  
Trong đó a là một tham số thoả mãn: a= 2(2t + 1), t là một số nguyên dương.  
- Bit Si sẽ được nhúng sao cho thoả mãn điều kiện :  
+ Nếu d<2t+1 mà Si =1 thì một trong hai hệ số DCT b’(i,j) hoặc b’(p,q) có trị  
tuyệt đối lớn hơn sẽ bthay đổi để d>= 2t+1 theo công thức sau:  
max(|b’(i,j)| , |b’(p,q)|) + (INT(0.75*a)- d)  
Với hàm max (|b’(i,j)| , |b’(p,q)|) là hàm chọn ra hệ số trị tuyệt đối lớn hơn,  
hệ số được chọn sẽ được cộng thêm một lượng là (INT(0.75*a) - d) hoặc cũng thể  
biến đổi một trong hai hệ số theo công thức:  
min(|b’(i,j)| , |b’(p,q)|) - (INT(0.75*a) + d)  
Với hàm min(|b’(i,j)| , |b’(p,q)|) là hàm chọn ra hệ số trị tuyệt đối nhỏ hơn,  
hệ số được chọn sẽ bị trừ đi một lượng là (INT(0.75*a) + d) INT() là hàm làm lấyphần  
nguyên của một số thực.  
+ Tương tự, nếu d>= 2t+1 mà Si = 0 thì một trong hai hệ số DCT b’(i,j) hoặc  
b’(p,q) có trị tuyệt đối lớn hơn sẽ được thay đổi để thoả mãn d<2t+1 như sau:  
17  
     
Đồ án môn: XỬ ẢNH  
max(|b’(i,j)| , |b’(p,q)|) – (d- (INT(0.75*a)))  
Ngành công nghệ thông tin  
hàm max(|b’(i,j)| , |b’(p,q)|) là hàm chọn ra hệ số trị tuyệt đối lớn, hệ số được chọn  
sẽ bị trừ đi một lượng là (d- (INT(0.75*a)) hoặc cũng thể biến đổi một trong hai hệ  
số theo công thức:  
min(|b’(i,j)| , |b’(p,q)|) + (INT(0.75*a)- d)  
hàm min(|b’(i,j)| , |b’(p,q)|) là hàm chọn ra hệ số trị tuyệt đối nhỏ hơn, hệ số đuợc  
chọn sẽ được cộng thêm một lượng là (INT(1.25*a)-d)  
Hình 3.1.Sơ đồ nhúng thủy vân  
18  
 
Đồ án môn: XỬ ẢNH  
- Quá trình giải nhúng:  
Ngành công nghệ thông tin  
Đọc vào khối DCT đã nhúng thủy vân và vị trí hai hệ số đã biến đổi, sau đó tính:  
d=||b’(i,j)|-|b’(p,q)|| mod a  
Nếu d>=2t+1 thì Si =1  
với (a=2(2t+1))  
Nếu d<2t+1 thì Si =0  
Quá trình giải được tả như sau:  
Hình 3.2.Sơ đồ quá trình giải mã  
- Chứng minh tính đúng đắn của thuật toán:  
Xét các trường hợp sau đây:  
+ Hai trường hợp nếu d< 2t+1 với Si = 0 và d>=2t+1 với Si =1 thì sẽ  
không thay đổi hệ số của khối DCT, và vì DCT là phép biến đổi hoàn toàn đảo  
ngược nên khi giải mã thì ta cũng thu được kết quả chính xác.  
+ Trường hợp d<2t+1 và Si = 1Ta biến đổi một trong hai hệ số b’(i,j) và b’(p,q)  
như sau:  
max(|b’(i,j)| , |b’(p,q)|) + (INT(0.75*a)- d)  
19  
 
Đồ án môn: XỬ ẢNH  
Khi đó giá trị d mới là :  
Ngành công nghệ thông tin  
d’ = (||b’(i,j)| -|b’(p,q)| |+ (INT(0.75*a)- d)) mod a  
d’ = (|b’(i,j)| - |b’(p,q)|| mod a)+ (INT(0.75*a)mod a)-(d mod a)  
d’ = d+INT(0.75*a)-d = INT(0.75*a)> 0.5*a=2t+1(dfcm)  
+ Trường hợp d>=2t+1 và Si = 0 Ta biến đổi một trong hai hệ số DCT b’(i,j) và  
b’(p,q) như sau:  
max(|b’(i,j)| , |b’(p,q)|) - (d-INT(0.25*a))  
Khi đó giá trị d mới là :  
d’ = (||b’(i,j)| -|b’(p,q)| |- (d-INT(0.25*a)) mod a  
d’ = (|b’(i,j)| - |b’(p,q)|| mod a)+ (INT(0.25*a)mod a)-(d mod a)  
d’ = d-d + 0.25*a= 0.75*a)> 0.5*a=2t+1(dfcm)  
3.4. Cài đặt thực nghiệm  
* Cài đặt  
- Ngôn ngữ cài đặt, môi trường soạn thảo Microsoft Visual Studio.  
- Chạy chương trình được thực hiện trên ngôn ngữ lập trình C#.  
* Thực nghiệm  
Giao diện của chương trình:  
Hình 3.3.Giao diện chính của chương trình  
20  
   
Tải về để xem bản đầy đủ
doc 25 trang yennguyen 30/03/2022 7680
Bạn đang xem 20 trang mẫu của tài liệu "Đồ án môn Xử lý ảnh", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • docdo_an_mon_xu_ly_anh.doc