Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
1
CHƢƠNG 1 GIỚI THIỆU
1.1 Sự cần thiết của nghiên cứu
Hiện nay, cuộc Cách mạng Công nghiệp lần thứ tư đang diễn ra. Khác với 3
cuộc Cách mạng Công nghiệp trước, không chỉ dừng lại ở tự động hóa sản xuất
và chế tạo sản phẩm, cuộc Cách mạng Công nghiệp lần này đang hứa hẹn làm
thay đổi sâu, rộng thế giới. Hình ảnh, audio, video dường như không còn được
sản xuất và phân phối ở dạng tương tự (analog), hình thức sản xuất và phân
phối ở dạng này có nhiều mặt hạn chế trong đó có hạn chế là có thể gây ra ô
nhiễm môi trường. Thay vào đó, dữ liệu đa phương tiện (multimedia) được sử
dụng, và phân phối phổ biến qua Internet. Có được sự chuyển biến mạnh mẽ
này là nhờ sự phát triển nhanh chóng của máy tính cá nhân (PC), hạ tầng mạng
Internet, công nghệ mạng di động băng thông rộng 3G, 4G và 5G, các thế hệ
điện thoại thông minh (iphone, smart phone), giá của các thiết bị kỹ thuật số
ngày càng rẻ, và khả năng tiếp cận và sử dụng các thiết bị số của người sử dụng
ngày càng phổ biến. Sau những năm 1980, PC có cấu hình ngày càng cao, trong
khi đó giá của PC ngày càng thấp và PC không thể thiếu trong cuộc sống hằng
ngày của mỗi gia đình và mỗi tổ chức, doanh nghiệp. Máy tính cá nhân (hay
thiết bị cầm tay) càng phát huy sức mạnh hơn khi được kết nối vào Internet,
mọi người không cần có kỹ năng đặc biệt về công nghệ thông tin cũng có thể
lướt web bằng cách sử dụng một trình duyệt web (ví dụ Internet Explorer,
Firefox, Google Chrome, Safari,...) để tìm kiếm, thu thập, và tải (download)
thông tin bằng các công cụ tìm kiếm (ví dụ: Google, Bing, Wolfram Alpha,...).
Một khả năng đặc biệt mà chỉ có công nghệ thông tin mới có đó là khả năng sao
chép nhanh, chính xác, không phân biệt được bản sao và bản gốc, không tốn chi
phí. Với đặc điểm này, ngành công nghệ thông tin có giá trị gia tăng rất lớn,
một phần mềm có thể nhân rộng với số lượng bản sao không bị giới hạn. Tuy
nhiên, các ảnh số có giá trị thương mại có bản quyền, các ảnh số có giá trị pháp
lí cũng có thể dễ dàng sao chép và chia sẻ rất nhanh không mấy khó khăn. Sự
sao chép và chia sẻ các nội dung số trong một số tình huống là rất thuận lợi,
2
nhưng trong một số tình huống khác bị xem là phi pháp, phi đạo đức. Mặt khác,
ảnh số cũng có thể dễ dàng thu thập, chỉnh sửa, và làm giả bằng các thao tác
đơn giản bởi những phần mềm xử lí ảnh. Với sự phát triển của công nghệ thông
tin và Internet, dữ liệu số, thông tin số, ảnh số,... bị sử dụng, chia sẻ, sao chép,
làm giả ngày càng nhiều. Hiện nay, các nhà cung cấp dịch vụ thông tin số
thường phân phối các sản phẩm của họ qua Internet, với tình hình vi phạm bản
quyền như hiện nay, sự tổn thất về kinh tế hằng năm là không nhỏ. Đối với các
cơ quan quản lí nhà nước, các cơ sở dữ liệu ảnh số phải đảm bảo bảo mật để
đảm bảo xác thực đúng và chống làm giả mạo. Do đó, chủ sở hữu các dữ liệu số
có nhu cầu bảo vệ dữ liệu số và ngăn chặn việc sử dụng, chia sẻ, làm giả, và
tuyên bố bản quyền trái phép đối với dữ liệu số. Do đó, hoạt động nghiên cứu
để bảo vệ bản quyền nội dung thông tin số được sự quan tâm đặc biệt của cộng
đồng nghiên cứu khoa học, trong đó ngăn chặn sự trộm cắp bản quyền và làm
giả mạo các nội dung số là mục tiêu hàng đầu. Quản lí bản quyền số (Digital
Rights Management) đã được chọn là một trong 10 công nghệ hàng đầu nổi lên
có thể làm "Thay đổi thế giới". Qua đó, cho thấy công nghệ bảo vệ bản quyền
số giữ vai trò rất quan trọng. Để giải quyết vấn đề bảo vệ bản quyền thông tin
số và bảo mật với các cơ sở dữ liệu số, mật mã (cryptography) và watermarking
số (digital watermarking) được sử dụng. Mật mã là một kỹ thuật rất lâu đời
được con người sử dụng trong chiến tranh hoặc trong một số tình huống khác.
Theo thời gian, các kỹ thuật mật mã được cải tiến về mọi mặt về tốc độ, lượng
thông tin ẩn và bảo mật. Tuy nhiên, các hệ thống mật mã truyền thống chỉ cho
phép người giữ mật mã đúng sử dụng, chia sẻ sau khi đã giải mã dữ liệu. Vì thế,
các hệ thống mật mã chỉ có khả năng bảo mật dữ liệu khi dữ liệu chưa được giải
mã, trong khi đó các nhà cung cấp nội dung thông tin số cần giải quyết triệt để
nạn sao chép trái phép. Hạn chế của giải pháp bảo vệ quyền sở hữu dữ liệu ảnh
số bằng mật mã là một khi dữ liệu số đã bị giải mã bởi người không phải là chủ
sở hữu thật sự, thì dữ liệu sẽ khó được bảo vệ và việc theo dõi việc phân phối
bất hợp pháp sẽ khó kiểm soát. Đồng thời, việc chứng minh quyền sở hữu hợp
pháp của chủ nhân thật sự của nội dung số đó là không có cơ sở. Watermarking
có thể khắc phục những hạn chế của kỹ thuật mật mã trong bảo vệ bản quyền
3
nội dung thông tin số. Kỹ thuật watermarking số nhúng thông tin bảo mật trong
dữ liệu chủ. Thông tin này vẫn còn tồn tại ở đó thậm chí cả sau khi tiến trình
giải mã được thực hiện. Trong các nội dung số, ảnh số được sử dụng phổ biến,
video cũng dựa trên sự chuyển động của các khung (frame) ảnh, hơn nữa hầu
hết các cơ sở dữ liệu dùng để xác thực con người cũng dựa trên ảnh số sinh trắc
học. Do đó, watermarking ảnh số thời gian gần đây đã trở thành một trong
những lĩnh vực được quan tâm, nghiên cứu nhiều. Thật vậy, bằng cách sử dụng
cụm từ khóa "Digital Image Watermarking" để tìm kiếm các nghiên cứu trên 2
website chính thức của IEEE và Science Direct cho thấy số lượng nghiên cứu
về lĩnh vực này không ngừng tăng lên, từ giai đoạn 1994 đến 2019, số nghiên
cứu nhiều nhất của 1 năm từ IEEE là 412 và từ Science Direct là 465.
1.2 Đặt vấn đề và hƣớng giải quyết vấn đề
Trong phần trước, luận án đã trình bày một nhu cầu rất bức thiết về bảo vệ bản
quyền nội dung thông tin số (ảnh số, âm thanh số, video số và các nội dung số
khác) và tăng cường bảo mật cho các nội dung số. Bằng việc nhúng thông tin
mật như các chuỗi giả ngẫu nhiên, logo, các ảnh nhị phân, ảnh xám, ảnh màu,
hay các ảnh sinh trắc học liên quan đến chủ sở hữu các ảnh số, kỹ thuật
watermarking số có thể bảo vệ bản quyền sở hữu nội dung số cũng như tăng
tính bảo mật cho các cơ sở dữ liệu ảnh số dùng trong quản lý con người. Không
giống như kỹ thuật giấu tin mật (steganography) thông tin mật được giấu trong
nội dung chứa thông tin mới quan trọng, trong kỹ thuật watermarking, cả thông
tin được giấu và nội dung chứa thông tin đều quan trọng và chúng có mối quan
hệ với nhau. Nên yêu cầu của kỹ thuật watermarking cũng đòi hỏi nhiều thông
số hơn và mức độ đòi hỏi cao hơn. Dựa vào việc watermark sau khi nhúng vào
ảnh chủ có thể được nhìn thấy hoặc không nhìn thấy mà kỹ thuật watermarking
được chia thành kỹ thuật watermarking hữu hình và kỹ thuật watermarking vô
hình. Kỹ thuật watermarking hữu hình được dùng để thông báo bản quyển tác
giả của ảnh chủ, để ngăn chặn, hoặc ít nhất là không khuyến khích, sử dụng trái
phép bản quyền ảnh số. Trong khi đó kỹ thuật watermarking vô hình nhúng
watermark vào ảnh chủ mà không gây ảnh hưởng đáng kể đến chất lượng của
4
ảnh chủ. Watermark được nhúng trong trường hợp này là bền vững trước các
tấn công xử lý hình ảnh. Kỹ thuật watermarking vô hình có thể được sử dụng để
bảo vệ bản quyền tác giả ảnh số. Luận án này tập trung nghiên cứu kỹ thuật
watermarking vô hình và khi trích watermark không cần ảnh gốc (watermarking
mù). Yêu cầu đối với các giải thuật watermarking phụ thuộc vào từng ứng dụng
cụ thể. Đối với các ứng dụng bảo vệ quyền sở hữu trí tuệ thì tính bền vững yêu
cầu cao trong khi vẫn đảm bảo tính vô hình (không ảnh hưởng đến giá trị
thương mại của ảnh chủ). Trong khi đó, đối với các ứng dụng xác thực tính toàn
vẹn của nội dung thông tin số thì tính không bền vững lại quan trọng. Các yêu
cầu đối với kỹ thuật watermarking [2, 4] là: tính bền vững (robustness), tính vô
hình (imperceptibility), dung lượng nhúng (capacity) và tính bảo mật (security).
Một yêu cầu khác cũng thường được quan tâm trong kỹ thuật watermarking đó
là thời gian nhúng và trích watermark. Hình 1.2 trình bày mối quan hệ giữa tính
vô hình và tính bền vững [4], qua đồ thị cho thấy khi tính bền vững tăng thì tính
vô hình giảm và ngược lại được thể hiện trong Hình 1.2 (a), nhiệm vụ của các
nhà nghiên cứu là làm thế nào để đồ thị quan hệ giữa tính bền vững và tính vô
hình tiến theo hướng mũi tên như Hình 1.2 (c), nghĩa là nâng cao tính bền vững
và tính vô hình khi so sánh với các nghiên cứu trước. Tương tự cho mối quan
hệ giữa tính vô hình và dung lượng nhúng, cũng như giữa dung lượng nhúng và
tính bền vững [4].
Mục tiêu của nghiên cứu này là phát triển các thuật toán nhúng và trích
watermark thỏa mãn yêu cầu các ứng dụng watermarking trong bảo vệ bản
quyền. Hiệu năng của các thuật toán được phát triển sẽ được đánh giá theo
nhiều thông số trên các cơ sở dữ liệu ảnh màu, ảnh xám chuẩn. Một số đặc
điểm của giải thuật đề xuất:
Các giải thuật đề xuất là mù vì ảnh chủ gốc không cần được sử dụng
trong quá trình trích watermark.
Các watermark là vô hình sau khi nhúng và việc nhúng watermark gây
ra sự méo dạng tối thiểu với ảnh chủ.
Các giải thuật phải bền vững chống lại các tấn công chủ yếu.
5
Giải quyết được bài toán bảo vệ bản quyền ảnh số.
Giảm thời gian tính toán cho các ứng dụng yêu cầu thời gian thực.
Đảm bảo tính bảo mật.
Hình 1.2: Quan hệ giữa tính bền vững và tính vô hình
1.3 Các nghiên cứu trƣớc về kỹ thuật watermarking ảnh số
Trong khi có một số kỹ thuật watermarking hữu hình (watermark có thể được
nhìn thấy) [6], thì hầu hết các kỹ thuật watermarking được quan tâm là
watermarking vô hình (watermark không thể được nhìn thấy). Có nhiều phân
lớp đối với kỹ thuật watermarking vô hình như watermarking bền vững,
watermarking nửa dễ vỡ, và watermarking dễ vỡ. Watermarking dễ vỡ được
thiết kế để bị vỡ một cách dễ dàng bởi các hoạt động xử lý ảnh. Kỹ thuật
watermarking dễ vỡ có thể được sử dụng để phát hiện sự sửa đổi ảnh gốc [7].
Dựa vào quá trình nhúng và trích watermark, kỹ thuật watermarking bền vững
lại được phân ra thành watermarking mù, watermarking nửa mù và
watermarking không mù. Dựa vào miền nhúng, kỹ thuật watermarking cũng
được phân loại thành 2 nhánh lớn: kỹ thuật watermarking trong miền không
gian và kỹ thuật watermarking trong miền tần số.
6
1.4 Những đóng góp chính
Nội dung thực hiện và đóng góp chính của luận án có thể tóm tắt như sau:
Đề xuất thuật toán watermarking ảnh số mù, bền vững trong miền
DCT-DWT kết hợp.
Đề xuất thuật toán watermarking ảnh số trong miền curvelets đảm
bảo tính bền vững và tính vô hình.
Đề xuất thuật toán watermarking ảnh số trong miền LP bền vững,
vô hình, độ phức tạp tính toán thấp.
Đề xuất thuật toán watermarking ảnh số màu trong miền curvelet,
contourlet bền vững, vô hình hiệu năng thuật toán cao.
Đề xuất thuật toán watermarking ảnh số mù, vô hình dựa trên sự
kết hợp CNN và DWT có khả năng chống lại nhiều loại tấn công
khác nhau.
Công bố 2 bài báo trên hai tạp chí quốc tế nƣớc ngoài, 1 bài báo
trên tạp chí trong nƣớc, 1 bài báo tại hội nghị quốc tế ở nƣớc ngoài,
3 bài báo tại 3 hội nghị quốc tế trong nƣớc và 1 bài báo tại hội nghị
quốc gia.
1.5 Cấu trúc Luận án
Luận án bao gồm các Chương sau:
Chương 1 Giới thiệu
Chương 2 Tổng quan về kỹ thuật watermarking ảnh số và một số đề xuất giải
thuật nghiên cứu ban đầu
Chương 3 Giải thuật watermarking ảnh số bền vững dựa trên phép biến đổi
Laplacian Pyramid
Chương 4 Kỹ thuật watermarking trong miền biến đổi định hướng curvelet
Chương 5 Kỹ thuật watermarking số hiệu quả cho ảnh màu sử dụng các phép
biến đổi contourlet
Chương 6 Giải pháp watermarking mù bền vững hiệu quả sử dụng mạng nơ-ron
tích chập và miền biến đổi wavelet
Chương 7 Kết luận và hướng phát triển.
7
CHƢƠNG 2 TỔNG QUAN VỀ KỸ THUẬT WATERMARKING ẢNH
SỐ VÀ MỘT SỐ ĐỀ XUẤT GIẢI THUẬT NGHIÊN CỨU BAN ĐẦU
2.1 Tổng quan về kỹ thuật watermarking
Kỹ thuật watermarking được trình bày rất chi tiết trong các tài liệu [5, 24],
trong phần này chúng tôi sẽ trình này các điểm chính về kỹ thuật watermarking
gồm: vài nét về kỹ thuật watermarking, lịch sử hình thành watermarking, ứng
dụng watermarking, phân loại watermarking, các tham số cơ bản đo lường hiệu
năng của thuật toán watermarking ảnh số.
2.2 Thuật toán watermarking ảnh số trong miền không gian
Kỹ thuật watermarking trong miền không gian là đơn giản và độ phức tạp tính
toán thấp, bởi vì phép biến đổi ảnh chủ không cần chuyển sang miền tần số.
Tuy nhiên, hạn chế của phương pháp này là không bền vững. Dưới các tấn công
vô ý hay cố ý, watermark có thể bị loại bỏ như nén có tổn hao JPEG, bộ lọc
thông thấp. Sau đây là một số thuật toán watermarking cơ bản trên miền không
gian: tách bit có trọng số thấp nhất (LSB), kỹ thuật mã hóa ánh xạ bố cục của
hình ảnh, thuật toán kết nối, kỹ thuật dựa vào sự tương quan. Thuật toán LSB
trong miền không gian được trình bày trong Thuật toán 1.
Thuật toán 1: watermarking LSB trong miền không gian
Giải thuật nhúng
1) Tách ảnh chủ và watermark cùng kích thước thành 8 bit plane.
2) Thay thế các bit plane có trọng số thấp của ảnh chủ bởi các bit plane có
trọng số cao của watermark.
Giải thuật trích
1) Tách ảnh đã nhúng watermark thành 8 bit plane.
2) Lấy các bit plane có trọng số thấp được thay thế trong giải thuật toán nhúng
làm bit plane có trọng số cao của watermark được phục hồi; thêm các plane
rỗng còn thiếu để tái tạo watermark.
8
2.3 Thuật toán watermarking ảnh số trong miền biến đổi
So với phương pháp watermarking trong miền không gian, phương pháp
watermarking trong miền biến đổi có ứng dụng rộng hơn. Watermark được
nhúng vào phổ của ảnh chủ, vì thế việc nhúng watermark không trực tiếp tác
động đến chất lượng ảnh. Các phép biến đổi được sử dụng phổ biến là biến đổi
cosine rời rạc (DCT), biến đổi wavelet rời rạc (DWT). Bởi vì các hệ số phổ
được trình bày gần với đặc điểm của HVS vì thế watermarking trong miền biến
đổi mang lại hiệu quả cao hơn so với watermarking trong miền không gian [35].
Thuật toán số 2 trình bày các bước watermarking trên miền DCT theo khối
[39, 40]
Thuật toán 2: watermarking ảnh số trên miền DCT theo khối
1) Chia ảnh thành các khối 8x8 không chồng lấn;
2) Áp dụng DCT trên mỗi khối;
3) Lựa chọn các khối theo một số điều kiện nào đó;
4) Lựa chọn các hệ số theo một số điều kiện nào đó;
5) Sửa đổi các hệ số lựa chọn;
6) Áp dụng DCT ngược trên mỗi block.
2.4 Đề xuất giải thuật watermarking trong miền DCT-DWT kết hợp
Nghiên cứu này khảo sát và đánh giá hiệu quả sự kết hợp giữa DCT và DWT
cho giải thuật wartermark, và từ đó đề xuất một phương pháp hiệu quả. Cụ thể,
thuật toán watermarking được đề xuất dựa vào sự kết hợp phép biến đổi DCT-
DWT, các điểm mạnh và khắc phục điểm yếu của hai phép biến đổi này. Kết
quả thực nghiệm được so sánh với kết quả thực nghiệm của bài báo tham khảo
số [46].
9
2.5 Các kết quả thực nghiệm của giải thuật watermarking trong miền
DCT-DWT kết hợp
Ảnh xám “Lena” 2.7(a) kích thước 512x512 được sử dụng để thực nghiệm. Ảnh
watermark là các bit 0 và 1 ngẫu nhiên kích thước 16x16 và khoá bí mật là một
ảnh “key.pnp” có kích thước 72x72x3. Kích thước ảnh watermark trong thực
nghiệm này là 16x16 điểm ảnh lớn hơn kích thước ảnh watermark của bài báo
[46] là 15x9 điểm ảnh. Hệ số k (k=15) của thuật toán đề xuất thấp hơn so với hệ
số k (k=32) của bài báo [46]. Hệ số k thấp thì điều kiện cảm nhận chất lượng
ảnh càng tốt nhưng khả năng bền vững giảm. Vì vậy, tùy vào yêu cầu cụ thể mà
chọn k phù hợp. Qua phương pháp thực hiện watermark trên ta thu được một
ảnh mới 2.7(b) có chất lượng hầu như không thay đổi so với ảnh gốc 2.7(a).
Các hình thức tấn công để thử nghiệm tính bền vững và tính vô hình: nhiễu
Gaussian, muối tiêu, speckle. Sau đó là thử nghiệm với các phép nén JPEG theo
từng mức khác nhau, thử nghiệm tăng giảm độ sáng, scaling, cropping. Kết quả
được thể hiện trong Bảng 2.4. Qua bảng so sánh, ta thấy PSNR của thuật toán
đề xuất PSNRp =45.2036 (dB) lớn hơn PSNR = 43.04 (dB) trong tài liệu [46].
Các tấn công xén (5%), tăng giảm độ sáng có NC bằng nhau giữa thuật toán đề
xuất và [46] nhưng hệ số PSNRp cao hơn. Hầu hết thuật toán watermark này
bền vững trước các tấn công (có NC > 0.75). Nhưng tiêu chí bền vững vẫn chưa
đạt được bằng bài báo [46] khi thể hiện ở hệ số NC thấp hơn.
2.6 Kết luận Chƣơng 2
Trong Chương 2, tổng quan về kỹ thuật watermarking; các phương pháp đo
lường tính vô hình và tính bền vững của thuật toán watermarking; khảo sát các
phương pháp watermarking trong miền không gian và miền biến đổi, đề xuất
các thuật toán watermarking trong miền không gian, miền DCT, miền DWT và
miền DCT-DWT kết hợp được trình bày. Các nội dung về tổng quan kỹ thuật
watermarking và 4 giải thuật đề xuất trong miền không gian, miền biến đổi
DCT, DW, và DCT-DWT kết hợp được trình bày trong Chương 2 đều được báo
cáo tại các hội nghị khoa học [47, 48].
10
CHƢƠNG 3 GIẢI THUẬT WATERMARKING ẢNH SỐ BỀN VỮNG
DỰA TRÊN PHÉP BIẾN ĐỔI LAPLACIAN PYRAMID
3.1 Giới thiệu
Các tác giả trong [57] đã đề xuất giải thuật Laplacian pyramid (LP) để trình bày
đa phân giải đối với các tín hiệu hình ảnh. Các lợi thế của giải thuật LP là sự
đơn giản và độ phức tạp tính toán thấp. Tuy nhiên, vẫn tồn tại một số hạn chế
như lấy mẫu không tường minh (implicit oversampling) [58]. Các tác giả trong
[58] đã đề xuất giải thuật LP cải tiến bằng cách khai thác các lợi thế của băng
lọc (filter bank). Giải pháp này đã được chứng minh là hiệu quả hơn phương
pháp truyền thống khi tái tạo tín hiệu trong điều kiện tín hiệu bị suy biến do
nhiễu. Những lợi thế của giải thuật LP cải tiến trong [58] và từ các kết quả
nghiên cứu trước [54,56], Luận án đã phát triển thuật toán watermarking mù
trong miền LP cải tiến mà ở đó phương pháp song trực giao đối xứng
(symmetric bi-orthogonal) và các phương pháp tái tạo mới được sử dụng. Để
cân bằng giữa tính bền vững và tính vô hình, Luận án khai thác tần số thấp và
các vùng tần số giữa để nhúng watermark. Luận án khảo sát nhiều mức và các
hệ số độ lợi (strength factors) để chọn các giá trị thích hợp.
3.2 Giải thuật watermarking mù đƣợc đề xuất dựa trên phép biến đổi
LP cải tiến
Để nhúng watermark vào miền biến đổi LP, ảnh chủ được phân tích thành các
ảnh đa tỷ lệ bởi phép biến đổi LP cải tiến. Bởi vì hệ thống thị giác của con
người (HVS) là rất nhạy với các hệ số tần số thấp, watermark được nhúng vào
các hệ số tần số cao sẽ gia tăng tính vô hình. Tuy nhiên, các tấn công xử lí ảnh
phổ biến thông thường tác động lên tần số cao của các tín hiệu hình ảnh. Vì thế,
tính bền vững được cải tiến nếu watermark được chèn vào các hệ số tấn số thấp.
Cần lưu ý rằng tính bền vững đóng vai trò quan trọng đối với các ứng dụng bảo
vệ bản quyền ảnh số. Sau đây là giải thuật nhúng watermark.
11
3.3 Các kết quả thực nghiệm
Thực nghiệm khảo sát độ lợi và miền nhúng watermark
Các kết quả thực nghiệm mở rộng, so sánh kết quả thực nghiệm
với các thuật toán khác
Chúng tôi đã tiến hành 3 thực nghiệm để đánh giá hiệu năng thuật toán đề xuất.
Giải thuật trong [61] đã được cải tiến trong nghiên cứu này bằng cách sử dụng
sự kết hợp giữa tần số thấp và tần số giữa để nhúng watermark (d5, d4, d3 như
được trình bày trong Hình 3.5 được sử dụng). Hơn nữa, watermark cũng có
kích thước lớn hơn watermark được sử dụng trong [61]. Ảnh chủ được chuyển
đổi vào miền tần số và được tái tạo vào miền không gian sử dụng LP cải tiến.
12
Ảnh watermark nhị phân sau khi áp dụng hàm Arnold để nâng cao tính bảo mật
được nhúng vào phần sai số dự bảo của miền biến đổi. Sau đây là một số kết
quả thực nghiệm so sánh với các nghiên cứu trước.
3.4 Kết luận Chƣơng 3
Trong nghiên cứu này, luận án đã trình bày giải thuật watermarking cải tiến dựa
trên phép biến đổi Laplacian Pyramid sử dụng các hệ số trong các băng con tần
số thấp và tần số giữa để nhúng ảnh nhị phân. Các kết quả của nghiên cứu này
đã chỉ ra rằng hiệu năng của thuật toán được đề xuất khi xét về tính vô hình và
tính bền vững là tốt hơn tính bền vững và tính vô hình khi áp dụng cùng một
thuật toán trên miền biến đổi FDCT khi bị tấn công cắt cố ý, lọc thông thấp
Gaussian và nén JPEG có tổn hao. Hơn nữa, các giải thuật được đề xuất yêu cầu
thời gian tính toán để nhúng và trích watermark ít hơn các thuật toán khác.
Phương pháp được đề xuất sử dụng biến đổi LP là watermarking mù và có tính
bảo mật cao, vì thế, watermark chỉ dò được bởi người sử dụng hợp pháp. Cơ sở
toán học của LP cải tiến, cũng như thuật toán đề xuất trong miền này, các kết
quả thực nghiệm và các nội dung có liên quan được báo cáo tại hội nghị [61] và
đăng ở tạp chí [63].
CHƢƠNG 4 KỸ THUẬT WATERMARKING TRONG MIỀN BIẾN
ĐỔI ĐỊNH HƢỚNG CURVELET
4.1 Giới thiệu
Phép biến đổi ridgelet và curvelet đã được đề xuất bởi Candès và Donoho [63,
64] để khắc phục những hạn chế của wavelets. Các phép biến đổi này có thể
13
trình bày thưa các đường thẳng, các đường biên (edge) và các đường cong
(curve) xuất hiện trong hình ảnh. Nhờ khả năng phân tích đặc điểm hình học đa
tỷ lệ mà curvelets và ridgelets có rất nhiều thành công trên các ứng dụng xử lý
ảnh như watermarking [54, 56, 68-70], khử nhiễu [18] và nhiều ứng dụng khác.
Biến đổi curvelet được phát triển để trình bày ảnh số ở các tỷ lệ khác nhau và ở
các góc khác nhau. Trong xử lí tín hiệu hình ảnh, hầu hết các đường biên (edge)
của hình ảnh thuộc về các đường cong hơn là các đường thẳng. Ridgelets không
thể trình bày hiệu quả để phân tích các hình ảnh này. Tuy nhiên, ridgelets có thể
được sử dụng để phân tích cục bộ. Ở các tỷ lệ tinh (fine scale) các đường biên
cong (curved edge) gần như đường thẳng. Do đó, phép biến đổi curvelet cung
cấp phương pháp phân tích hình ảnh với các khối kích thước khác nhau và các
hướng khác nhau.
4.2 Ridgelets
Phép biến đổi Ridgelet 2D được trình bày chi tiết trong [64, 65]. Những nội
dung cơ bản của phép biến đổi Ridgelet 2D được trình bày trong mục này.
4.3 Curvelets
Ridgelets không thể trình bày hiệu quả lớp hình ảnh có nhiều đường cong hơn
đường thẳng. Vì thế phép biến đổi curvelet thế hệ thứ nhất đã được đề xuất để
khắc phục hạn chế của ridgelets. Tuy nhiên, ưu điểm của ridgelets được khai
thác ở khía cạnh cục bộ nghĩa là ở tỷ lệ tinh (fine scale) các đường cong có thể
xem gần như đường thẳng. Ý tưởng của phép biến đổi curvelet thế hệ thứ nhất
được trình bày chi tiết trong [66].
Trong những năm gần đây, curvelets đã được thiết kế lại với kiến trúc toán học
mới, đơn giản hơn và dễ thực hiện hơn. Đó là phép biến đổi curvelet rời rạc
nhanh được đề xuất bởi Candès and Donoho [73]. Các tác giả đã đề xuất 2 giải
pháp là USFFT (Unequally Spaced Fast Fourier Transform) và Frequency
Wrapping. Kỹ thuật biến đổi curvelet dựa vào Wrapping được chứng minh là
dễ hiểu, tính toán nhanh và ít dư thừa dữ liệu hơn các giải pháp trước. Vì thế,
nó thường được sử dụng hơn trong nghiên cứu có sử dụng biến đổi curvelet [69,
14
70, 74]. Ý tưởng chính của phép biến đổi curvelet là tính toán tích trong giữa
tín hiệu và hàm curvelet để trình bày thưa các tín hiệu [66, 72, 75].
15
16
4.4 Cải tiến giải thuật watermarking bằng cách lựa chọn các tỷ lệ
curvelet
4.5 Kết quả thực nghiệm watermarking trong miền curvelets
So sánh hiệu năng của thuật toán đề xuất trong miền curvelet và thuật toán
trong miền kết hợp DCT-DWT được trình bày trong Hình 4.9. Kết quả thực
nghiệm chỉ ra rằng PSNR khi áp dụng thuật toán trên miền curvelet tốt hơn khi
áp dụng thuật toán trên miền DCT-DWT kết hợp nhưng không đáng kể. Nhưng
tính bền vững của watermarking trong miền curvelet tốt hơn khi áp dụng thuật
toán này trong miền kết hợp DCT-DWT nhờ khả năng trình bày thưa tín hiệu
của FDCT đặc biệt khi bị tấn nén nén JPEG có tổn hao, chi tiết trong Bảng 4.3.
4.6 Kết luận Chƣơng 4
Trong chương này, một giải thuật watermarking mù, bền vững trong miền
curvelet được đề xuất. Chúng tôi đã nhúng ảnh nhi phân vào các hệ số curvelet
trong các khối của các tỷ lệ chọn lọc. Bằng cách chọn các tỷ lệ thích hợp, kết
quả thực nghiệm của Chương này đã chỉ ra rằng nhúng watermark trong miền
curvelet đảm bảo tính bền vững và tính vô hình. Kết quả thực nghiệm chứng tỏ
rằng nhúng watermark trong miền curvelet là bền vững hơn miền kết hợp DCT-
DWT dưới các tấn công nén có tổn hao JPEG, nhiễu speckle và nhiễu Gaussian.
Cơ sở toán học của phép biến đổi curvelet, cũng như thuật toán đề xuất trong
miền này, các kết quả thực nghiệm và các nội dung có liên quan được trình bày
trong chương này đều được báo cáo tại Hội nghị khoa học [56].
CHƢƠNG 5 KỸ THUẬT WATERMARKING SỐ HIỆU QUẢ CHO
ẢNH MÀU SỬ DỤNG CÁC PHÉP BIẾN ĐỔI CONTOURLET
5.1 Giới thiệu
5.2 Đề xuất giải thuật watermarking trong miền contourlet
Sự trình bày hiệu quả các thông tin thị giác (visual information) đóng vai trò
quan trọng trong các ứng dụng xử lí ảnh như watermarking, phục hồi
(reconstruction), khử nhiễu, nén, và trích đặc trưng [70]. Mặc dù các biến đổi
17
wavelet là công cụ rất quan trọng của nhiều ứng dụng xử lí ảnh, nhưng chúng
không trình bày tốt các đối tượng với các yếu tố bất đẳng hướng cao chẳng hạn
như các đường hay các cấu trúc cong [64]. Các biến đổi định hướng có thể khắc
phục hạn chế này của biến đổi wavelet. Vì thế, chúng tôi đề xuất các giải thuật
watermaking bền vững và mù dựa trên các biến đổi curvelet và biến đổi
contourlet.
18
5.3 Các kết quả thực nghiệm
Các kết quả thực nghiệm được thực hiện để đánh giá tính vô hình khi
watermark được ẩn vào ảnh chủ, thời gian tính toán để nhúng và trích
watermark, cũng như tính bền vững của thuật toán được đề xuất chống lại các
cuộc tấn công.
19
Có 4 thực nghiệm được tiến hành trong Chương này. Sau đây là một số kết quả
thực nghiệm tiêu biểu.
5.4 Kết luận Chƣơng 5
Trong nội dung này, chúng tôi đã khảo sát các giải thuật watermarking được
dựa trên các phép biến đổi định hướng trong miền curvelet và miền contourlet.
Chúng tôi đã đề xuất các thuật toán nhúng và trích watermark sử dụng các phép
biến đổi định hướng để cải tiến hiệu năng watermarking về PSNR, SSIM và
NC. Chúng tôi đã thực hiện mở rộng các thực nghiệm của các giải thuật
watermarking được đề xuất trên cơ sở dữ liệu ảnh chuẩn. Các kết quả thực
20
nghiệm đã chỉ ra rằng watermarking trong miền biến đổi định hướng mang lại
hiệu năng cao hơn các giải thuật khác chẳng hạn các miền biến đổi wavelet rời
rạc. Cơ sở toán học của contourlets, cũng như thuật toán đề xuất trong miền
này, các kết quả thực nghiệm và các nội dung có liên quan được trình bày trong
Chương này đã được báo cáo tại hội nghị [59] và đăng ở tạp chí [104].
CHƢƠNG 6 GIẢI PHÁP WATERMARKING MÙ BỀN VỮNG HIỆU
QUẢ SỬ DỤNG MẠNG NƠ-RON TÍCH CHẬP VÀ MIỀN BIẾN ĐỔI
WAVELET
6.1 Giới thiệu
Lấy động lực từ những nghiên cứu trước, trong chương này, chúng tôi phát
triển một giải thuật watermarking mù bằng cách sử dụng CNN trong miền biến
đổi wavelet. Trong thuật toán này, chúng tôi phân tích ảnh chủ thành các băng
con bằng cách sử dụng DWT. Sau đó,các băng con ở tần số thấp được chọn để
sử dụng như là ngõ vào của CNN trong khi đó các băng con ở tần số cao, các
băng con tần số giữa được sử dụng như là ngõ ra được mong đợi. Chúng tôi
thực hiện huấn luyện cho CNN bằng cách sử dụng tập hợp các ảnh số trong cơ
sở dữ liệu chuẩn. CNN được huấn luyện được sử dụng cho cả quá trình nhúng
và trích các watermark. Khác với phương pháp trong [113] sử dụng phân tích
DWT 2 mức, và sử dụng BP NN để nhúng và trích watermark, giải thuật đề
xuất sử dụng phân tích DWT 4 mức và áp dụng CNN để nhúng và trích
watermark. Để đánh giá hiệu năng của thuật toán đề xuất, chúng tôi tiến hành
nhiều thực nghiệm trên nhiều ảnh số và nhiều tấn công khác nhau cả biến đổi
hình học và phi hình học. Các kết quả định lượng chứng tỏ giải thuật của chúng
tôi mang lại hiệu năng tốt hơn xét về tính bền vững và tính vô hình khi được so
sánh với các phương pháp trước đây.
Đóng góp chính của chương này có thể được tóm lược như sau:
Giới thiệu giải thuật watermarking mới bằng cách lựa chọn các băng con
thích hợp trong miền DWT cho dữ liệu đầu vào và đầu ra đích để huấn
21
luyện CNN. Sau đó, CNN đã huấn luyện được sử dụng để nhúng và trích
các watermark.
Tiến hành các thí nghiệm mở rộng để chứng minh tính ưu việt của giải
thuật đề xuất so với các phương pháp hiện có điển hình khác về tính vô
hình và tính bền vững dưới các tấn công khác nhau.
6.2 Giải thuật watermarking đề xuất
6.3 Đánh giá hiệu quả của giải thuật đề xuất nhúng sử dụng CNN và
DWT
Các thực nghiệm dùng để đánh giá hiệu quả của giải thuật đề xuất nhúng, trích
watermark sử dụng CNN và DWT. Tính vô hình của watermark khi được
nhúng vào ảnh chủ cũng như tính bền vững của thuật toán được đề xuất để
chống lại các tấn công được kiểm tra bằng các thực nghiệm này. Hơn nữa, hiệu
năng của thuật toán chúng tôi đề xuất được so sánh với hiệu năng thuật toán
được đề xuất trong [113] và [30]. Cả hai thực nghiệm được tiến hành trên các
ảnh chủ với kích thước 512x512 điểm ảnh, 8 bit/điểm ảnh và watermark nhị
phân với kích thước 32x32 điểm ảnh. Những hình ảnh trong các thí nghiệm
được lấy từ cơ sở dữ liệu ảnh chuẩn tại địa chỉ http://sipi.usc.edu/database của
Đại học Nam California (University of Southern California). Cấu trúc ban đầu
giống nhau của CNN được sử dụng trong cả hai thực nghiệm sau bao gồm lớp
đầu vào với 64 nút; lớp tích chập với kích thước bản đồ đặc điểm 15, kích
thước của kernels 3x3 và hàm kích hoạt ’tanh’; lớp tổng hợp (pooling) trung
bình với nhân tố lấy mẫu thay thế (with sub sampling factor) là 3, lớp kết nối
đầy đủ với 150 nút với hàm kích hoạt ’tanh’; một lớp kết nối đầy đủ với 1 nút,
hàm kích hoạt ’sigmoid’. Các khối 8x8 điểm ảnh của hình ảnh trong miền biến
đổi được sử dụng để huấn luyện CNN. CNN đã qua huấn luyện được sử dụng
để nhúng và trích watermark. Tất cả các thực nghiệm được tiến hành trê
MATLAB R2013a trên nhân (Core) Intel i5-2450M CPU @ 2.50GHz máy
tính cá nhân với 4 GB (RAM).
22
23
6.4 Kết luận Chƣơng 6
Trong nghiên cứu này, chúng tôi đã đề xuất các giải thuật watermarking mới
dựa trên sự kết hợp của 2 công cụ xử lý tín hiệu mạnh: CNN và DWT. DWT đã
được sử dụng để phân tích các ảnh chủ thành các băng con khác nhau. Sau đó,
các điểm ảnh trong các băng con tần số thấp và tần số cao được chọn đã được
sử dụng như dữ liệu ngõ vào và ngõ ra mong đợi để huấn luyện CNN. Tiến
24
trình nhúng và trích watermark được thực hiện bởi CNN đã qua huấn luyện.
Các kết quả thí nghiệm sâu, rộng đã được thực hiện để đo lường tính vô hình và
tính bền vững của thuật toán watermarking đề xuất. Bằng các kết quả lượng
hóa, phương pháp chúng tôi đề xuất đã chứng minh có hiệu năng tốt hơn về mặt
PSNR, NC và SSIM so với các phương pháp khác. Cơ sở toán học của phương
pháp học sâu CNN, cũng như thuật toán đề xuất trong miền này và miền
wavelet, các kết quả thực nghiệm và các nội dung có liên quan được trình bày
trong Chương đã công bố ở tạp chí quốc tế [120].
CHƢƠNG 7 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN
7.1. Kết luận
Như đã trình bày trong phần giới thiệu, đối với bài toán watermarking ảnh số để
bảo vệ bản quyền tác giả thì 2 đặc tính quan trọng là tính vô hình và tính bền
vững, hai đặc tính này đã được chứng minh là có sự đánh đổi qua lại. Thách
thức được đặt ra là làm thế nào để nâng cao tính bền vững mà tính vô hình vẫn
được đảm bảo. Để giải quyết vấn đề này, Luận án đã lần lượt khảo sát và đề
xuất các thuật toán để nâng cao hiệu năng watermarking, các nghiên cứu đã
được phản biện độc lập và được đăng trong các kỷ yếu hội thảo khoa học và các
tạp chí khoa học.
Những đóng góp chính của Luận án được tóm lược như sau:
Tổng quan về kỹ thuật watermarking ảnh số và một số thuật toán đề xuất
trong miền không gian, miền biến đổi DCT, DWT và DCT, DWT kết hợp
25
Nghiên cứu đã hệ thống các nội dung tổng quan về kỹ thuật watermarking; các
phương pháp đo lường tính vô hình và tính bền vững của thuật toán
watermarking. Luận án cũng khảo sát những điểm mạnh, điểm yếu của các kỹ
thuật watermarking ảnh số trong miền không gian, miền biến đổi để đề xuất
vùng nhúng và giải thuật nhúng phù hợp đảm bảo hiệu năng thuật toán. Đối với
miền không gian, Luận án mô phỏng giải thuật LSB, sử dụng 4 bit plane có
trọng số thấp để nhúng watermark. Mặc dù kết quả thực nghiệm tính bền vững
chưa được đảm bảo, nhưng qua đó đóng góp vào kết luận chung là kỹ thuật
watermarking trong miền không gian tính bền vững không được bảo đảm.
Đối với phương pháp watermarking ảnh số trong miền biến đổi DCT, DWT, kết
quả mô phỏng đã chứng minh ưu điểm của phương pháp watermarking trong
các khối 8x8 không chồng lấn khi bị tấn công nén JPEG có tổn hao. Cũng qua
kết quả thực nghiệm chứng tỏ miền DWT có hiệu năng watermarking ảnh số
cao. Trên cơ sở ưu điểm và hạn chế của DCT, DWT một giải thuật mới
watermarking ảnh số được đề xuất trong miền DCT-DWT kết hợp, hiệu năng
của đề xuất này là tốt hơn so với phương pháp watermarking trên một miền
biến đổi. Phương pháp này cân bằng giữa tính vô hình và tính bền vững. Do đó,
các ứng dụng yêu cầu tính bền vững nhưng vẫn đảm bảo tính vô hình như bảo
vệ quyền tác giả ảnh số, xác nhận chủ sở hữu ảnh số là phù hợp với phương
pháp này.
Đề xuất giải thuật watermarking ảnh số mới bền vững dựa trên phép biến
đổi Laplacian pyramid
Thuật toán này đã phát hiện việc nhúng watermark vào các hệ số trong các băng
con tần số thấp và tần số giữa trong miền LP đảm bảo tính bền vững và tính vô
hình. Kết quả thực nghiệm của thuật toán đề xuất đã chứng tỏ rằng hiệu năng
của nó khi xét về tính vô hình và tính bền vững là tốt hơn tính bền vững và tính
vô hình khi áp dụng cùng một thuật toán trên miền biến đổi định hướng FDCT
khi bị tấn công cắt cố ý, lọc thông thấp Gaussian và nén JPEG có tổn hao. Một
phát hiện thú vị nữa là thời gian tính toán để nhúng và trích watermark ít hơn so
26
với các thuật toán khác. Các ảnh có nhiều thông tin chi tiết khi áp dụng phương
pháp nhúng watermark này có tính vô hình cao hơn các ảnh có ít thông tin chi
tiết hơn. Các ứng dụng khuyến nghị áp dụng cho phương pháp này là dò giao
dịch ảnh số, bảo vệ quyền tác giả ảnh số.
Đề xuất kỹ thuật watermarking ảnh số trong miền biến đổi định hƣớng
curvelet
Luận án cũng đã đề xuất một giải thuật watermarking mù, bền vững trong miền
curvelet. Ảnh nhị phân được nhúng vào các hệ số curvelet trong các khối của
các tỷ lệ chọn lọc. Đóng góp của Luận án là đã chọn lọc các tỷ lệ thích hợp để
nhúng watermark trong miền curvelet đảm bảo được tính bền vững và tính vô
hình. Kết quả thực nghiệm chứng tỏ rằng nhúng watermark trong miền curvelet
là bền vững hơn miền kết hợp DCT-DWT dưới các tấn công nén có tổn hao
JPEG, nhiễu speckle và nhiễu Gaussian. Phương pháp này có thể ứng dụng
chèn định danh của ảnh để phục vụ công tác quản lý trong các kho dữ liệu ảnh
lớn, xác nhận chủ sở hữu ảnh số.
Đề xuất kỹ thuật watermarking ảnh số hiệu quả cho ảnh màu sử dụng các
phép biến đổi contourlet
Hai kỹ thuật watermarking được dựa trên các phép biến đổi định hướng trong
miền curvelet và miền contourlet được khảo sát, đề xuất giải thuật và tiến hành
thực nghiệm. Cơ sở dữ liệu ảnh chuẩn được khai thác, sử dụng trong các thực
nghiệm. Các kết quả thực nghiệm đã chứng tỏ rằng watermarking trong miền
biến đổi định hướng mang lại hiệu năng cao hơn các giải thuật khác chẳng hạn
các miền biến đổi wavelet rời rạc. Kết quả thực nghiệm của giải thuật đề xuất
cũng chỉ ra rằng tính bền vững của các ảnh có nhiều thông tin hướng tính sẽ tốt
hơn các ảnh có ít thông tin hướng tính hơn. Phương pháp này tốt nhất cho loại
ảnh có nhiều thông tin hướng tính. Khuyến nghị áp dụng phương pháp này
trong bảo vệ quyền tác giả ảnh số, xác nhận chủ sở hữu ảnh số, chèn định danh
của ảnh số để phục vụ công tác quản lý ảnh số.
27
Giải pháp watermarking mù bền vững hiệu quả dựa vào CNN và miền
biến đổi DWT
Các giải thuật watermarking mới dựa trên sự kết hợp của CNN và DWT đã
được đề xuất. Đây là một hướng nghiên cứu mới. Việc ứng dụng kỹ thuật học
sâu vào watermarking là cơ sở quan trọng để có những nghiên cứu sâu hơn góp
phần nâng cao hiệu năng thuật toán watermarking ảnh số. Các điểm ảnh trong
các băng con tần số thấp và tần số cao (hoặc tần số giữa) được chọn để huấn
luyện CNN. CNN đã qua huấn luyện được sử dụng để nhúng và trích
watermark. Tính vô hình và tính bền vững của thuật toán đề xuất được chứng
minh là bền vững qua các kết quả thực nghiệm. Phương pháp này được chứng
minh là đảm bảo tính bền vững khi bị tấn công vô ý, tấn công cố ý, tấn công
hình học và cả tấn công phi hình học. Các ứng dụng khuyến nghị cho phương
pháp này là bảo vệ quyền tác giả ảnh số, xác nhận chủ sở hữu ảnh số, chèn định
danh của ảnh để phục vụ công tác quản lý trong các cơ sở dữ liệu ảnh lớn.
Kết luận chung
Luận án đã đề xuất 5 thuật toán watermarking ảnh số mù, bền vững và vô hình.
Hiệu năng của các giải thuật đề xuất này hiệu quả xét về tính vô hình và tính
bền vững. Điều đó chứng tỏ rằng miền phân tích đa phân giải, đặc biệt là miền
phân tích đa phân giải hướng tính có nhiều tiềm năng để phát triển các giải
thuật watermarking ảnh số. Các kết quả nghiên cứu của Luận án là những cơ sở
quan trọng để triển khai ứng dụng thực tiễn. Vì đây là các giải pháp
watermarking mù, vô hình và bền vững nên có thể áp dụng vào các lĩnh vực
như bảo vệ quyền tác giả, xác nhận chủ sở hữu, giám sát truyền tín hiệu video
số.
7.2. Hƣớng phát triển
Luận án này đã đề xuất các giải thuật watermarking trong miền DCT-DWT kết
hợp, miền LP cải tiến, các miền biến đổi định hướng curvelet, contourlet. Bên
cạnh đó, Luận án cũng đề xuất giải thuật watermarking mù bền vững sử dụng
CNN và wavelets. Mặt khác, các giải thuật này đều được thực hiện mô phỏng
28
và đánh giá bằng phần mềm MATLAB. Các kết quả mô phỏng cho phép nhanh
chóng đánh giá hiệu quả cần thiết của giải thuật watermarking như tính bền
vững, tính vô hình. Trong thực tế, các giải thuật watermarking có thể thực hiện
bằng phần mềm trên máy tính, trên các kit sử dụng số tín hiệu hoặc trên các cấu
trúc phần cứng như FPGA. Do đó, việc nghiên cứu giải thuật watermarking
cho ảnh số thực hiện hiệu quả trên các kit xử lý số tín hiệu hoặc FPGA là một
hướng nghiên cứu có thể phát triển trong giai đoạn tiếp theo.
Trong giai đoạn hiện nay, xu hướng nghiên cứu về trí tuệ nhân tạo, mà đặc biệt
là phương pháp học sâu ngày càng giữ vai trò quan trọng các ứng dụng xử lý
ảnh số. Tiếp tục nghiên cứu sâu hơn và đề xuất các giải thuật watermarking
dựa trên học máy, học sâu là một hướng mở có khả năng mang lại các kết quả
nghiên cứu quan trọng góp phần thúc đẩy ứng dụng watermarking ảnh số.