國立中山大學資訊工程學系碩士論文image.cse.nsysu.edu.tw/2006student/%B5x/%A8%CF%A5... · (國科會科學技術資料中心版本93.2.6) 本授權書所授權之論文為本人在

誌謝

國立中山大學資訊工程學系

碩士論文

使用易碎式及強健式浮水印之視訊錯誤偵測和隱匿方法

Video Error Detection And Concealment Using Fragile And

Robust Watermarks

研究生：黃硯輝撰

指導教授：蔣依吾

中華民國 95 年 7 月

博碩士論文授權書

(國科會科學技術資料中心版本93.2.6)

本授權書所授權之論文為本人在國立中山大學大學(學院) 資訊工程系所

＿＿＿＿＿＿組 95 學年度第 2 學期取得碩士學位之論文。

論文名稱：使用易碎式及強健式浮水印之視訊錯誤偵測和隱匿方法

□同意不同意

本人具有著作財產權之論文全文資料，授予行政院國家科學委員會科學技術

資料中心(或其改制後之機構) 、國家圖書館及本人畢業學校圖書館，得不

限地域、時間與次數以微縮、光碟或數位化等各種方式重製後散布發行或上

載網路。

本論文為本人向經濟部智慧財產局申請專利(未申請者本條款請不予理會)

的附件之一，申請文號為：＿＿＿＿＿＿，註明文號者請將全文資料延後

半年再公開。

--------------------------------------------------------------------------

同意 □不同意

本人具有著作財產權之論文全文資料，授予教育部指定送繳之圖書館及本

人畢業學校圖書館，為學術研究之目的以各種方法重製，或為上述目的再

授權他人以各種方法重製，不限地域與時間，惟每人以一份為限。

上述授權內容均無須訂立讓與及授權契約書。依本授權之發行權為非專屬性發行

權利。依本授權所為之收錄、重製、發行及學術研發利用均為無償。上述同意與不同

意之欄位若未鉤選，本人同意視同授權。

指導教授姓名: 蔣依吾博士

研究生簽名: 學號: M933040060

(親筆正楷) (務必填寫)

日期:民國 95 年 6 月 27 日

- 3 -

學年度 : 95

學期 : 2

校院 : 國立中山大學

系所 : 資訊工程研究所

論文名稱（中） : 使用易碎式及強健式浮水印之視錯誤偵測和隱匿方法

論文名稱（英） : Video Error Detection And Concealment Using Fragile And Robust Watermarks

學位類別 : 碩士

語文別 : 中文

學號 : M933040060

提要開放使用 : 是

頁數 : 115

研究生（中）姓 : 黃

研究生（中）名 : 硯輝

研究生（英）姓 : Huang

研究生（英）名 : Yan-Huei

指導教授（中）姓名 : 蔣依吾

指導教授（英）姓名 : John-Y Chiang

關鍵字（中） : 錯誤偵測與隱匿

關鍵字（中） : 數位浮水印

關鍵字（英） : Robust watermarking

關鍵字（英） : Fragile watermarking

關鍵字（英） : Error detection and concealment

- 4 -

摘要

随著視訊傳輸在網路上的應用越見頻繁，除了傳統在壓縮視訊上的研究，使

得所需傳輸條件降低以及視訊品質增進之外，現今的要求也在於視訊必需具備某

種程度的錯誤控制功能。在信任度不足的網路傳送視訊，如無線網路等，常會因

為某些不安定的狀況使得視訊受到傷害，進而在接收端不能正確的解碼視訊，這

對於現在發展的視訊通訊是一個極待完美解決的問題。

鑑於上述理由，因此本論文提出了一個基於數位浮水印技術的視訊錯誤偵測

與隱匿系統。研究方法藉由在編碼端利用浮水印頻道傳送相關資訊，加入使用易

碎式浮水印技術嵌入錯誤偵測資訊與強健式浮水印嵌入錯誤隱匿資訊步驟，視訊

編碼完成後經過網路媒介傳送，在解碼端擷取出隱藏其中的資訊，根據錯誤偵測

檢查視訊有無經過破壞，以及定位錯誤位置，再利用錯誤隱匿資訊隱匿錯誤，達

到即時性的視訊錯誤偵測與隱匿系統。

- 5 -

目錄

摘要................................................................................................................................4

目錄................................................................................................................................5

圖目錄............................................................................................................................8

表目錄..........................................................................................................................12

第 1 章. 簡介............................................................................................................1

1.1. 動機............................................................................................................1

1.2. 視訊簡介....................................................................................................2

1.2.1. 視訊壓縮標準................................................................................2

1.2.2. 視訊錯誤簡介................................................................................8

1.3. 視訊壓縮標準採用的錯誤偵測與隱匿方法..........................................10

1.3.1. 再同步標記 (Resynchronization Marker) ..................................11

1.3.2. 標頭延伸碼 (Header Extension Codes) .....................................11

1.3.3. 資料分割 (Data Partitioning) .....................................................11

1.3.4. 可逆式可變長度編碼 (Reversible Variable Length Coding) ....12

1.4. 相關的錯誤偵測與隱匿方法..................................................................12

1.4.1. 錯誤偵測......................................................................................12

1.4.2. 錯誤隱匿......................................................................................14

- 6 -

第 2 章. 理論基礎..................................................................................................19

2.1. 數位浮水印簡介......................................................................................19

2.2. 浮水印分類與相關研究..........................................................................23

2.2.1. 可見式浮水印 (visible watermarking) .......................................23

2.2.2. 不可見式浮水印 (invisible watermarking)................................25

2.2.3. 易碎式浮水印 (fragile watermarking) .......................................25

2.2.4. 強健式浮水印 (robust watermarking)........................................26

2.2.5. 空間域浮水印 (spatial domain watermarking) ..........................26

2.2.6. 頻率域浮水印 (frequency domain watermarking).....................28

2.2.7. 視訊浮水印 (video watermarking).............................................43

2.3. 相關浮水印錯誤偵測與隱匿方法..........................................................50

2.3.1. 錯誤偵測......................................................................................51

2.3.2. 錯誤隱匿......................................................................................54

2.3.3. 錯誤偵測與隱匿..........................................................................58

第 3 章. 研究方法與步驟......................................................................................61

3.1. 浮水印嵌入方法......................................................................................61

3.1.1. 嵌入步驟的選擇..........................................................................61

3.1.2. 浮水印嵌入技術..........................................................................61

3.2. 浮水印擷取方法......................................................................................63

- 7 -

3.2.1. 浮水印擷取技術..........................................................................63

3.3. 浮水印實現步驟......................................................................................64

3.3.1. 編碼端..........................................................................................64

3.3.2. 解碼端..........................................................................................74

第 4 章. 實驗結果與討論......................................................................................80

4.1. 效能評估指標..........................................................................................80

4.2. 實作平台..................................................................................................81

4.3. 測試影像序列..........................................................................................82

4.4. 錯誤模擬..................................................................................................82

4.5. 實驗結果..................................................................................................85

4.5.1. 嵌入浮水印後之 PSNR...............................................................85

4.5.2. 浮水印之 bit load ........................................................................87

4.5.3. 視訊錯誤偵測與隱匿..................................................................88

4.5.4. 依網路狀況實現錯誤偵測與隱匿..............................................92

第 5 章. 結論和未來方向......................................................................................95

5.1. 結論..........................................................................................................95

5.2. 未來方向..................................................................................................95

參考文獻......................................................................................................................97

- 8 -

圖目錄

圖 1-1 視訊流位元錯誤示意圖............................................................................9

圖 1-2 受破壞之影像..........................................................................................10

圖 1-3 錯誤延續範例 (a) intra-frame (b) 參考(a)之 inter-frame ..................10

圖 1-4 MPEG-4 Data Partitioning model............................................................12

圖 1-5 錯誤的定位錯誤示意圖..........................................................................14

圖 1-6 階層式編碼..............................................................................................15

圖 1-7 內插法模型一..........................................................................................17

圖 1-8 內插法模型二..........................................................................................17

圖 1-9 錯誤巨區塊標記選擇性編碼..................................................................18

圖 2-1 MPEG frame organization .......................................................................20

圖 2-2 強建度與透明度 trade-off 示意圖..........................................................23

圖 2-3 可見式浮水印 (a)浮水印 (b)為加入浮水印之 Lena 圖 ......................24

圖 2-4 網路商品的可見式浮水印......................................................................24

圖 2-5 置換最低位元法示意圖，將浮水印位元取代係數最低位元。..........27

圖 2-6 頻率域浮水印嵌入示意圖......................................................................29

圖 2-7 區塊分割示意圖......................................................................................31

圖 2-8 Cox 係數選取示意圖 ..............................................................................31

- 9 -

圖 2-9 左圖為 Cox 之嵌入流程，右圖為 Cox 之擷取流程 ............................32

圖 2-10 DCT 中頻係數.........................................................................................33

圖 2-11 水平分割 (a)ABCD 代表四相連像素值 ...............................................36

圖 2-12 垂直分割 (a)其中 ABCD 代表相鄰四像素值 ......................................36

圖 2-13 左圖為第一階離散小波轉換，右圖為第二階離散小波轉換..............37

圖 2-14 DWT 中高頻係數修改法示意圖 ...........................................................38

圖 2-15 Ying 3D 離散小波浮水印嵌入流程 .......................................................39

圖 2-16 Sun ICA 浮水印嵌入流程 ......................................................................40

圖 2-17 分佈於同空間域區域之各階層係數關係圖..........................................42

圖 2-18 (a)一個群中組成之係數的排列順序 (b)super tree...............................42

圖 2-19 super tree 係數之二元表示圖。 p2 表示其最重要位元平面 (MSB，Most

Significant Bit-plane)， 02 則為最不重要位元平面 (LSB，Least Significant

Bit-plane)，量化的過程中小於 nq 之位元階棄之，更改為零。.....................43

圖 2-20 移動向量精確度嵌入選擇......................................................................46

圖 2-21 浮水印嵌入位元值與精確度對應表......................................................46

圖 2-22 lc-VLC 叢集 ............................................................................................47

圖 2-23 Langelaar VLC 嵌入法示意圖................................................................48

圖 2-24 未使用之 VLC 對....................................................................................49

圖 2-25 篩選未使用之 VLC 對............................................................................49

- 10 -

圖 2-26 VLC 對修改示意圖.................................................................................50

圖 2-27 位元錯誤導致視訊解碼錯誤示意圖......................................................53

圖 2-28 Parity Code 產生示意圖..........................................................................55

圖 2-29 I 圖框巨區塊浮水印嵌入位置 ...............................................................57

圖 2-30 P 圖框巨區塊浮水印嵌入位置 ..............................................................57

圖 3-1 編碼端浮水印嵌入步驟..........................................................................65

圖 3-2 列印點密度不同模擬不同灰階 (a)Continuous tone (b)Halftone .........67

圖 3-3 Floyd-Steinberg error diffusion (a)原始灰階影像 (b) Floyd-Steinberg

error diffusion 作用後之黑白影像 .....................................................................68

圖 3-4 搖攝技術使用。左上為灰階原圖，右上為搖攝過後之黑白影像，下圖

為反半調技術還原之灰階圖。..........................................................................69

圖 3-5 Intra-frame 強健式浮水印產生及嵌入流程 ..........................................70

圖 3-6 4：2：0 之 YUV 格式區塊排列示意圖 ................................................71

圖 3-7 inter-frame 強健式浮水印移動向量嵌入位置示意圖...........................72

圖 3-8 解碼端浮水印擷取步驟..........................................................................75

圖 3-9 inter-frame 強健式浮水印擷取流程.......................................................77

圖 3-10 錯誤偵測與隱匿流程..............................................................................78

圖 4-1 Gilbert-Elliot 網路模型 ...........................................................................83

圖 4-2 I 圖框之 PSNR。左圖為未加浮水印之視訊，PSNR：30.82；右圖為嵌

- 11 -

入浮水印之視訊，PSNR：29.51.......................................................................86

圖 4-3 P 圖框之 PSNR。左圖為未加浮水印之視訊，PSNR：30.33；右圖為

嵌入浮水印之視訊，PSNR：27.96...................................................................86

圖 4-4 B 圖框之 PSNR。左圖為未加浮水印之視訊，PSNR：29.53；右圖為

嵌入浮水印之視訊，PSNR：25.98...................................................................86

圖 4-5 浮水印嵌入資料量曲線圖。藍線為易碎式浮水印嵌入資料量，綠線為

強健式浮水印嵌入資料量，紅線則為總嵌入資料量。..................................87

圖 4-6 PSNR 曲線圖。紅線與綠線分別為未加入及加入浮水印之視訊。...88

圖 4-7 PSNR 曲線圖。紅線為未加浮水印、未受破壞之視訊；綠線為加入浮

水印、未受破壞之視訊；黃線為未加浮水印，受破壞之視訊；藍線為加入浮

水印，受破壞及實現錯誤偵測與隱匿之視訊。..............................................90

圖 4-8 I 圖框之 PSNR。左圖為未修復之視訊，PSNR：17.51；右圖為已修復

之視訊，PSNR：24.79.......................................................................................91

圖 4-9 P 圖框之 PSNR。左圖為未修復之視訊，PSNR：13.31；右圖為已修

復之視訊，PSNR：20.39...................................................................................91

圖 4-10 B 圖框之 PSNR。左圖為未修復之視訊，PSNR：16.51；右圖為已修

復之視訊，PSNR：21.99...................................................................................91

圖 4-11 PSNR.曲線圖。依網路狀況調整浮水印嵌入量...................................93

- 12 -

表目錄

表 4-1 編碼參數設定..........................................................................................82

表 4-2 Gilbert-Elliot 頻道參數設定 ...................................................................83

表 4-3 PSNR。未嵌入浮水印之視訊與嵌入浮水印之視訊............................85

表 4-4 PSNR。受破壞之視訊與錯誤隱匿後之視訊........................................89

表 4-5 PNSR。依網路狀況調整浮水印嵌入量................................................94

- 1 -

第 1 章. 簡介

1.1. 動機

數位時代的來臨，在數位技術上的蓬勃發展，改變了影音多媒體的儲存與傳

送的方式，影響至為深遠。在儲存方面，影像 (image)、視訊 (video)、音樂等多

媒體資料，由傳統的照片、錄音帶、錄影帶等類比式的紀錄方式，演變成為數位

形式的 MP3、JPG、MPEG 等，能在電腦上輕易的進行操作與存取。在傳送方面，

因為網際網路的發達，也由於多媒體數位化的優點，讓多媒體資訊能藉由網路無

遠弗屆的特性，傳送給網路上的每一個人。

在所有的影音多媒體資訊中，以數位視訊在儲存上所需要的資料量最多，因

此在傳送上最耗頻寬及時間。藉由視訊壓縮技術的制定，儲存視訊所需要的資料

量大為減少，讓視訊經由網路傳送更為容易，但壓縮方法所附帶的易碎性質讓壓

縮視訊在錯誤率高的網路頻道傳送時，常會因網路不可避免的錯誤發生，使得接

收方接受到錯誤的視訊流而不能正常解碼視訊，造成嚴重的損失。所以如何在接

收視訊後，偵測錯誤、定位錯誤甚至修正錯誤，一直以都備受關注，因此也引進

很多領域的技術來試圖解決。使用浮水印的資訊隱藏技術來處理相關問題，是近

年來興起的討論，很多研究也投入在這個方向上，的確也被証明是能有效解決的

方法。

- 2 -

1.2. 視訊簡介

以下將簡介視訊壓縮標準及視訊錯誤。

1.2.1. 視訊壓縮標準

數位視訊的原始格式會佔用極大量的空間，因此需要經過壓縮過程，才能適

用於現實的需要，進行儲存及傳送。現行的視訊壓縮標準有 ITU-T VCEG (Video

Coding Experts Group) 制定的 H.261、H.263 [1、 2]，ISO/IEC MPEG (Moving

Picture Experts Groups) 提出的 MPEG-1、MPEG-2、MPEG-4 [3、4、5]，以及由

二個組織共同組成的 JVT (Joint Video Team) 最新制定及維護的 H.264/AVC [6]

標準。

所謂的壓縮方法，就是找出冗餘內容，從資料流中除去的技術。現今視訊壓

縮標準主要就是利用空間上及時間上冗餘資料的去除來達到壓縮的效果。以

MPEG-2 為例，主要的作法如下。

1.2.1.1. 空間上的冗餘去除

影像及視訊的一個特性是空間冗餘。在同一張畫面存在一些共通特性，也許

是色彩、幾何，或是其它特徵值，而空間冗餘去除，就是保留畫面中重要的元素，

移除重複且較無影響的元素。

- 3 -

1.2.1.1.1. 色彩取樣

根據 HVS (Human Visual System) 己知，人眼對於亮度上的變化，相較於色

度是較為敏感的。依此實驗，MPEG-2 採用亮度色度的色彩表示格式，Y 表示亮

度值 (luminance)，Cr 及 Cb 表示色度值 (chrominance)，從降低色度取樣來減少

訊號量。MPEG-2 中定義了 4：2：0、4：2：2 及 4：4：4 取樣格式。4：2：0

表示四個 Y 取一個 Cr 一個 Cb；4：2：2 表示四個 Y 取兩個 Cr 兩個 Cb；而 4：

4：4 表示四個 Y 取四個 Cr 四個 Cb，即不做任何的色度取樣減少。減少色度取

樣可以在盡量降低對視覺的影響下達到較大的資料縮減效果。

1.2.1.1.2. 離散餘弦轉換 (DCT，Discrete Cosine Transform)

離散餘弦轉換是一個無損的，可逆的數學計算。用於視訊壓縮時，把空間亮

度取樣和相應的色度取樣強度資料轉化為空間頻率資料。在 MPEG-2 的視訊壓

縮中，找出存在於視訊中每張畫面裡的空間冗餘，是將圖切成 8x8 的區塊 (block)

後做離散餘弦轉換來完成的。區塊像素的色彩值轉換後的離散餘弦轉換係數依然

是一個 8x8 的矩陣，左上角的係數稱為 DC 係數，其餘稱為 AC 係數。DC 係數

往下代表著逐漸增高的垂直空間頻率係數，往右代表看逐漸增高的水平空間頻率

係數，其他係數則代表垂直水平空間頻率的不同組合。

由於影像的自然屬性，一個畫面中通常不會有很密集且大的波動，因此離散

- 4 -

餘弦轉換通常較高空間頻率的離散餘弦轉換係數的值很小，甚至為零。事實上，

離散餘弦轉換並不能減少數據量，但是卻可以將資料轉成較易找尋冗餘的型式。

1.2.1.1.3. 量化

除了在 4：2：2 或 4：2：0 的色彩取樣過程中丟棄了有限數量的資訊，MPEG-2

的壓縮能力主要是來自對離散餘弦轉換係數靈活的量化過程。簡單的說，量化

(quantization) 就是減少描述各係數的位元數的過程，亦即將各係數以較粗糙的

度量單位描述。量化的動作主要有兩個功能：一是讓原來很接近零的值儘量變成

零；另外則是使得原來非零的係數分佈範圍變小，有助於壓縮。量化是一種破壞

性壓縮技巧，量化後的資料再還原時與原來的資料不會全然相同，因此視訊壓縮

後失真的程度，主要便取決於量化位階 (quantization scale) 的選取。由於人眼視

覺上的特性，高空間頻率的訊號不易察覺其變化，因此用較大的位階表示甚至忽

略，對人眼並不會造成多大的差異。

1.2.1.2. 時間上的冗餘去除

視訊專屬的另一個特性是時間上的冗餘。視訊因相鄰的圖框 (frame) 幾無差

異，大多只是影像內容的位置變化，所以我們可以利用除去在時間軸上圖框之間

的相似性造成的冗餘來進行壓縮。

- 5 -

1.2.1.2.1. 移動補償 (motion compensation，MC)

移動補償便是基於上述概念所發展出來的一種視訊壓縮技巧。在做移動補償

之前，首先將圖框分為 16x16 大小的巨區塊 (macro-block，MB)，然後找尋其在

參考圖框 (reference frame) 中近似的巨區塊所在位置，並將由目標巨區塊到參考

巨區塊間位置的座標差記錄成移動向量 (motion vector)。參考圖框在該圖框之

前，稱為向前預測 (forward prediction)；參考圖框在該圖框之後，稱為向後預測

(backward prediction)；而參考圖框在該圖框前後都有，稱為雙向預測

(bi-directionally prediction)。整個找尋移動向量的過程稱為移動向量估計 (motion

estimation)。

因為預測可能不是最佳匹配，且目標巨區塊與參考巨區塊間不一定完全一

致，因此還要計算目標巨區塊與參考巨區塊間圖框訊號的差值，稱為預測誤差

(prediction error)，用以在解碼時做為補償之用。最後預測誤差再以空間的冗餘去

除的壓縮法處理。

1.2.1.2.2. 圖框壓縮

MPEG-2 的視訊資料結構，由下而上依序為：

區塊 (block)：包含量化後的圖框資料，由 8x8 的像素所組成，是離散

餘弦轉換的最小單位。

- 6 -

巨區塊 (macroblock，MB)：為一個 16 x 16 的大區塊，是色彩取樣、移

動向量估計及移動補償的基本單位。

片段 (slice)：由數個巨區塊所組成，主要將每張畫框作水平且固定單位

的切割。片段以上的各種結構都有訊號同步及錯誤控制能力。

圖框 (frame)：由數個片段所組成，為最主要的編碼單位，主要有三種

影像編碼的型態 I、P、B。

圖框群組 (group of pictures，GOP)：由一張 I 圖框及數張 P 及 B 圖框所

組成。在 MPEG-2 中，圖框群組的總長及 P 圖框張數是可以動態調整

的。

視訊序列 (video sequence)：由數個圖框或圖框群組所組成，一部影片

可以只由一個視訊序列組成，也可以由數個視訊序列所組成。

MPEG-2 定義了三種圖框壓縮模式，I 圖框、P 圖框、B 圖框：

1. I 圖框 (intra coded frame)

當巨區塊僅使用本身的圖框資料進行空間的冗餘去除，並沒有參考其他圖框

的資料，我們稱為 intra 模式巨區塊 (intra mode macroblock)。在 I 圖框中，所有

的巨區塊皆為 intra 模式巨區塊。I 圖框做為視訊流中的索引點，也是提供隨機存

取能力的主要來源。I 圖框通常在視訊序列或圖框群組的第一張，解碼時 I 圖框

可獨立解碼，並做為 P 及 B 圖框的參考影像的來源。由於不須參考其他畫面，

因此沒有消除時間上冗餘的好處，在壓縮率上表現較差。

- 7 -

2. P 圖框 (predictive coded frame)

在編碼及解碼時，會使用參考圖框，這些參考圖框可為該圖框前面最近的 I

圖框或 P 圖框。編碼時，在 P 圖框中的巨區塊，若能在參考畫面上找到相對應

的巨區塊，則用移動補償方式做預測編碼 (predictive coding)；若找不到，則以

intra 模式做編碼。由於加入消除時間上冗餘的技術，因此其編碼效率較高。

3. B 圖框 (bi-directionally predicted)

在解碼及編碼時，會使用到前面及後面兩個方向參考圖框的資料。如同 P

圖框一樣，編碼時，在 B 畫面中的巨區塊，若能在參考圖框上找到相對應的巨

區塊，則用移動補償方式做雙向預測編碼 (bi-directionally predictive coding)；若

找不到，則以 intra 模式做編碼。B 畫面擁有最高的編碼效率，不過畫質最差，

故本身不再做為其他預測編碼用。

1.2.1.3. 以資料本身冗餘為基礎的壓縮

MPEG-2 在以視訊的特性做了空間及時間上的冗餘壓縮後，還會對資料本身

的冗餘再做壓縮。在量化完成後，MPEG-2 採用 Zigzag Scan 或 Alternate Scan 來

將量化後二維的離散餘弦係數串接成一維的數列，以近似 Z 字型或是鋸齒狀路

線處理 8x8 區塊中的 64 個係數，盡量形成最大長度的連續零值，以提高壓縮效

率。將串接起來的資料以遊程編碼 (run length coding，RLC) 及可變長度編碼

(variable length coding，VLC) 處理。

- 8 -

遊程編碼的概念就是，如果有一連串相同的值，則我們可以標示該值及其持

續長度來表示。例如有十個"A"構成一個字串，則我們可以將"AAAAAAAAAA"

之描述成"A" x 10，這樣就可以減少許多相同的資料存放空間。

可變長度編碼基本概念則是：越常出現的樣版，就以越短的位元數來表示。

因此可變長度編碼的流程在於找出資料中所有的資料樣版及其出現頻率，以較少

的位元來描述較常出現的樣版，用較多的位元描述不常出現的樣版。霍夫曼編碼

(Huffman Coding) 就是其中一種基本的演算法。基本上遊程編碼及可變長度編碼

都是非破壞性壓縮。

1.2.2. 視訊錯誤簡介

多媒體資訊在經過視訊壓縮標準如 H.263 ITU 和 MPEG 壓縮後，達到良好

的壓縮率，使視訊流能夠在網路頻寬相對不足的情況下傳送。但隨著無線網路上

傳送視訊的應用越來越多，如視訊電話或視訊會議等，無線網路等傳送頻道信任

度不好的性質，會導致視訊在傳送過程容易產生錯誤。因為這個因素，視訊在傳

送技術上面臨新的挑戰，不僅要能根據網路頻寬傳送，而且要求能依網路狀況做

適當的錯誤控制。

視訊易發生錯誤的原因就在於視訊壓縮後的易碎性質，使得壓縮視訊很容易

因為傳送頻道各種不可預期的錯誤，像位元錯誤、封包丟失、多路徑衰減

(multi-path fading)、信號擁擠、其它頻道的干擾或另外許多因素影響等，使得接

- 9 -

收端接收到有錯誤、不同於傳送方原始的資料的視訊流，進而在解碼視訊時發生

問題。像壓縮視訊採用的可變長度編碼，例如 Huffman variable-length coding 等，

會因為位元錯誤而使得解碼過後的連續資料有誤，如圖 1-1，在 VLC 發生位元

錯誤，使得原來是標頭檔部分的資料，被當作可變長度編碼部分，連帶影響後面

資料流的解碼。解碼錯誤視訊的後果，輕者如視訊品質的降低，如圖 1-2，嚴重

者甚至不能解碼等。

圖 1-1 視訊流位元錯誤示意圖

DC VLC … VLC HD DC VLC

DC VLC … VLC VLC VLC HD

…

…

An 8x8 block An 8x8 block

… VLC

DC

bit error

An 8x8 block

- 10 -

圖 1-2 受破壞之影像

視訊壓縮標準所採用的移動補償技術，會使錯誤波及到後面參考到錯誤圖框

的圖框，如圖 1-3 所示，inter frame 不只在圖中間有錯誤發生，而且在圖上方及

下方延續 intra frame 所發生的錯誤。

(a)intra frame (b)inter frame

圖 1-3 錯誤延續範例 (a) intra-frame (b) 參考(a)之 inter-frame

所以在視訊的考量上，錯誤控制比單純更換錯誤圖框更為重要。因應視訊在

易錯頻道傳送的應用越來越多，偵測視訊錯誤、視訊錯誤定位，以至於錯誤視訊

還原的研究是很值得探討的。

1.3. 視訊壓縮標準採用的錯誤偵測與隱匿方法

基於對現實的考量，MPEG-4 等最新壓縮標準已將錯誤控制列入考慮，也加

入一些新技術解決部份的問題。這些技術又稱為錯誤復原工具 (error resilience

tools)，可偵測視訊流的錯誤，控制錯誤範圍不致擴大以及隱藏這些錯誤。以

MPEG-4 為例。

- 11 -

1.3.1. 再同步標記 (Resynchronization Marker)

把同步標記遍佈視訊流，如每隔幾個巨區塊或幾個位元就加入同步標記，而

不僅是資料流的開始部份，能有效控制錯誤的擴散。缺點就是要浪費一些位元來

儲存同位標記，且依據視訊壓縮標準的不同，越複雜的標準所需要的同步標記種

類也越多。

1.3.2. 標頭延伸碼 (Header Extension Codes)

啟動此項功能後，一個標頭延伸碼會複製每一個視訊封包的所有標頭資訊，

確保一個標頭錯誤不會造成整張影像畫面損失。因為是利用冗餘來達到錯誤控制

的目的，所以必需花費大量的空間來儲存多個相同的標頭檔。

1.3.3. 資料分割 (Data Partitioning)

在 MPEG-4 裡，是利用移動同步標記 (motion maker) 來分隔移動向量及預

測誤差，這樣錯誤發生時就可以執行再同步，兩個標記之間的資料也不會消失不

見。如圖 1-4 所示。

- 12 -

圖 1-4 MPEG-4 Data Partitioning model

1.3.4. 可逆式可變長度編碼 (Reversible Variable Length Coding)

可變長度編碼的一種，使 DCT 係數可以順向或反向解碼，若某個錯誤造成

編碼字元不正確，解碼器可以在下一個標記恢復同步，然後反向解碼，將 DCT

係數儘可能復原。

1.4. 相關的錯誤偵測與隱匿方法

除了在新的壓縮標準中具體實現的各種錯誤復原工具外，還有許多空間性和

時間性錯誤控制技術。以下介紹的方法大都或多或少各自被採用於某些視訊壓

縮實作裡。

1.4.1. 錯誤偵測

在各種傳統視訊壓縮所採用的錯誤偵測方法，主要是利用標準上定義的語法

( syntax-based ) 錯誤偵測的方式，語法錯誤如下所列：

- 13 -

移動向量超過限制範圍

錯誤的可變長度編碼

DCT 係數值超過限制範圍

8x8 區塊的 DCT 係數超過 64

參數錯誤，如量化大小參數超過範圍等

如果視訊在解碼時有上述的語法錯誤時，就會把發生錯誤的巨區塊用預設的

錯誤隱匿技術還原。語法錯誤偵測有著簡單且易實現的優點，但也存在二個很大

的缺點：

1. 錯誤偵測率低

語法錯誤偵測的錯誤偵測率不高，拿位元錯誤來說，解碼器並不能分辨位元

是否錯誤。以巨區塊為單位，把偵測出錯誤的巨區塊除以總數的巨區塊，即為錯

誤偵測率。經實驗得知，語法錯誤偵測率大概為 0.1 到 0.4 之間。

2. 錯誤定位正確率低

由實驗得知，正確定位的機率大概為 0.05 到 0.15。會造成如此表現的原因

在於，當偵測到錯誤時，離真正發生錯誤的地方有距離，如圖 1-5，當 MB N 發

生錯誤時，語法錯誤偵測直到 MB N+2 才發現語法錯誤，這時會定位錯誤在 MB

N+2。而且當累積的錯誤在被發現之後，在前面的錯誤會被遮蓋，而無法利用錯

誤隱匿技術於這些未能被定位出錯誤的巨區塊。

- 14 -

圖 1-5 錯誤的定位錯誤示意圖

1.4.2. 錯誤隱匿

傳統的錯誤隱匿技術依實現端口的不同主要可分為三種，編碼端

(encoder)、解碼端 (decoder)，及編解碼端。

1.4.2.1. 編碼端

這種方法是以編碼端擔任主要的工作，在編碼端加入一些額外的操作或是冗

餘的資訊，實現錯誤隱匿。

1.4.2.1.1. 階層式優先編碼法 (layered coding with transport

prioritization) [7]

所謂的階層式編碼，如圖 1-6 所示，可以多個階層，而主流是分成二個階層，

基底層 (base layer) 和加強層 (enhancement layer)。

Error happens Error happens Error happens …

MB N+1 MB N MB N+2 MB N+3

Syntax error detected

- 15 -

圖 1-6 階層式編碼

基底層包含視訊中最重要的部分，如移動向量或是低頻係數，加強層則是包

含額外的資訊。以視訊傳送來講，為了抵抗頻道的錯誤，選擇將基底層做較好的

錯誤保護方式，例如在較不易發生錯誤的網路傳送等。一般來講，MPEG-2 主要

包含四種階層式的編碼，分別是 temporal scalability、spatial scalability、SNR

scalability 和 data partitioning。以 spatial scalability 來講，基底層包含了解析度較

差的次取樣 (sub-sample) 視訊，而加強層則是一些額外的資訊，把加強層資訊

加到基底層就可以得到解析度較好的視訊。階層式編碼輔以傳送優先權，則是把

視訊中重要的部分給予較高的優先權放在基底層，較不重要的部分放在加強層，

是以基底層有較好的保護方式考慮。

1.4.2.2. 解碼端

這種方法是解碼端利用視訊本身的資訊實現錯誤隱匿。像一般使用的編碼標

準為 DCT/MV 編碼方式，在解碼端由於 slice 觀念的使用，視訊的每一列都有自

我定位的位元串列記號，當錯誤發生在某一 slice 時，可以把錯誤限制在一列，

- 16 -

不會波及到其它正確接收的 slice，如果周圍的巨區塊是正確解碼的，可利用在錯

誤隱匿上。有些技術更可以利用編碼端的編碼方式，來做適當的調整，例如階層

編碼 (layered coding) 的使用，以頻率域資料分割 (frequency-domain partitioning)

而言，被破壞的巨區塊因為資料分割的原因，即使原始資料受到破壞，但巨區塊

的編碼模式、移動向量有機會可以正確接收，可供後置作業來完成錯誤隱匿。

1.4.2.2.1. 移動向量時間性預測 (motion-compensated temporal

prediction) [8]

這種方法最簡單的型式，是利用前面己解碼完成的圖框，將其空間上的相對

稱巨區塊取代被破壞的巨區塊，雖然簡單但是有可能會產生嚴重的人工失真。

另一個改進的方式是取移動向量區塊來做補償，利用周圍正確接收到的巨區

塊，來預測破壞巨區塊的移動向量，如果是採階層編碼，則可以把移動向量及視

訊低頻部分放在基底層，則更容易得到精準的移動向量預測。

1.4.2.2.2. 空間域及頻率域內插法 (spatial- and frequency-domain

interpolation) [9]

被破壞區塊的係數，以鄰近的正確區塊係數做內插 (interpolation) 來做錯誤

隱匿。因區塊以一整群係數為單位，所以係數內插並不是取相臨最近的係數效果

- 17 -

最好，以實驗得知，其中以兩種模型的結果較佳，如圖 1-7、圖 1-8。

圖 1-7 內插法模型一

圖 1-8 內插法模型二

1.4.2.3. 編解碼端

利用編解碼端在錯誤發生時所做的溝通，來實現錯誤隱匿。一般的方法是解

碼端接收到錯誤的資訊後，回傳給編碼端要求重傳正確的資訊，因為回傳及重傳

需要耗時，通常不適合於即時性 (real time) 的應用。

- 18 -

1.4.2.3.1. 選擇性編碼 (selective encoding for error concealment) [10]

最簡單的一種是當解碼端偵測到錯誤時，會把相關的資訊回傳給編碼端，下

一張要傳的圖框，就會以圖框內 (intra-frame) 編碼的方式編碼，這樣可以把錯

誤限制在這一張圖框內，不過這種方法會大量減少壓縮率，如果在頻寬限制的條

件下，視訊的品質大幅降低。

更進一步的做法，是把解碼錯誤的巨區塊位置回傳給編碼端，編碼端接收到

訊息，就會立刻算出受到影響的巨區塊，把受到影響的巨區塊標記起來，並且不

為後面圖框的預測用資訊，如圖 1-9 所示，這樣避免了在易錯頻道中會發生大量

需要傳送圖框內編碼的現象。

圖 1-9 錯誤巨區塊標記選擇性編碼

- 19 -

第 2 章. 理論基礎

本論文利用數位浮水印 (digital watermarking) 的資訊隱藏技術 (data

hiding)，在傳送端將相關資訊藏入浮水印頻道，在接收端由浮水印頻道擷取出

來，以浮水印資訊實現視訊錯誤偵測及隱匿。

2.1. 數位浮水印簡介

數位浮水印技術就是在原有的資料上，利用方法嵌入自己的資料，而後擷取

出來做為後續的用途使用。

在各類成品中附加上額外資訊的概念經常應用在各種領域。如做為商業上商

標、所有權認證、或做為個人作品象徵的標章；甚至在軍事上，可利用圖文影像

等來傳遞秘密資訊。

隨著資訊時代到來，許多數位化的影像、聲音、視訊，也都需要附加資訊來

保障它們的所有權，因此便有了數位浮水印產生，也興起學界廣泛的研究，各種

領域的技術被應用在浮水印研究上。通常數位化浮水印是在原來的二元資訊數值

中，依照要加入的額外資訊做些微調整，以達到浮水印嵌入的效果。例如一般影

像中的浮水印，多是對其中某些點的顏色值做少許修改來達到其目地；而音訊的

浮水印，例如 Bassi [11] 的方法，是藉由小幅修改時間域上的信號振幅，達到嵌

- 20 -

入的目的；而視訊的浮水印，大致和影像的原理相似，但某些研究亦加入了一些

影像之浮水印所不能做的方法，如 Hsu 和 Wu [12]，除了在 MPEG 中的 intra-frame

加入浮水印，另外還對移動向量做調整，也就是在 P、B 等圖框間 (inter-frame) 編

碼中也有少量的修改。

圖 2-1 MPEG frame organization

以多媒體文件而言，在各個應用浮水印的領域裡，所需要的浮水印特性不盡

相同。所以並沒有一種浮水印技術能夠適用於所有的應用，不過浮水印一些普遍

存在的特性，是符合大部分領域所要的需求，而這些特性也成為判斷一個浮水印

技術好壞的指標，整理如下：

1. Perceptual transparency (隱匿性)

所加入的數位浮水印，除了一些特殊應用，必須以不影響原來的多媒體文件

為考量，讓加入浮水印後的文件，能夠保持原來文件的品質，不輕易讓人在感官

上查覺到和原文件有所不同。而這也能夠降低讓有心人士發現進而加以竄改的機

會。有些技術甚至利用人體視覺系統 (HVS) 和人體聽覺系統 (HAS) 來加強隱

匿性。

- 21 -

2. Robustness (強健性)

所謂強韌性，意指浮水印能夠抵抗各類無意或惡意的攻擊。例如在一般的訊

號處理或是幾何處理過後，甚或遭到為惡意破壞後，在原圖損壞情況不嚴重的時

候，還是能夠偵測出浮水印。而攻擊的方式大致上可以區分為三類。

一般影像處理：像常見到的 MPEG 壓縮，各種 filter (ex.銳化、濾波)，

或 A/D，D/A 轉換動作等。

幾何處理：原本的多媒體文件加諸以剪裁 (cropping)，放大縮小

(scaling )，旋轉 (rotation) 等效果。

惡意攻擊：一般起因是來自於有心人士的攻擊,如利用 average attack 等

等。

3. Payload of the Watermark (嵌入資料量)

在各種領域中以不失真過多的前提下，所能夠嵌入的浮水印資訊有限，而且

資訊多寡根據應用的不同而有差異。如果在一個應用裡，浮水印技術能夠嵌入的

資訊越多，則越能提高其強健度及應用層面的加強。

4. Security (安全性)

一個好的浮水印技術，在未經授權的情況下，嵌入的資料是不能被擷取出來

的。所以在浮水印演算法公開的情形下，必須對其浮水印資料再加密編碼，要有

正確的密鑰才能夠正常解碼。如此可讓有心人士無法得知正確的加入順序或擷取

- 22 -

門檻，增加浮水印的安全性。

5. Statistically undetectable (不易計量偵測)

在一批用相同浮水印演算法嵌入的文件中，即使嵌入的資料不同，還是有可

能被有心人士利用統計上的方式分析出演算法，而知悉嵌入的浮水印資料，進而

去除之或加入非法的浮水印。好的浮水印應該避免被統計方式分析出來。

6. Oblivious versus Noblivious Watermarking (不需原圖)

在擷取出浮水印的過程中，有些技術需要利用原圖來幫忙擷取，這在浮水印

的使用上較為不便，而且也需要花費額外的空間來儲存。若能不需要原圖即可擷

取，則能提供使用者較有效便利的服務，但一般這類方法會降低浮水印的強健

性，或者減少浮水印的嵌入量。

上面的各項要素，視應用的需求，其相對的重要性也不一樣。其中的

perceptual transparency 和 robustness 是互為 trade-off 的關係。如果著重在

perceptual transparency 方面，會因為浮水印嵌入數量或是方式的考量，經影像處

理後，會減低浮水印的偵測；而如果注重在浮水印 robustness 的能力，便因為浮

水印嵌入的相反需求，犧牲 perceptual transparency 的部分，降低了原先影像的品

質，彼此關係如圖 2-2。所以視各個應用的需求，取得一個最佳的平衡點，是很

多人感興趣的部分。

- 23 -

圖 2-2 強建度與透明度 trade-off 示意圖

2.2. 浮水印分類與相關研究

浮水印的大行其道，在各個領域上都有相關的研究，涉及了視訊、文件、影

像、音訊、資料庫等各類的數位資料，但由於本論文探討的主題是影像及視訊的

浮水印技術，所以下面以影像及視訊浮水印的各種層面做分類。首先就視覺上而

言，浮水印可分為兩種，可見式 (visible) 和不可見式 (invisible) 的浮水印技術。

2.2.1. 可見式浮水印 (visible watermarking)

這個類型的技術所呈現的效果，就是浮水印可直接被人眼所見，如圖 2-3。

其特性就是不需經過任何演算法計算即可得知擁有者為誰，而這種浮水印的目的

也明確，就是要給予觀看者資訊，以表示資料來源或所有人，例如學術論文上經

常會壓上的浮水印章，或者是電視台會將台徽、標示加在頻道畫面上，以方便觀

眾辨識，同時也保護其影片不被直接盜用。

- 24 -

(a) (b)

圖 2-3 可見式浮水印 (a)浮水印 (b)為加入浮水印之 Lena 圖

這類浮水印的最大缺點就是它會對原影像品質產生破壞，實例最明顯的像是

時下盛行的網路購物，許多賣家為了防止商品的圖片被盜用，便清楚的加上了自

己的帳號等資訊，如圖 2-4，雖然宣告了資訊財產權，但也直接破壞了原本商品

照片的美觀性。另外，這類浮水印的強健性差強人意，很容易直接被覆蓋掉，或

者經由訊號處理的技術去除。

圖 2-4 網路商品的可見式浮水印

- 25 -

2.2.2. 不可見式浮水印 (invisible watermarking)

此浮水印類型為目前浮水印研究的主流，強調加入的浮水印不易被人眼所察

覺，可視為一種資訊隱藏 (data hiding) 的技術，所以較具保密性及不易被去除，

與上一類型相比，它屬於被動式的保護，在所有權有所爭議時才由所有人進行判

定的依據，但這一類型浮水印所具有的資訊隱藏特性，使它並不局限於所有權的

保護，可應用的範圍很廣。

目前浮水印技術的研究主要著重於後者，而後面幾節所要討論的也都是屬於

這一類型的浮水印。

然而根據實際上應用的目的，浮水印技術又可分為兩類，易碎式 (fragile) 和

強健式 (robust) 的浮水印。

2.2.3. 易碎式浮水印 (fragile watermarking)

此種型式的浮水印，其目的主要是用來驗證影像 (multimedia authentication)

是否同於原影像。如果影像發生錯誤或遭受到攻擊，浮水印技術能夠察覺，進而

偵測出受到修改的部分，甚至是何種類型的攻擊所導致。有些研究則利用此種浮

水印易受破壞的性質於量測網路狀況上 [13]，藉由觀察嵌於其中的浮水印在經

過網路傳送後的損傷的狀況，能明確得知此時的傳送網路是否可靠。這類型浮水

印的應用直到最近才引起較多研究的興趣。

- 26 -

2.2.4. 強健式浮水印 (robust watermarking)

強健式浮水印將所有權資訊鑲嵌在原影像中，其目的是保護作者的著作權

(copyright protection)，顧名思義要能夠對各種攻擊有抵抗性，無論是無意間壓縮

所產生的破壞，傳送過程中所發生的錯誤，或是惡意的各類影像處理的攻擊等。

這類型亦是現今最常見於被研究的浮水印技術。

在主流的不可見式浮水印技術中，又可因嵌入的技術不同，而將浮水印分為

兩類，分別為空間域 (spatial domain) 與頻率域 (frequency domain) 兩大類型。

2.2.5. 空間域浮水印 (spatial domain watermarking)

在空間域上加入浮水印，目的是希望所加入的浮水印，能夠盡量不影響到影

像的隱匿性，所以通常人眼視覺上較無法察覺到的部分，加入浮水印。加入的方

法，是直接改變數位資料值來達到浮水印嵌入的目的，具有單純且快速運算的優

點，也有較大的資料嵌入量。但讓人詬病的是很難抵抗幾何攻擊及一般訊號處理

造成的破壞，但這種脆弱的特性，卻適合用於發展易碎式浮水印。

2.2.5.1. 置換最低位元法 (LSB, Least Significant Bit) [14]

置換 LSB 法顧名思義，就是將所要的浮水印，加入到像素的中最不重要、

最低的位元，以達到較低的失真效果，嵌入方法如圖 2-5 所示。此方法可嵌入和

- 27 -

原圖一樣大小的二值圖形，具有相當大的資料容量，像 Wolfgang [15]，就提出以

區塊為單位，將區塊像素的 MSB (Most Significant Bit) 利用雜湊函數 (hash

function) 轉換後的值嵌入在 LSB 中。但是當 LSB 遭到清除時，無法偵測出先前

所加入的浮水印，而且容易遭到許多影像處理的破壞。

圖 2-5 置換最低位元法示意圖，將浮水印位元取代係數最低位元。

2.2.5.2. 補釘法 (Patchwork) 及紋理區塊編碼法 (Texture Block) [16]

這類型浮水印技術的最大特點是以區塊為作用單位，將某一區塊以類似複製

剪貼的方法加到另一相似區塊，來達到些微調整以加入浮水印資訊。

2.2.5.3. 向量量化法 (VQ, Vector Quantization)

在 chang [17] 等人的研究中，先將原影像做 VQ 量化，並在過程中產生的

codebook，找取一對對相近的索引值，將索引值分為兩群，分別代表 1 和 0，最

- 28 -

後編碼時如果對應浮水印值為 1，則使用第一群的索引值；相反若為 0 則使用第

二群之索引值，藉此加入浮水印資訊。

2.2.6. 頻率域浮水印 (frequency domain watermarking)

頻率域浮水印是將空間域的影像值，經由頻帶轉換公式轉變為頻率域的影像

值，將係數加以修改以藏入浮水印，再以反頻帶轉換公式轉回空間影像，完成一

次頻率域浮水印嵌入，如圖 2-6 所示。而擷取流程也是相同做法。

嵌入部位的選擇，端看浮水印的應用。低中頻區為訊號不易被破壞的地方，

是強健式浮水印常選擇嵌入的部分，強調偵測破壞的易碎式浮水印，則大部分選

擇在高中頻區，取高頻易受外在影響的特性。其中頻帶轉換 (FT) 則有離散傅利

葉轉換 (DFT，Discrete Fourier Transform)、離散餘弦轉換 (DCT，Discrete Cosine

Transform)、離散小波轉換 (DWT，Discrete Wavelet Transform) 等類型，各有其

適用的領域。

- 29 -

圖 2-6 頻率域浮水印嵌入示意圖

2.2.6.1. 離散傅利葉轉換域 (DFT domain)

離散傅立葉轉換，是將一段數位訊號轉換成各個頻率的正弦波分量，在影像

上的應用相當普遍。離散傅立葉轉換對於旋轉 (rotation)、縮放 (scaling) 和平移

(translation) 的不變性，適合 MPEG-4 等以物件為導向的壓縮標準發展浮水印技

術，因物件會因幾何操作而定位失焦，而離散傅利葉浮水印在抵抗幾何攻擊時效

果顯著。

2.2.6.1.1. Dajun He [18]

Dajun 等人先將影像定位之後，把原影像轉換成為離散傅利葉頻率域，然後

將低頻區係數分為兩群，分別為 E1 及 E2。浮水印如果是 1，調整兩群裡的對應

係數使得 E1 大於 E2，反之則調整為 E2 大於 E1。擷取時則比較對應係數，如果

E1 大於 E2，則浮水印為 1。結果顯示，在影像受到幾何變換的任意幾何

(Geometrical transformation) 破壞之後，有比其它類技術更佳的強健性。

2.2.6.2. 離散餘弦轉換域 (DCT domain)

以下為離散餘弦轉換 (DCT) 之簡介：

1. 頻率域 (frequency domain) 之數位影像資料，即是將空間域數位影像資料經

- 30 -

過運算後所得到的以數個基本頻率組合之結果。

2. 以離散餘弦轉換將空間域數位影像資料轉換成頻率域，稱為離散餘弦正轉換

(Forward Discrete Cosine Transformation, FDCT)，將頻率域數位影像資料還原

成空間域，則稱為離散餘弦反轉換 (Inverse DCT, IDCT)。

3. DCT 轉換的步驟，首先將數位灰階影像完整地劃分 8 × 8 像素大小的區塊且

每一個區塊並不重疊，如圖 2-7。接著 FDCT 將每一個空間域區塊中所有像

素值減去 128 後再做轉換，如公式 2-1 所示。

公式 2-1：

預即可得到一個和空間域區塊中像素個數相同的頻率域區塊。如果將此頻率

域的資料以 IDCT 做轉換後，如公式 2-2 所示，再將每個元素值加上 128，

即可還原成原來的數位影像。

公式 2-2：

- 31 -

圖 2-7 區塊分割示意圖

接下來將介紹使用離散餘弦轉換技術的浮水印。

2.2.6.2.1. DCT 係數修改法

在 Cox [19] 等人的研究中，提出了以秘密通訊上使用的展頻 (Spread

Spectrum) 技術來嵌入浮水印，把浮水印散佈藏入於 DCT 低頻係數，對於較低

頻的影像攻擊，如均化 (smoothing)、縮小 (downscaling) 等以及同為 DCT 頻域

的視訊壓縮如 MPEG 所造成的破壞，有較高的抵抗性。首先利用 DCT 轉換將影

像轉換到頻率域，從頻率域找出前一千個能量較大的係數值，如圖 2-8 中淺色的

區塊，再將浮水印等資訊加在上面，最後再轉回空間域就能得到浮水印影像。

圖 2-8 Cox 係數選取示意圖

首先將待驗證的影像和原影像都轉換至頻率域，並相減其值，將得到的訊號

與原浮水印做相似性的比對，即可確定測試影像是否嵌入原浮水印。嵌入和擷取

的流程圖如下圖 2-9。

- 32 -

圖 2-9 左圖為 Cox 之嵌入流程，右圖為 Cox 之擷取流程

嵌入的方法，是最典型線性直接加入法 (linear additive algorithm) ，方法如

公式 2-3 所示。

公式 2-3：

其中 f (m, n) 為座標為 (m, n) 之原 DCT 係數值； ),( nmf ′ 為嵌入後的值； iw

為浮水印訊號序列之值；α 為調整浮水印強度用之係數，預設為 1。Cox 等人在

此也提出使用 similarity 來判定浮水印是否符合原浮水印。Cox 所提出的 similarity

量測法，也為往後許多研究所用。

Cox 的 DCT 浮水印技術衍生出很多改良的方法，像 Biswas [20] 就把 Cox

研究的對象由影像延伸到視訊，提出了把視訊分成多個場景 (scene)，分別嵌入

- 33 -

不同的浮水印，以抵抗統計分析攻擊。做法是把浮水印分成 8 個位元平面

(bit-plane)，分別把每一個浮水印位元平面利用展頻技術分散浮水印嵌入，嵌入

的部位則可利用情況選擇適當的 DCT 係數，而實驗結果確也證明在抵抗視訊處

理或是統計分析攻擊時具有良好效果。

2.2.6.2.2. 調整中頻係數對關係法

相較於 Cox 所提出的直接加入法 (additive algorithm)，Barni [21] 等人則使

用調整係數對大小關係來嵌入浮水印。在研究中，先經過轉至 DCT 頻率域和量

化的過程後，再利用偽隨機 (pseudo-random) 隨機選取每一張圖框中的數個巨區

塊，巨區塊中的每一個區塊再隨機挑選出幾組兩兩一對的中頻係數，根據浮水印

位元，調整係數對係數之間的大小關係以嵌入浮水印。選擇中頻係數 (如圖 2-10)

是兼顧對隱匿性及強健性的需求。

圖 2-10 DCT 中頻係數

擷取流程則是相同流程的相反動作，取出各組相對應的係數對之後，觀察係

- 34 -

數對係數間的大小關係就能得出嵌入的浮水印位元。

2.2.6.2.3. Ghosh, D [22]

Ghosh 等人的研究則是把重點放在視訊圖框間 (inter-frame) 的利用上，P 和

B 圖框裡每一個區塊的預測誤差 (公式 2-4)，根據浮水印值加上展頻過後的浮水

印位元 (公式 2-5)，完成嵌入的部分。

公式 2-4：

1)( −−= kkk RRRE

其中 kR 和 1−kR 分別為目前以及先前圖框中區塊的總像素值，E( kR )則為二者

之間的差值，所用的方法為 MSE (mean square error)。

公式 2-5：

擷取部分如公式 2-6 所示。

公式 2-6：

k

R∧

為目前浮水印區塊總像素值， 1−∧ k

R 為先前圖框區塊的總像素值，當作比

- 35 -

對之用。如果 'R 與1−∧ k

R 近似，則浮水印位元 0；反之如果是 "R 與1−∧ k

R 近似，則

浮水印位元 1。比對完所有的區塊，就能擷取出嵌入的浮水印。

2.2.6.3. 離散小波轉換域 (DWT domain)

離散小波轉換 (Discrete Wavelet Transformation，DWT) 與 DCT 相似，都是

一種將空間域影像轉換成頻率域影像的技術。

1. 低頻特性

I. 肉眼對低頻敏感度較高。

II. 像素與像素之間的變化小。

III. 影像較平滑、細緻且清楚。

IV. 低頻部分的值稍有改變，人眼容易查覺。

2. 高頻特性

V. 肉眼對高頻敏感度較低。

VI. 像素與像素之間的變化大。

VII. 影像較粗糙、糢糊。

VIII. 高頻部分的值稍有改變，肉眼無法清楚分辨。

3. Haar 離散小波轉換方式及步驟

離散小波轉換的運算大致上有兩個步驟：一為水平分割，另一為垂直分割，

水平分割是讀取係數的順序依照水平方向由左至右來取；儲存時則是水平方向儲

- 36 -

存。垂直分割是讀取係數的順序依照垂直方向由上至下來取；儲存時則是垂直方

向儲存。

步驟一：第一次水平分割 (如下圖 2-11 所示)

圖 2-11 水平分割 (a)ABCD 代表四相連像素值

(b)第一步驟後四值 (c)、(d)數值實例 (e)、(f)真實圖例

步驟二：第一次垂直分割 (如下圖 2-12 所示)

圖 2-12 垂直分割 (a)其中 ABCD 代表相鄰四像素值

(b)第二步驟作用後四值 (c)、(d)數值實例 (e)、(f)真實圖例

完成第一次水平分割及第一次垂直分割後，即是第一階離散小波轉換。得到

了四個區塊 LL、LH、HL、HH (如圖 2-13 左圖)，這四個區塊分別代表不同的頻

率，所以稱這些區塊為頻帶 (sub-band)。因為 LL 頻帶是影像中最重要的部分，

- 37 -

所以可對 LL 再做一階離散小波轉換動作，在完成第二階離散小波轉換後(如圖

2-13 右圖)，總共可得到七個頻帶，其中四個為第二階的結果，而其他三個為原

本第一階留下來的結果。當然也可以往下做第三階、第四階、⋯、一直到第 n 階

的離散小波轉換。做完離散小波轉換後，最低頻區域就是整張影像中最重要的部

分。

圖 2-13 左圖為第一階離散小波轉換，右圖為第二階離散小波轉換

接下來將介紹使用離散小波轉換技術的浮水印。

2.2.6.3.1. DWT 係數修改法

Zhu [23] 等人基於前述 Cox 嵌入浮水印的公式，提出了 DWT 浮水印的研

究。應用在視訊嵌入的做法，則是先把視訊分成各個 GOP (group of pictures)，再

對每一個 GOP 進行 3D 離散小波轉換。利用離散小波階層式的特性，在每一階

小波轉換時，於 LH、HL、HH 嵌入相同的浮水印，如圖 2-14 所示。嵌入浮水

印後，再轉換回至空間域，即是浮水印視訊。

- 38 -

圖 2-14 DWT 中高頻係數修改法示意圖

選擇高中頻嵌入是基於隱匿性的考量，而嵌入多分的浮水印則是為了增加強

健性。在擷取的過程，則是轉至 DWT 頻率域，在每一階小波轉換時，取回嵌入

在三個高中頻帶的浮水印。

相較於 Zhu 把同一個浮水印嵌入多次，Ying [24] 則提出了把多個浮水印嵌

入視訊的做法。首先是浮水印的前置處理，利用二個二元字串 A={ ka }、B={ kb }，

把原始的浮水印經過處理，就會產生多個不同的浮水印，方法如公式 2-7 所示。

公式 2-7：

其中 k 為視訊場景的圖框個數， ),( jiw 為原始浮水印資訊， ),( jiwk 為第 k

個圖框之浮水印，由上式可以得知，最多可以有 n 個不同的浮水印。產生出多個

浮水印後，把視訊分成大致同圖框數的多個場景，把場景所有圖框經由 3D 離散

小波轉換之後，共有 n 個離散小波圖框，分別嵌入浮水印，流程圖見圖 2-15。

- 39 -

圖 2-15 Ying 3D 離散小波浮水印嵌入流程

嵌入公式為公式 2-8。

公式 2-8：

而擷取出流程圖的方法則採用 Cox 的 similarity 量測法，先將原視訊和可能

受到破壞的浮水印視訊做 3D 離散小波轉換，然後就轉換過係數後做比對，如公

式 2-9。

公式 2-9：

k

R∧

為浮水印視訊係數，k

F∧

為原視訊係數。即可擷取在 n 個圖框中相同位置

的浮水印資料，再經過與 A 及 B 二個二元字串做比對，便可判斷是否四嵌入的

浮水印。如下公式 2-10 所示。

公式 2-10：

- 40 -

2.2.6.3.2. 低頻係數對比對法

相對於利用直接修改法嵌入浮水印，Sun [25] 等人利用兩兩為一組的低頻係

數對的大小關係來嵌入浮水印。首先把視訊做 ICA 分解，得到 ICs (independent

components)，流程如圖 2-16。

圖 2-16 Sun ICA 浮水印嵌入流程

得到 ICs 後，再將相同位置的 IC 分為一組，選取其中有最大變異數的一組

為浮水印嵌入的媒介。轉換至離散小波頻率域後，分別對每個低頻係數做嵌入。

係數對中的另一個係數是把周圍 4 鄰居係數 (four neighboring coefficients) 做平

均，把要嵌入的係數和它周圍 4 鄰居係數平均做比對，總共會有四種變化，用一

個二元值做紀錄，嵌入方法如下公式 2-11。

- 41 -

公式 2-11：

nf 即為一二元值，紀錄係數和浮水印之間的關係。在擷取端一樣是把可能

受到破壞之後的係數和它周圍 4 鄰居係數平均做比對，再加上 nf 的資訊，即可

擷取嵌在視訊之中的浮水印，擷取方法如公式 2-12 所示。

公式 2-12：

2.2.6.3.3. 量化 super tree 法 [[26]

Wang 和 Lin 提出一個基於小波樹，且無需原圖的浮水印技術，利用量化係

數來嵌入浮水印。做法首先將原圖做四階 DWT 轉換得到頻率域資訊，並從其中

各階層係數中 (LL4 除外)，由最高到次低層，將屬於同一空間域區域的係數群

(如圖 2-17) 依照圖 2-18 (a) 的方式取出成為一群 (group)，並由兩個群構成一

個 super tree，如圖 2-18 (b)。

- 42 -

圖 2-17 分佈於同空間域區域之各階層係數關係圖

(b)

圖 2-18 (a)一個群中組成之係數的排列順序 (b)super tree

最後得到數組 super tree nT ， n =1,...,1536 。將這些 super tree 兩兩成對，

每對可代表一個位元的浮水印資訊，若浮水印為 0，則將第奇數個 super tree 以

一量化指數 nq 量化 (如下圖 2-19)；反之若為 1，則將第偶數個 tree 量化。

- 43 -

圖 2-19 super tree 係數之二元表示圖。 p2 表示其最重要位元平面 (MSB，Most

Significant Bit-plane)， 02 則為最不重要位元平面 (LSB，Least Significant

Bit-plane)，量化的過程中小於 nq 之位元階棄之，更改為零。

擷取浮水印時，不需原圖相關資訊，只要依照相同步驟，取出兩兩一組的

super tree，比較何者經過量化處理，即可得知此組所代表的浮水印位元為 1 或 0。

這個方法雖然有不需原圖 (blind) 的優勢，但也有著可嵌入資料量很小的缺點。

在視訊浮水印的範疇中，分為影像浮水印 (image watermarking) 和視訊浮水

印 (video watermarking)。因其二者的壓縮編碼都是採用離散餘弦轉換函式轉換

到頻率域，利用量化和可變長度編碼來壓縮資料，減少在空間域上的冗餘，所以

影像浮水印技術大都可移殖用於視訊浮水印技術上。

2.2.7. 視訊浮水印 (video watermarking)

把視訊浮水印視為影像浮水印的延伸，嚴格來講是不合理的，影像浮水印技

術用在視訊上，只是把視訊裡的每一個圖框當成是獨立的一張影像，但這在現實

面上實行有很多難處。首先，每一個圖框都嵌入浮水印的複雜度太高；另外，同

- 44 -

一個影像浮水印技術嵌入在每一個圖框，容易被統計分析出來。況且視訊在壓縮

上的特性，為了減少時間上的冗餘，採用如圖框間移動向量、可變長度編碼等，

這些部分都有浮水印研究的空間。本論文主要探討的浮水印技術即為視訊浮水印

技術。

視訊在時間上的冗餘，使得視訊浮水印能夠研究的方向多了移動向量及可變

長度編碼的部分。

2.2.7.1. 移動向量浮水印 (watermarking in motion vector)

在視訊壓縮的過程中，圖框並非都是採用圖框內 (intra-frame) 編碼的方

式，而是大量採用圖框間 (inter-frame) 編碼模式。例如 P 圖框及 B 圖框的使用，

利用己經編碼的圖框作移動向量預測 (motion prediction)、移動向量補償 (motion

compensation)，然後編碼目前區塊和參考區塊的差值 (prediction error)。所以在

做視訊浮水印時，可以在視訊壓縮過程編碼 P 圖框及 B 圖框時，對移動向量作

浮水印的嵌入。移動向量浮水印嵌入及擷取的演算法簡單具有很好的隱匿性，對

於一般視訊處理的破壞，由於並沒有直接影響到移動向量，所以也具強健性；最

大的缺點就在於只能把值做些微的改變，值的大量改變會導致移動向量預測不準

確，進而影響到視訊的品質。

- 45 -

2.2.7.1.1. 移動向量修改法

在 Zhang [27] 等學者的研究中，提出了直接修改移動向量以嵌入浮水印。

為了避免上述會使移動向量準確度嚴重下降的缺點，Zhang 在選擇要嵌入的移動

向量上有二個步驟。

首先是挑選大於門檻值的移動向量，選擇強度大的移動向量有其考量，以一

般性而言，移動向量強度小代表周圍都是相似的區塊，移動向量值的改變可能會

造成預測準確嚴重下降。

再第一步驟挑選出的移動向量，分別就其垂直移動向量和水平移動向量作角

度分析，若為銳角，則選擇在水平移動向量嵌入浮水印；反之若為鈍角，則選擇

在垂直移動向量嵌入浮水印；若為 o45 ，則水平和垂直移動向量都作嵌入，以減

少誤差作為考量。。嵌入的方法是把移動向量除二，是否和欲嵌入的浮水印位元

相同為依據，若相同，則保持係數未動，若不同，則加一變數使得移動向量除二

後和浮水印位元相同。

而在擷取的部分，只要針對移動向量大於門檻值的移動向量作角度分析，決

定浮水印在垂直或水平移動向量，取出藏於其中的浮水印。

2.2.7.1.2. 移動向量精確度調整法

相對於直接修改移動向量，Liu [28] 等人提出了以調整移動向量精確度來嵌

- 46 -

入浮水印。如圖 2-20 所示

圖 2-20 移動向量精確度嵌入選擇

藉由調整精確度，例如位元 0 則調整精確度為整精確度，位元 1 則調整為半

精確度，如此一個移動向量可以嵌入二個位元的值，如果浮水印嵌入的值為 01，

則可以調整移動向量在圖 2 或 7 的位置，選擇的方法則是採用一般移動向量預測

的方式，而範圍限於 2 及 7。整理如下圖 2-21。

圖 2-21 浮水印嵌入位元值與精確度對應表

擷取出浮水印的步驟，則是取得移動向量在半精確度時的位置，如果在圖 2

或 7 的位置，則顯而易見的，嵌入的浮水印是 01。

藉由這個方法，可以使得移動向量預測不致有太大誤差，但缺點在於能嵌入

- 47 -

的資料量有其限制。

2.2.7.2. 可變長度編碼浮水印 (watermarking in variable length coding)

可變長度編碼 (VLC，variable length coding) 浮水印，能夠直接在已壓縮的

視訊上做浮水印的嵌入，不需要經過解壓或部分解壓的過程，是其最大的優點。

而其缺點也在於能嵌入的資料量不多，因其本身就是毫無相關的一群位元資料，

並沒有過多的冗餘能讓浮水印有太多嵌入的空間。

2.2.7.2.1. VLC 係數 LSB 修改法

在 Langelaar [29] 等人的研究中，提出以直接修改 VLC 係數為嵌入浮水印

的方法。為了不使解碼過程中產生錯誤，以及增加 bit stream 的大小，選擇幾組

VLC 對，須滿足同樣長度的 run length 及相異大小的 level, 稱為

label-bit-carrying-VLC (lc-VLC)，如下圖 2-22 所示。

圖 2-22 lc-VLC 叢集

- 48 -

嵌入的方法是找出每個巨區塊之中的 lc-VLC，看 LSB 是否和欲嵌入的浮水

印位元一致，若相同則保持未動；不同，則修改 LSB 與浮水印位元同，重覆直

到浮水印嵌入完成，嵌入方法如圖 2-23。

圖 2-23 Langelaar VLC 嵌入法示意圖

擷取的方法，則是找出每個巨區塊中的 lc-VLC，觀察 LSB 的值即可取出藏

於其中的浮水印位元。

2.2.7.2.2. VLC 映對法

相對於 Langelaar 直接修改 VLC 值，Bijan [30] 採用 VLC 映對的方式嵌入浮

水印。首先把 VLC 表裡的所有 VLC 兩兩配對，依 VLC 對建樹，由於 VLC 碼各

自相異，所以配對起來的 VLC 對也是各自相異，假設 VLC 表裡有 N 個 VLC，

可以想見將會產生出 NN −2 個相異的 VLC 對，VLC 表：{10, 11, 011}，則 VLC

對：{1011, 10011, 1110, 11011, 01110, 01111}，如圖 2-24。

- 49 -

圖 2-24 未使用之 VLC 對

接著也把每個區塊使用到的 VLC 配對，然後把出現在區塊的 VLC 對從 VLC

表的樹刪掉，假設區塊 A: {10,011}和區塊 B：{11, 10}，則區塊 A 的 VLC 對：

{10011, 01110} 和區塊 B 的 VLC 對：{1011, 1110}，如圖 2-25。

圖 2-25 篩選未使用之 VLC 對

重覆到所有的區塊都檢查過，可以得到一系列未經使用的 VLC 對。嵌入的

方法為用偽隨機選取要嵌入二元浮水印位元的區塊，如果要嵌入的浮水印位元是

0，則保持 VLC 為未動，如果要嵌入的浮水印位元是 1，則把區塊裡的 VLC 對

轉換到還沒經使用過的 VLC 對，然後標示這個 VLC 對為已使用。轉換成為未經

- 50 -

使用的 VLC 對時，是選擇最相近的 VLC 對，以不改變 run length 單位為優先，

如圖 2-26 所示。

圖 2-26 VLC 對修改示意圖

在擷取部分，則是用偽隨機找出嵌入浮水印的區域，比對之前保留之未使用

VLC 的清單，如果有使用清單之中的 VLC，藏入的浮水印位元即為 1，如果沒

有，浮水印位元即為 0。這個方法的缺點也在於能藏入的資訊太少，而且也需要

額外的資訊來幫助擷取出浮水印。

2.3. 相關浮水印錯誤偵測與隱匿方法

數位浮水印大多用於多媒體文件的智慧財產權保護上，是取其強健式浮水印

的特性，不過近年來在易碎式浮水印的大量研究下，使浮水印於其它領域上的使

用愈見廣泛。浮水印應用於多媒體文件錯誤偵測和錯誤隱匿上，就是其中之一。

根據需求的不同，而使用易碎式或是強健式浮水印來達到效果。

- 51 -

2.3.1. 錯誤偵測

浮水印的資訊隱藏技術應用在錯誤偵測上，大都是採用浮水印中的易碎式浮

水印的方法。原理是在傳送方嵌入易碎式浮水印，當嵌入浮水印的視訊在經過易

錯頻道之後，在接收端擷取出隱藏的浮水印，根據擷取浮水印的狀況，來判斷是

否有錯誤發生，甚至找出錯誤發生的區域。所以在易碎式浮水印的選擇上，是儘

量使用具備簡單、易偵測、及易受破壞等性質的浮水印，而單位的選擇通常視其

需求為巨區塊或區塊。

2.3.1.1. Bartolini et al. [31]

Bartolini 等人實現視訊錯誤偵測的方法，是把易碎式浮水印嵌入己量化的

DCT 區塊係數。易碎式浮水印的嵌入是把所有位於位置門檻值後的 DCT 係數，

強制其值與其位置的奇偶數一致。如果係數位置為奇數，而值為偶數，其強制修

改係數值為奇數，如果相同，則不用修改其值。如下公式 2-13 所示。

公式 2-13：

位置門檻值的選擇是一個 trade-off 的關係，門檻值越高，浮水印對視訊品質

的傷害就愈小，但浮水印偵錯能力也愈小；反之則傷害愈大，浮水印偵錯能力也

愈強。在擷取浮水印偵測錯誤時，如果在門檻值後的 DCT 區塊係數，其位置和

- 52 -

值的奇偶不一致，就可以得知區塊發生錯誤。雖然是用於視訊上，但對於圖框內

及圖框間的編碼模式，浮水印的做法並沒有區別。

2.3.1.2. Chen et al. [32]

相比較於 Bartolini，Chen 同樣也將易碎式浮水印嵌入己量化的 DCT 區塊係

數，也設一位置門檻值，區塊係數位於門檻值後的嵌入浮水印。不同於根據位置

來決定浮水印的值，Chen 把位於門檻值後的 DCT 係數都強制修改為偶數。而在

擷取端，如果位於門檻值後的 DCT 係數其值不為偶數，則可判斷為受到攻擊，

受到破壞的區塊則可以得到定位。

限於使用的錯誤隱匿技術為移動時間性預測，當任一區塊偵測出有錯誤時，

整個巨區塊也被標示為錯誤巨區塊，受破壞的巨區塊用前一個圖框空間相對應的

巨區塊來代替，如果為圖框內圖框 (intra-frame)，則無法錯誤隱匿。同樣的，雖

然也是用於視訊上，但對於圖框內及圖框間的差異並沒有實現，浮水印的作法並

沒有分別。

2.3.1.3. Gao et al. [33]

不同於普遍使用易碎式浮水印實現錯誤偵測，Gao 等人卻是改採強健式浮水

印技術來實現錯誤偵測。使用的嵌入技術是調整移動向量精確度法，藉由調整移

動向量為整精度抑或半精度來嵌入浮水印位元，一個移動向量最多可嵌入二個位

- 53 -

元。

錯誤偵測方法是針對 MPEG-4 設計的，主要是利用其資料分割與可逆式可

變長度編碼的錯誤控制工具。由於資料分割，使得移動向量及預測誤差是分開編

碼的，而二者之中又以移動向量為較重要的資訊，所以選擇偵測移動向量錯誤。

在移動向量解碼中，通常會因為位元錯誤使得後續解碼的移動向量也為錯誤的資

訊，如圖 2-27 所示。

圖 2-27 位元錯誤導致視訊解碼錯誤示意圖

所以根據移動向量的四個相關資訊 S、CBPC、MVx、MVy，分別用二個位

元來表示，恰好是一個移動向量所能嵌入的資訊量。錯誤偵測的方法是把一個封

包的移動向量相關資訊，嵌入下一個封包的移動向量。但由於移動向量並不能負

荷所有的相關資訊，因此選擇根據移動向量的數量，每隔一個固定長度，檢查目

前位置上的移動向量相關資訊為哪一個，把表示位元嵌入下一個封包中，作用相

當於嵌入定位標記。

在擷取出浮水印的部分，根據嵌入時的固定長度，在每一個檢查位置檢查目

前位置上的移動向量資訊和擷取出來的移動向量資訊型態是否相等，如果不符，

就可得知在上一個檢查位置和目前檢查位置之間有錯誤產生，利用 MPEG-4 編

- 54 -

碼器實現的可逆式長度編碼隱匿錯誤。

2.3.2. 錯誤隱匿

浮水印應用在錯誤隱匿上，是把可供解碼端利用的還原資訊以浮水印技術嵌

在視訊中，跟錯誤偵測所需要的功能不同，因此通常是採用浮水印中的強健式浮

水印技術。原理是傳送方把相關的資訊當成浮水印以強健性浮水印方法嵌入，經

過易碎頻道時，浮水印不易被破壞，而能在接收端擷取出隱藏的浮水印資訊，再

根據後置作業實現還原操作的部分。

2.3.2.1. Chowdary et al. [34]

Chowdary 等人實現錯誤隱匿的方法，是將原影像以強健式浮水印技術嵌入

於原影像中。因其資料量太大，所以採用離散小波轉換及搖攝技術以取得黑白低

頻影像。嵌入過程是先將整張影像經過資料減少的前置處理，然後依 Cox 的 DCT

係數修改法嵌入處理過後的影像。

在接收端方面，因為擷取出來的浮水印為黑白低頻影像，所以先用反半調技

術及反離散小波轉換取得還原後的影像，視其影像中受破壞的區域以還原影像中

相對應的區域取代。雖然也適用於視訊中，不過並沒有針對圖框間作適當的調整。

- 55 -

2.3.2.2. Jie Song et al. [35]

Jie Song 等人實現了針對視訊壓縮的特性實作視訊錯誤隱匿技術。使用的嵌

入技術是調整移動向量精確度法。藉由利用他們自己稍早所提出的嵌入方法，一

個巨區塊最多可以嵌入二個位元的資料量，分別是設定 x 方向與 y 方向的精確度

為整精度或半精度來嵌入位元。

實現錯誤隱匿的方法是嵌入移動向量，將其用作為還原資訊。因為所需資料

量太大，嵌入方法所能嵌入的資料量不能負荷，所以採用嵌入移動向量的同位檢

查位元，如圖 2-28 所示。

圖 2-28 Parity Code 產生示意圖

把影像中所有巨區塊的移動向量以列排好，對一行中所有的移動向量以

XOR 操作以取得該行的移動向量同位元，在取得全部行的同位檢查位元後，以

調整移動向量精確度法嵌入下一張影像的移動向量內。

在接受端部分，擷取浮水印的步驟是將影像中所有巨區塊視其移動周量精確

度的選擇擷取出浮水印，組合起來即為上一張影像的移動向量同位元。因其還原

- 56 -

資訊為移動向量，所以錯誤隱匿單位為巨區塊。使用語意錯誤偵測得知受破壞的

巨區塊後，利用其它正確巨區塊的移動向量與擷取出來的移動向量同位元作

XOR 操作，即可得知受破壞的巨區塊其正確的移動向量，在用移動向量補償技

術即可得到還原的巨區塊影像資訊。

缺點在於只適用於上下二張影像都為圖框間編碼，對於圖框內錯誤隱匿方法

並沒提及，而其錯誤也只能限制在每一行只能有一個巨區塊發生錯誤。

2.3.2.3. Lie et al. [36]

Lie 提出了針對視訊的 I 圖框及 P 圖框的錯誤隱匿技術。做法相當於嵌入重

定位標記。以 I 圖框來講，因為所有組成的巨區塊都為 intra-coded MB，所以定

位標記為每個巨區塊的編碼長度，嵌入技術是將定位標記嵌入巨區塊的 DC 係數

的最低二個位元，而一個巨區塊共包含六個 DCT 區塊，所以能嵌入資料量為 12

個位元。以 P 圖框來講，因為組成的巨區塊包括了 intra-coded MB、inter-coded MB

和 skipped MB 型態，所以定位標記包含了二個，分別為在每個 intra-coded 或

inter-coded MB 後的 skipped MB 的長度及下一個非 skipped MB 的編碼長度，嵌

入技術則是選擇嵌入在第一、二個 AC 係數裡，採用設定奇偶數的方法來嵌入浮

水印。嵌入位置依圖框分別又有不同，如圖 2-29 及圖 2-30 所示。

- 57 -

圖 2-29 I 圖框巨區塊浮水印嵌入位置

圖 2-30 P 圖框巨區塊浮水印嵌入位置

I 圖框的巨區塊型態因為都為 intra-coded MB，所以採取的作法是把目前巨

區塊的定位資訊嵌入在上一列同一行的巨區塊，而第一列則因缺乏可嵌入的地方

而沒有嵌入動作，所以延遲編碼的時間為一列的時間。P 圖框則是把目前巨區塊

的定位資訊嵌入於上一個有預測誤差的巨區塊中，因為嵌入動作會造成巨區塊

CBR 有所改變，所以延遲編碼的時間為一個圖框的時間。

因擷取出的浮水印為編碼長度，所以也有錯誤偵測效用在的，藉由比較目前

巨區塊的編碼長度與擷取出的編碼長度，可以得知是否有受到攻擊。在實現錯誤

- 58 -

隱匿的方法上，是阻止錯誤繼續擴散。I 圖框如果有錯誤發生，則由上一個巨區

塊可以得知目前受破壞巨區塊的編碼長度，從而選擇從正確的位置開始下一個巨

區塊的解碼。P 圖框如果有錯誤發生，則可經由 skipped 巨區塊的數目，找到下

一個非 skipped 巨區塊開始解碼。

2.3.3. 錯誤偵測與隱匿

目前實現視訊錯誤偵測及隱匿整合的研究不多，多半是針對錯誤偵測或隱匿

擇一實現，或是實現單一影像的錯誤偵測及隱匿方法。原因之一就在於所需嵌入

資料量太多，或是二者一起實現並沒辦法取得良好效果。

2.3.3.1. Mehmet et al. [37]

Mehmet 提出了針對視訊所作的錯誤偵測及隱匿整合的方法，是利用空間域

最低位元置換法，雖然強健度不足，但有著最小失真及最大嵌入容量的優點。浮

水印資訊分別為還原資訊，定位資訊及錯誤偵測資訊。

錯誤偵測資訊是以區塊為單位，採用以最高位元置換最低位元法，像素的最

高位元為 0 或 1，強制最低位元為 0 或 1。定位資訊是巨區塊的垂直位置、水平

位置，及圖框的長寬及圖框的播放號碼等，用以在偵測出錯誤時，定位錯誤區塊

及圖框。還原資訊為整張圖框的影像資訊，由於嵌入所有的圖框影像是不可能實

現的，因此選擇關鍵圖框來做嵌入，為使還原資訊受到破壞的傷害減到最低，以

- 59 -

區塊為單位分割，經由多通道傳送 (multiple description coding) 及插序

(interleaving)，將還原資訊亂序分佈在視訊上，與錯誤偵測資訊和定位資訊以區

塊為單位編碼嵌入於同一區塊內。

由於資料量還是太大，所以並不是

Documents

國立中山大學資訊工程學系 碩士論文image.cse.nsysu.edu.tw/2006student/%B5x/%A8%CF%A5... · (國科會科學技術資料中心版本93.2.6) 本授權書所授權之論文為本人在

國立中山大學資訊工程學系碩士論文image.cse.nsysu.edu.tw/2006student/%B5x/%A8%CF%A5... · (國科會科學技術資料中心版本93.2.6) 本授權書所授權之論文為本人在