從時頻分析角度出發(fā)的魯棒數(shù)字音頻水印算法的制作方法

文檔序號：12736593閱讀：459來源：國知局

本發(fā)明涉及數(shù)字水印技術領域，主要是一種在時頻域尋找特征能量塊進行水印嵌入和提取的設計發(fā)明，特別涉及從時頻分析角度出發(fā)的魯棒音頻水印算法。

技術背景

隨著現(xiàn)代通信和多媒體技術的迅猛發(fā)展，數(shù)字多媒體產(chǎn)品越來越受歡迎，人們可以方便快捷地獲取各種數(shù)字化的圖像，音頻，視頻，動畫，軟件和文本等，數(shù)字多媒體產(chǎn)品的廣泛傳播也不可避免地帶來了不少安全問題，非法拷貝，版權破環(huán)，數(shù)字信息惡意篡改等。正因如此，一種可以有效保護數(shù)字多媒體產(chǎn)品的數(shù)字水印技術得到了研究者們的廣泛關注，同時也得到了迅速的發(fā)展。數(shù)字音頻水印技術主要通過在一段音頻中嵌入適當?shù)乃。苑奖惚Ｗo音頻文件的版權，防止有意篡改。魯棒音頻水印技術具有在音頻受到一系列攻擊，例如：加高斯白噪聲、再量化、幅度縮放、AAC壓縮、MP3壓縮、高低通濾波等，仍能有效提取水印以用于鑒別原始音頻文件的功能。近年來，對魯棒音頻水印技術的研究和改進成為了學術界和工業(yè)界廣泛關注和討論的話題。水印技術按照水印嵌入域來分，主要可分為原始域水印算法和變換域水印算法。對音頻水印技術而言，原始域即時域，時域水印算法是直接將水印嵌入在時間域的數(shù)字音頻信號中，這種方法相對于變換域水印算法而言具有容易實現(xiàn)，需要較少計算資源的特點，已有的文獻資料中存在有比較完善的時域水印算法，但是這樣的算法普遍存在對文件的壓縮和濾波不夠魯棒的缺點。變換域主要分為頻域和時頻域，現(xiàn)有大量的音頻水印算法都是在頻域中實現(xiàn)，已有的算法顯示，在頻域嵌入水印時，沒有考慮信號的時域特征，很難權衡主信號的不可感知性和水印的魯棒性的關系。目前為止，很少有文獻提出完整的時頻域水印算法，其實由于音頻信號的時變特性，通過時頻分析同時考慮信號的時域和頻域特征可以得到更多的信息，在時頻域嵌入水印也可以很好地解決不可感知性和魯棒性的權衡問題。

技術實現(xiàn)要素：

鑒于上述現(xiàn)有技術中存在的問題，本發(fā)明的目的是提出一種能夠有效權衡主信號的質(zhì)量和水印的魯棒性的時頻域音頻水印算法。

一種從時頻分析角度出發(fā)結合低能量特征塊選取的數(shù)字音頻水印算法，通過短時傅立葉變換在時頻域選擇低能量處嵌入水印實現(xiàn)水印對一般攻擊的魯棒性，包括以下步驟；

步驟1，水印嵌入位置的確定；

步驟2，水印的產(chǎn)生，嵌入；

步驟3，水印的檢測和提取；

所述步驟1和步驟2中，確定水印嵌入位置并進行水印嵌入的步驟如下：

第一步：將音頻信號分幀，每一幀進行希爾伯特變換消除信號對稱性；

第二步：對信號進行非重疊短時傅立葉變換得到時頻分布圖；

第三步：在時頻分布圖中挑選中低頻段進行加窗分塊，計算每一小塊的平均能量，按平均能量從小到大的順序排序，在能量處于排序前50％的前半段中隨機選出P塊作為水印嵌入的具體位置，保存位置下標索引；

第四步：將產(chǎn)生的隨機的二進制信息經(jīng)過擴頻碼擴頻，利用現(xiàn)有的改進擴頻通信技術進行水印嵌入，即利用擴展碼對水印信息進行擴頻再進行水印嵌入，在嵌入時通過引入調(diào)節(jié)常數(shù)α調(diào)整水印嵌入強度，以權衡音頻信號的質(zhì)量和嵌入水印的魯棒性，水印嵌入完成之后，將嵌有水印的時頻圖段代替主信號原來部分，并進行非重疊短時傅立葉逆變換得到嵌有水印的音頻信號；

所述步驟3中水印提取檢測的步驟如下：

第一步：對加水印音頻信號進行非重疊短時傅立葉變換，得到加水印信號的時頻分布圖；

第二步：根據(jù)嵌入方提供的特征能量塊下標索引找到水印嵌入位置，通過判斷擴展碼與嵌有水印信號特征能量塊矢量的內(nèi)積的正負性提取二進制水印，若內(nèi)積符號為正，則恢復水印信息為1，若內(nèi)積符號為負，則恢復水印信息為0。

所述步驟1中，水印嵌入位置的確定，具體包括以下步驟；

步驟1.1，對選取的音頻段x進行非重疊分幀處理，得到每幀包含M₀個樣本的x_i，對每一幀進行希爾伯特變換，以消除頻譜在2π范圍內(nèi)的對稱性，由于希爾伯特變換后的信號與原信號除了相位有所改變，其他的特性都不變，希爾伯特變換后的輸出值仍記為x_i；

步驟1.2，對得到的音頻信號進行非重疊短時傅立葉變換，得到信號的時頻表達式Y；這一過程通過對信號每一幀x_i做快速傅立葉變換實現(xiàn)；

步驟1.3，在信號的時頻域中選擇一段中低頻率區(qū)域作為可行的水印嵌入大范圍，頻率介于f₁＝60Hz和f₂＝2800Hz之間；

步驟1.4，對選定的水印嵌入大范圍進行加窗操作，用窗寬為W的矩形窗將選定的時頻區(qū)域分成多個正方形小塊；

步驟1.5，根據(jù)正方形小塊的平均能量大小隨機選擇能量較小的P小塊作為水印嵌入的具體位置，這些嵌入位置也叫特征能量塊，記錄特征能量塊在時頻圖中的具體下標索引并保存，以便發(fā)送給合法水印提取者。

所述步驟1.5中選擇P個特征能量塊的過程為，首先對選定時頻區(qū)域的所有正方形小塊求平均能量，根據(jù)能量從小到大的順序對正方形塊進行排序，在隊列的前50％能量塊中隨機選出P塊作為水印嵌入的特征塊。

所述步驟2中，水印的產(chǎn)生，嵌入，具體包括以下步驟；

步驟2.1，產(chǎn)生P位二進制隨機水印w∈{0,1}；

步驟2.2，將選定的每一個特征能量塊進行矢量化，得到特征矢量i∈{0,1,...,P-1},產(chǎn)生一個偽隨機序列作為擴展碼；

步驟2.3，利用改進的擴頻通信技術進行水印的嵌入：通過擴展碼p將水印信息進行擴頻嵌入，按照特征能量塊在水印嵌入大范圍的位置從上至下，從左至右，每一個特征矢量中嵌入一位水印；當水印取1時，嵌入+p，當水印取0時，嵌入-p，通過引入來消除主信號干擾；

步驟2.4，水印嵌入后，通過調(diào)節(jié)參數(shù)α來控制水印嵌入強度，取值為0＜α＜1，給定初始值α＝0.1，根據(jù)嵌入水印的不可感知性和魯棒性性能，按步長±0.01逐步調(diào)整α取值，直到水印的不可感知性和魯棒性得以權衡。所述步驟3中，水印的檢測和提取，具體包括以下步驟；

步驟3.1，水印提取的前幾個步驟和水印嵌入相同，將加有水印的音頻信號x_w經(jīng)過和步驟1.1，步驟1.2，和步驟1.4的操作后，得到分成多個小塊的時頻區(qū)域；

步驟3.2，根據(jù)水印嵌入方提供的水印嵌入位置的下標索引直接找到P塊嵌有水印的特征塊，對每一小塊進行矢量化，按列從上至下排列，通過判斷加水印矢量與擴頻碼的內(nèi)積關系恢復水印，得到恢復的水印序列

本發(fā)明的水印檢測方法為盲檢測方法，即無需知道原始音頻數(shù)據(jù)便可通過盲檢測得到水印，這樣的檢測方式更具有優(yōu)勢。

本發(fā)明通過在時頻域中尋找低能量特征能量塊的方法進行水印的嵌入和提取具有以下優(yōu)點：

(1)本發(fā)明從時頻域角度出發(fā)研究音頻信號，充分考慮音頻信號的時變特性，在時頻域中尋找若干小塊的水印嵌入?yún)^(qū)域，對音頻信號時間段的其他部分不造成影響，使水印嵌入的不可感知性增強；

(2)本發(fā)明選擇在時頻域中低頻段的低能量處嵌入水印，提高了水印的魯棒性，且在低能量部分隨機選擇嵌入能量塊的方法能有效防止惡意攻擊篡改；

(3)本發(fā)明采用改進的擴頻通信技術(ISS)進行水印嵌入和提取，有效避免了主信號干擾；

附圖說明

圖1為本發(fā)明數(shù)字音頻水印嵌入流程圖；

圖2為水印嵌入強度調(diào)節(jié)機制圖；

圖3為音頻信號樣本1特征能量塊選取過程圖；

圖4為音頻信號樣本1加水印前后波形圖的對比圖；

圖5為不加攻擊時圖像水印提取圖與原圖的對比圖；

圖6為不同攻擊下本發(fā)明方案和傳統(tǒng)DCT域水印方案圖像水印提取圖的對比圖。

具體實施方式

下面結合附圖和具體實施例詳細地說明本發(fā)明技術方案的實施步驟和效果。

本發(fā)明所提供的一種在時頻域中實現(xiàn)魯棒數(shù)字音頻水印嵌入和提取的方法主要可分為三部分：水印嵌入位置的確定；水印的產(chǎn)生和嵌入；水印的檢測和提取，具體流程如圖1所示。

首先，步驟1，水印嵌入位置的確定；

步驟1.1，對選取的包含N個樣本的音頻段x進行非重疊分幀處理，得到每幀包含M₀個樣本的x_i，對每一幀進行希爾伯特變換，以消除頻譜在2π范圍內(nèi)的對稱性，由于希爾伯特變換后的信號與原信號除了相位有所改變，其他的特性都不變，希爾伯特變換后的輸出值仍記為x_i；

步驟1.2，對得到的音頻信號進行非重疊短時傅立葉變換，得到信號的時頻表達式Y；這一過程通過對信號每一幀x_i做快速傅立葉變換實現(xiàn)，快速傅立葉變換矩陣用H表示；

y_i＝Hx_i,

步驟1.3，在信號的時頻域中選擇一段中低頻率區(qū)域作為可行的水印嵌入大范圍，頻率介于f₁＝60Hz和f₂＝2800Hz之間；

步驟1.4，對選定的水印嵌入大范圍進行加窗操作，用W×W的窗將選定的時頻區(qū)域分成若干正方形小塊，定義每一小塊為P_j，計算每一小塊的平均能量E_j，m₁,m₂表示每一小塊內(nèi)單個元素的橫縱坐標位置；

步驟1.5，根據(jù)能量從小到大的順序對正方形塊進行排序，在隊列的前50％能量塊中隨機選出P塊作為水印嵌入的具體位置，這些嵌入位置也叫特征能量塊，記錄特征能量塊在時頻圖中的具體下標索引并保存，以便發(fā)送給可靠的水印提取者；

步驟2，水印的產(chǎn)生，嵌入；

步驟2.1，產(chǎn)生P位二進制隨機水印w∈{0,1}；

步驟2.2，將選定的每一個特征能量塊進行矢量化，得到特征矢量i∈{0,1,...,P-1},產(chǎn)生一個偽隨機序列作為擴展碼；

步驟2.3，利用改進的擴頻通信技術進行水印的嵌入，按照特征能量塊在水印嵌入大范圍的位置從上至下，從左至右，每一個特征矢量中嵌入一位水印；當水印取1時，嵌入+p，當水印取0時，嵌入-p，改進的擴展頻譜通信技術(ISS)通過引入來消除主信號干擾，此時I取1，當I取0時為擴展頻譜通信技術(SS)；

f_w,i＝f_i+(αw(i)-IΦ)p

步驟2.4，通過參數(shù)0＜α＜1來控制水印嵌入強度，調(diào)節(jié)機制如圖2所示，給定初始值α＝0.1，根據(jù)嵌入水印的不可感知性和魯棒性性能，按步長±0.01逐步調(diào)整α取值，直到水印的不可感知性和魯棒性得以權衡；

步驟3，水印的檢測和提取；

步驟3.1，一段嵌有水印的音頻信號經(jīng)過一定的攻擊，例如：加噪，幅度縮放，AAC編碼，濾波，MP3壓縮，水印依然要能夠很好的存在且能提取出來，水印提取的步驟的前幾個步驟和水印嵌入相同，將加有水印的音頻信號x_w經(jīng)過和步驟1.1，步驟1.2，和步驟1.4的操作后，得到分成若干小塊的時頻區(qū)域；

步驟3.2，根據(jù)水印嵌入方提供的水印嵌入位置的下標索引直接找到P塊嵌有水印的特征塊，對每一小塊進行矢量化，按列從上至下排列，通過判斷加水印特征塊矢量與擴頻碼的內(nèi)積關系恢復水印，得到恢復的水印序列

其中表示取實部。

數(shù)字水印技術方案優(yōu)劣的評價指標：一個好的數(shù)字音頻水印發(fā)明方法，需要能夠較好地權衡音頻信號對水印嵌入的不可感知性和嵌入水印的魯棒性。

不可感知性：是指數(shù)字音頻信號加入水印后質(zhì)量仍較好，人耳對音頻加水印前后基本不可感知，通常可用客觀差異等級(ODG)來衡量，客觀差異等級分為5個等級：{-4，-3，-2，-1，0}，當ODG值為-4時表示主信號受到很大的干擾，十分嘈雜，當ODG值為0時表示加入的水印對主信號基本無影響，具有很好的不可感知性，一般ODG的值在-1到0之間時，表示此音頻加水印后有較好的不可感知性，符合標準。另一種不可感知性的衡量標準是將嵌入的水印視為加噪，用文檔水印比(DWR)來衡量，當DWR大于30dB時表示不可感知性較好。

魯棒性：是指水印信息嵌入至音頻之后，隨著音頻的一些變化，受到一些攻擊之后，水印是否還能很好地檢測提取的能力，通常的衡量標準是水印的檢測率(DR)，即經(jīng)過攻擊后檢測出的水印的正確位數(shù)與嵌入水印總數(shù)之比。

本發(fā)明的效果可通過以下仿真說明：

為了檢測本發(fā)明方案的魯棒性，仿真實驗對本發(fā)明測試的加水印音頻信號進行了一系列常規(guī)攻擊，例如：加高斯白噪聲，再量化，幅度縮放，AAC壓縮低通濾波等。

加高斯白噪聲：在加水印的音頻信號中加入高斯白噪聲，使得音頻信噪比為30dB；

再量化：將音頻信號從原來的16比特量化為8比特；

幅度縮放：數(shù)字音頻的幅度值被放大到120％和180％；

AAC壓縮：通過AAC壓縮將比特率變?yōu)?6kbps和160kbps；

低通濾波：采用截止頻率為4kHz的低通濾波；

仿真實驗1：選取四種不同類型的10s音頻信號通過本發(fā)明方法在時頻域頻率介于60Hz到2800Hz的頻率段內(nèi)選取16塊尺度為32×32的低能量特征塊，圖3表示了音頻信號樣本1選取低能量特征塊的過程，利用擴頻碼偽隨機序列將16位二進制水印一一嵌入至16塊特征能量塊中，用嵌有水印的特征能量塊代替原有能量塊，通過短時傅立葉逆變換得到加水印信號，如圖4所示的音頻信號樣本1原波形與加水印后的波形對比可看出加水印后波形幾乎無變化，對加水印音頻信號每次實施一種以上攻擊，每一種攻擊后進行水印檢測提取，計算水印檢測率，同時測試音頻信號加水印后的不可感知性。選取的四種音頻樣本分別進行以上操作，經(jīng)過多次實驗，得到的每種加水印音頻信號的ODG值和DWR值如表1所示，與傳統(tǒng)的通過離散余弦變換(DCT)在頻域上嵌入水印的效果對比，可證明本發(fā)明具有更好的不可感知性。表2為四種音頻信號樣本經(jīng)過不同類型攻擊后的水印檢測率，可證明本發(fā)明方案對于抵抗常規(guī)攻擊具有很強的魯棒性。

仿真實驗2：選取一段4分鐘的音頻信號作為主信號，將32×32位的二值圖像作為水印信息，利用本發(fā)明的音頻水印嵌入方案在音頻信號中低頻部分的時頻域中尋找32×32個特征能量塊，利用擴頻通信技術將圖片信息嵌入主音頻信號中，選擇三幅具有不同信息量的二值圖像分別進行實驗，圖5表示圖像水印原始圖像與嵌入后在無攻擊條件下提取得到的圖像的對比，可知在不加攻擊情況下圖像水印信息幾乎無任何損壞。對嵌有圖像水印的音頻信號施加常規(guī)攻擊，再提取出圖像水印，效果如圖6所示，本發(fā)明所提供的時頻域水印嵌入方案(STFT-ISS)相比于傳統(tǒng)頻域水印嵌入方案(DCT-ISS)有更好的效果，依然能夠保留圖片水印大部分信息，有好的辨識度。

通過以上兩種仿真實驗，本發(fā)明的效果得以證實。本文中所描述的具體實施例僅僅對本發(fā)明精神作舉例說明，本發(fā)明所屬技術領域的技術人員可通過對所描述的具體實施例中數(shù)據(jù)指標進行修改或用類似方法替代，例如修改選擇嵌入的頻率范圍、用其他方式實現(xiàn)時頻變換得到音頻信號的時頻表達式，這樣的修改替代并不會偏離本發(fā)明的精神或超越所附權利要求書所定義的范圍。

表1加水印音頻信號的不可感知性

表2本發(fā)明方案嵌入水印的檢測率(％)

完整全部詳細技術資料下載

當前第1頁1 2 3