麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

音頻信號時間尺度和頻率尺度縮放處理方法及設備的制作方法

文檔序號:2835978閱讀:666來源:國知局
專利名稱:音頻信號時間尺度和頻率尺度縮放處理方法及設備的制作方法
技術領域
本發明涉及音頻信號處理領域,特別涉及一種音頻信號時間尺度和頻率尺度縮放處理方法及設備。
背景技術
在各種多媒體應用中,調整音頻信號的時間尺度或頻率高低具有廣泛的需求。以調整重放速度為例,比如降低音頻信號的重放速度,即拉長信號的時間尺度,可以有助于有聽力或理解力障礙的人群提高聽音的可懂度,也有助于外語初學者的學習,提高音頻信號的重放速度,即壓縮信號的時間尺度可幫助聽者節省從錄音中獲取信息的時間;對音樂重放音速和音調的調整,還可以改變音樂的節奏和音色,獲得獨特的藝術效果;對于視頻中的伴音,音頻重放的音速調整,可以使得視頻在加快或放慢回放速度的同時,使觀眾可以聽到同步的,沒有發生畸變的伴音。直接對音頻進行播放速度調整,即改變播放的采樣率而不做其它任何處理,音頻的音調會隨著播放速度同步變化,造成音調和音色的變化。在降低音速時,聲音會變低沉; 在提高音速時,聲音會變得尖銳,語音則表現為如加快語速的童聲。為了能夠讓音頻播放速度和音調互相獨立調整,需要對音頻信號進行處理。傳統的數字音頻變速算法中,重疊相加(overlap add)技術可以實現音頻時間尺度的獨立變化,保留原有音調音色,但如果不進行波形的相似程度檢測來確定重疊相加的時延,這種方法會帶來幀連接處的相位不連續,從而引入一些節拍效應。而波形檢測方法具有較強局限性,首先它的計算量較高,其次它只能處理具有明顯穩定基音周期的信號。傳統的時頻變換算法可以處理包括語音和音樂的通用音頻(general audio),它對時域上的原始數字音頻進行重采樣以變換采樣率,然后將改變了采樣率的數字音頻轉換到頻域,獲得數字音頻的頻譜,隨后對頻譜進行頻譜搬移(frequency shift),將處理后的頻譜變換回時域,這個算法一般用短時傅里葉變換(short time Fourier transform)實現。為能獲得較高的處理音質,這類算法的短時傅里葉變換需要一次處理較長的音頻,其計算量和存儲量較大,并且對于幀間相位不連續也沒有解決方法,處理音質受到很大限制。更多關于數字信號音頻變速處理的技術方案可以參考公開號為CN101202048A公開的“語音變速的方法”的專利申請文件,然而仍舊沒有解決上述問題。

發明內容
本發明解決的問題是提供一種復雜度較低,處理質量高的音頻信號時間尺度和頻率尺度縮放處理方法及設備。為解決上述問題,本發明實施例提供一種音頻信號時間尺度和頻率尺度縮放處理方法,包括對輸入音頻信號進行采樣以生成待處理音頻時域信號,其中所述待處理音頻時域信號的幀間間隔為L,每幀包括N個采樣點;將所述待處理音頻時域信號轉換成待處理音頻頻域信號;獲取所述待處理音頻頻域信號的頻率和幅度;獲取目標音頻頻域信號的重建頻率和重建幅度;其中,按照變換率控制參數將所述待處理音頻信號的頻率轉換為目標音頻頻域信號的重建頻率;按照增益控制參數將所述待處理音頻信號的幅度轉換為目標音頻頻域信號的重建幅度;將具備所述重建頻率和重建幅度的目標音頻頻域信號轉換成目標音頻時域信號;對所述目標音頻時域信號進行重疊累加,得到輸出點數為M的輸出音頻信號, 其中,M不大于N/2。可選地,所述對輸入音頻信號進行采樣以生成待處理音頻時域信號包括基于所述輸入音頻信號組成相同幀長和相同采樣點數目的第一向量和第二向量,其中所述第二向量和所述第一向量之間具有固定采樣點的延遲。可選地,所述固定采樣點小于等于所述幀間間隔的采樣點。可選地,所述將所述待處理音頻時域信號轉換成待處理音頻頻域信號包括對所述第一向量和第二向量分別作加窗離散傅里葉變換,得到相對應的第一頻域信號和第二頻域信號。可選地,所述加窗離散傅里葉變換所使用的窗函數是漢明窗或者漢寧窗。可選地,所述獲取所述待處理音頻頻域信號的頻率和幅度包括分別對所述第一頻域信號和所述第二頻域信號進行極坐標轉換,以得到所述第一頻域信號的第一相位和第一幅度以及所述第二頻域信號的第二相位和第二幅度;基于所述第一相位與所述第二相位之間的相位差計算所述待處理音頻頻域信號的頻率;根據所述第一幅度和/或所述第二幅度確定所述待處理音頻頻域信號的幅度。可選地,所述獲取目標音頻頻域信號的重建頻率和重建幅度包括當所述待處理音頻信號的多個原索引處的頻率映射到同一個所述目標音頻信號的新索引處時,則所述目標音頻頻域信號在新索引處的重建幅度是根據所述增益控制參數和所述待處理音頻信號在多個原索引處的幅度之和確定的;當所述待處理音頻信號的多個原索引處的頻率映射到同一個所述目標音頻信號的新索引處時,則所述目標音頻頻域信號在新索引處的重建頻率是根據所述變換率控制參數和所述待處理音頻信號中幅度最大的原索引處對應的頻率確定的。可選地,原索引處的信號頻率變換到所述目標音頻頻域信號在新索引處的重建頻率時,所述原索引處的信號需要映射到新索引處,其中所述新索引的取值范圍在
。可選地,所述將具備所述重建頻率和重建幅度的目標音頻頻域信號轉換成目標音頻時域信號包括根據所述目標音頻信號在新索引處的重建頻率以及前一幀的重建相位確定當前幀的重建相位,其中所述重建相位的初始值為零;根據所述目標音頻信號的當前幀的重建相位和重建幅度進行直角坐標轉換,以獲得重建頻域信號;基于所述重建頻域信號作逆加窗離散傅里葉變換得到目標時域信號。可選地,所述逆加窗離散傅里葉變換所使用的窗函數是漢明窗或者漢寧窗。本發明實施例還提供了一種音頻信號時間尺度和頻率尺度縮放處理設備,包括信號采樣模塊,用于對輸入音頻信號進行采樣以生成待處理音頻時域信號,其中所述待處理音頻時域信號的幀間間隔為L,每幀包括N個采樣點;第一時頻轉換模塊,用于將所述待處理音頻時域信號轉換成待處理音頻頻域信號;第一處理模塊,用于獲取所述待處理音頻頻域信號的頻率和幅度;第二處理模塊,用于獲取目標音頻頻域信號的重建頻率和重建幅度;其中,按照變換率控制參數將所述待處理音頻信號的頻率轉換為目標音頻頻域信號的重建頻率;按照增益控制參數將所述待處理音頻信號的幅度轉換為目標音頻頻域信號的重建幅度;第二時頻轉換模塊,用于將具備所述重建頻率和重建幅度的目標音頻頻域信號轉換成目標音頻時域信號;信號輸出模塊,對所述目標音頻時域信號進行重疊累加, 得到輸出點數為M的輸出音頻信號,其中,M不大于N/2。可選地,所述信號采樣模塊用于基于所述輸入音頻信號組成相同幀長和相同采樣點數目的第一向量和第二向量,其中所述第二向量和所述第一向量之間具有固定采樣點的延遲。可選地,所述固定采樣點小于等于所述幀間間隔的采樣點。可選地,所述第一時頻轉換模塊包括對所述第一向量和第二向量分別作加窗離散傅里葉變換,得到相對應的第一頻域信號和第二頻域信號。可選地,所述加窗離散傅里葉變換所使用的窗函數是漢明窗或者漢寧窗。可選地,所述第一處理模塊包括極坐標轉換模塊,用于分別對所述第一頻域信號和所述第二頻域信號進行極坐標轉換,以得到所述第一頻域信號的第一相位和第一幅度以及所述第二頻域信號的第二相位和第二幅度;頻率計算模塊,用于基于所述第一相位與所述第二相位之間的相位差計算所述待處理音頻信號的頻率;幅度計算模塊,用于根據所述第一幅度和/或所述第二幅度確定所述待處理音頻信號的幅度。可選地,所述第二處理模塊包括重建幅度確定模塊,用于當所述待處理音頻信號的多個原索引處的頻率映射到同一個所述目標音頻信號的新索引處時,則在所述目標音頻信號在新索引處的重建幅度是根據所述增益控制參數和所述待處理音頻信號在多個原索引處的幅度之和確定的;重建頻率確定模塊,用于當所述待處理音頻信號的多個原索引處的頻率映射到同一個所述目標音頻信號的新索引處時,則在所述目標音頻信號在新索引處的重建頻率是根據所述變換率控制參數和所述待處理音頻信號中幅度最大的原索引處對應的頻率確定的。可選地,原索引處的信號頻率變換到所述目標音頻信號在新索引處的重建頻率時,所述原索引處的信號需要映射到新索引處,其中所述新索引的取值范圍在
。可選地,所述第二時頻轉換模塊包括重建相位確定模塊,根據所述目標音頻信號在新索引處的重建頻率以及前一幀的重建相位確定當前幀的重建相位,其中所述重建相位的初始值為零;直角坐標轉換模塊,用于根據所述目標音頻信號的當前幀的重建相位和重建幅度進行直角坐標轉換,以獲得重建頻域信號;逆加窗處理模塊,用于基于所述重建頻域信號作逆加窗離散傅里葉變換得到目標時域信號。可選地,所述逆加窗離散傅里葉變換所使用的窗函數是漢明窗或者漢寧窗。
與現有技術相比,本發明技術方案具有以下有益效果本發明對輸入音頻信號經過間隔采樣生成幀間間隔為L,每幀包括N個采樣點的待處理音頻時域信號,再將待處理音頻時域信號通過加窗離散傅里葉變換轉換成待處理音頻頻域信號,并獲得頻率和幅度。進一步地,通過分別控制變換率控制參數和增益控制參數獲取目標音頻頻域信號的重建頻率和重建幅度,再通過逆加窗離散傅里葉變換將目標音頻頻域信號轉換成目標音頻時域信號,最后經過重疊累加輸出獲得輸出點數為M的輸出音頻信號。本技術方案的實施方式復雜度較低、且處理質量高,并且可以獨立調節音頻信號的時間尺度和頻率尺度。


圖1是本發明的一種音頻信號時間尺度和頻率尺度縮放處理方法的具體實施方式
的流程示意圖;圖2是本發明的一種音頻信號時間尺度和頻率尺度縮放處理的具體實施例中詩歌朗誦的原始頻譜圖;圖3至圖7是基于圖2所示的具體實施例中分別對詩歌朗誦進行頻率尺度和時間尺度調節后的頻譜圖;圖8是本發明的一種音頻信號時間尺度和頻率尺度縮放處理的具體實施例中音樂的原始頻譜示意圖;圖9是基于圖8所示的具體實施例中對音樂進行頻率尺度和時間尺度調節后的頻譜圖;圖10是本發明的一種音頻信號時間尺度和頻率尺度縮放處理設備的具體實施例的結構示意圖。
具體實施例方式針對現有技術的間題,發明人經過研究,提供了一種音頻信號時間尺度和頻率尺度縮放處理方法以及相應的音頻信號時間尺度和頻率尺度縮放處理設備。本技術方案的實施方式復雜度較低、且處理質量高,并且可以獨立調節音頻信號的時間尺度和頻率尺度。為使本發明的上述目的、特征和優點能夠更為明顯易懂,下面結合附圖對本發明的具體實施方式
做詳細的說明。如圖1所示的是本發明的一種音頻信號時間尺度和頻率尺度縮放處理方法的具體實施方式
的流程示意圖。參考圖1,所述音頻信號時間尺度和頻率尺度縮放處理方法包括步驟Sl 對輸入音頻信號進行采樣以生成待處理音頻時域信號,其中所述待處理音頻時域信號的幀間間隔為L,每幀包括N個采樣點。具體地,所述輸入音頻信號是數字信號,其中所述幀間間隔是指對所述輸入音頻信號進行采樣的間隔,即對所述輸入音頻信號采樣的相鄰兩幀的幀間間隔。進一步地,在本實施例中,本步驟包括基于所述輸入音頻信號組成相同幀長和相同采樣點數目的第一向量和第二向量,其中所述第二向量和所述第一向量之間具有固定采樣點的延遲;其中所述固定采樣點小于等于所述幀間間隔的采樣點。
例如,設輸入信號為x(t),將輸入信號按所述幀間間隔L組成幀長為N(即N個采樣點)的向量x(n)和χ’(n),其中向量 χ (η) = [χ (nL+1),χ (nL+2),. . .,χ (nL+N)];向量χ,(η) = [χ (nL+1-K),χ (nL+2_K),…,χ (nL+N-K)],其中 η 是幀序號,K 是固定采樣點,K的取值較小,通常要求小于等于L,根據向量χ(η)和χ’ (η)的表達式可以看出,當 K = L 時,χ,(n) = x(n-l)。步驟S2 將所述待處理音頻時域信號轉換成待處理音頻頻域信號。具體地,在本實施例中,所述將所述待處理音頻時域信號轉換成待處理音頻頻域信號包括對所述第一向量和第二向量分別作加窗離散傅里葉變換,得到相對應的第一頻域信號和第二頻域信號。沿用上述步驟Sl的例子,分別對所述向量χ (η)和χ’ (η)作加窗離散傅里葉變換。 首先,作加窗的過程為xw (η) = χ (η) · hana = [χ (nL+1) hana (0),χ (nL+2) hana(l),· · ·,χ (nL+N) hma (N-I)];x,w(n) = χ,(η) · hana = [χ (nL+l-K) hana (0),x(nL+2-K)hana(l), ... , χ (nL+N-K) hma (N-I)];其中h_是所述加窗離散傅里葉變換所使用的窗函數,所述窗函數也是N點的分析窗函數,在本實施例中,一般使用漢明窗(Hamming)或者漢寧窗(Harming),但實際應用中不限于此。
程為
然后,對已經過加窗變換的向量Xw(η)和X’w(n)作離散傅里葉變換(DFT),變換過
.2π1}X ㈨i =[Xr(n)[k] + jXr(n)[k]
/二O
-i—lkρΝ =[Xr\n\k] +JX1Xn)
1=0其中k = 0,1,2,· · ·,Ν/2。由于所述輸入音頻信號是實數信號,N點的離散傅里葉變換(DFT)得到的DFT譜只需要保留前Ν/2+1點,因為實數DFT譜具有共軛對稱性。下標[k]表示向量的第k元素。 進一步地,當K = L時,由于X’(n) = X(n-l),因此只需要計算得出X(n) [k]的結果即可,省去了一次DFT計算。步驟S3 獲取所述待處理音頻頻域信號的頻率和幅度。具體地,本步驟包括1)分別對所述第一頻域信號和所述第二頻域信號進行極坐標轉換,以得到所述第一頻域信號的第一相位和第一幅度以及所述第二頻域信號的第二相位和第二幅度;幻基于所述第一相位與所述第二相位之間的相位差計算所述待處理音頻頻域信號的頻率;幻根據所述第一幅度和/或所述第二幅度確定所述待處理音頻頻域信號的幅度。繼續沿用上述步驟S2的例子,具體地,首先分別對X (n) [k]和X’ (η) [k]進行直角坐標到極坐標的轉換,轉換過程如下
+ y.X>) J = Xa ( 嚴㈨⑷
需要說明的是,其中)(A(n) [k],XA' (η) [k]是幅度部分,即)(A(n) [k]是所述第一頻域信號的第一幅度,)(/ (n) [k]是所述第二頻域信號的第二幅度。通常所述第一幅度和第二幅度近似相等,在本實施例中,可以任意選擇其中一個幅度作為所述待處理音頻頻域信號的幅度,兩者間的細微差異并不影響后續計算步驟的實現。其中,)CP(n) [k],Xp' (η) [k]是相位部分,即)CP(n) [k]是所述第一頻域信號的第一相位, Xp' (n) [k]是所述第二頻域信號的第二相位。然后,利用所述第一頻域信號的第一相位)CP(n) [k]與所述第二頻域信號的第二相位)(/ (n) [k]之間的相位差計算所述待處理音頻頻域信號的頻率。具體過程如下計算相位差Pdelta(n) [k] = Xp(η) [k]-XP' (η) [k],其中,k = 0,1,2,· · ·,Ν/2,并令整數約束殘差為res [χ] = x-r0und[x],其中round□表示四舍五入取整,即round[X]= int[x+0. 5],則所述待處理音頻頻域信號的頻率為
# 「KTXF(n\k]=k + — YQS Pdelta(W)m-^-,其中』=0,1,2,...^/2。
K [_Iy _接著,根據所述第一頻域信號的第一幅度和/或所述第二頻域信號的第二幅度確定所述待處理音頻頻域信號的幅度。正如上文所述,通常所述第一幅度和第二幅度近似相等,因此在本實施例中,可以任意選擇其中一個幅度作為所述待處理音頻頻域信號的幅度, 兩者間的細微差異并不影響后續計算步驟的實現;或者也可以根據所述第一幅度和第二幅度的平均值來確定所述待處理音頻頻域信號的幅度,本領域技術人員可以根據實際需要選擇較佳的計算方式來確定所述待處理音頻頻域信號的幅度。步驟S4:獲取目標音頻頻域信號的重建頻率和重建幅度;其中,按照變換率控制參數將所述待處理音頻信號的頻率轉換為目標音頻頻域信號的重建頻率;按照增益控制參數將所述待處理音頻信號的幅度轉換為目標音頻頻域信號的重建幅度。具體地,根據上述步驟S3確定的所述待處理音頻信號的幅度和頻率進行處理,基于如下三個原則1)索引隨頻率映射原則,即原索引k處的信號頻率)CF(n) [k]變換到所述目標音頻信號在新索引處的重建頻率rkXF(n)[k]時,所述原索引k處的信號需要映射到新索引k’ = round[rkXF(n) [k]]處,其中Α為變換率控制參數;進一步地,在本實施例中,所述新索引k’ 的取值范圍在
,若新索引k’的取值不在上述取值范圍內,則放棄該映射。2)幅度累加原則,即當所述待處理音頻信號的多個原索引(例如
10處的頻率映射到同一個所述目標音頻頻域信號的新索引k’ =round[rklXF(n) [kl]]= round[rk2XF(n) [k2]]處時,則在所述目標音頻頻域信號在新索引k’處的重建幅度是原索引 Ic1和k2處的幅度之和,即重建幅度Xka(η) γ] = &0CA(n)[kl]+XA(n)[k2]),其中gk是增益控制參數。3)頻率隨最大幅度原則,即對于多個原索引(例如映射到同一所述目標音頻頻域信號的新索引 k’ = round[rklXF(n) [kl]] = round[rk2XF(η) [k2]],假設令、(η) [kj > =Xa(η) [1 ],即原索引Ic1對應信號的幅度大于1 對應信號的幅度,則新索引k’處的重建頻率)(KF(n) [k>]將是原索引Ii1對應的變換頻率,即I^1Xf(II) [kl]。因此,根據上述三個原則,可以獲取所述目標音頻頻域信號的重建頻率和重建幅度。步驟S5 將具備所述重建頻率和重建幅度的目標音頻頻域信號轉換成目標音頻時域信號。具體地,本步驟包括1)根據所述目標音頻信號在新索引處的重建頻率以及前一幀的重建相位確定當前幀的重建相位,其中所述重建相位的初始值為零;幻根據所述目標音頻信號的當前幀的重建相位和重建幅度進行直角坐標轉換,以獲得重建頻域信號;3)基于所述重建頻域信號作逆加窗離散傅里葉變換得到目標時域信號。繼續沿用上述步驟S3和步驟S4的例子,具體地,首先確定當前幀的重建相位, 令前一幀的相位是Xkp(n-1),目標音頻時域信號的輸出點數為M,那么當前幀的重建相位 Xep(η)可以由如下方式得到
權利要求
1.一種音頻信號時間尺度和頻率尺度縮放處理方法,其特征在于,包括對輸入音頻信號進行采樣以生成待處理音頻時域信號,其中所述待處理音頻時域信號的幀間間隔為L,每幀包括N個采樣點;將所述待處理音頻時域信號轉換成待處理音頻頻域信號;獲取所述待處理音頻頻域信號的頻率和幅度;獲取目標音頻頻域信號的重建頻率和重建幅度;其中,按照變換率控制參數將所述待處理音頻信號的頻率轉換為目標音頻頻域信號的重建頻率;按照增益控制參數將所述待處理音頻信號的幅度轉換為目標音頻頻域信號的重建幅度;將具備所述重建頻率和重建幅度的目標音頻頻域信號轉換成目標音頻時域信號;對所述目標音頻時域信號進行重疊累加,得到輸出點數為M的輸出音頻信號,其中,M 不大于N/2。
2.根據權利要求1所述的音頻信號時間尺度和頻率尺度縮放處理方法,其特征在于, 所述對輸入音頻信號進行采樣以生成待處理音頻時域信號包括基于所述輸入音頻信號組成相同幀長和相同采樣點數目的第一向量和第二向量,其中所述第二向量和所述第一向量之間具有固定采樣點的延遲。
3.根據權利要求2所述的音頻信號時間尺度和頻率尺度縮放處理方法,其特征在于, 所述固定采樣點小于等于所述幀間間隔的采樣點。
4.根據權利要求2所述的音頻信號時間尺度和頻率尺度縮放處理方法,其特征在于, 所述將所述待處理音頻時域信號轉換成待處理音頻頻域信號包括對所述第一向量和第二向量分別作加窗離散傅里葉變換,得到相對應的第一頻域信號和第二頻域信號。
5.根據權利要求4所述的音頻信號時間尺度和頻率尺度縮放處理方法,其特征在于, 所述加窗離散傅里葉變換所使用的窗函數是漢明窗或者漢寧窗。
6.根據權利要求4所述的音頻信號時間尺度和頻率尺度縮放處理方法,其特征在于, 所述獲取所述待處理音頻頻域信號的頻率和幅度包括分別對所述第一頻域信號和所述第二頻域信號進行極坐標轉換,以得到所述第一頻域信號的第一相位和第一幅度以及所述第二頻域信號的第二相位和第二幅度;基于所述第一相位與所述第二相位之間的相位差計算所述待處理音頻頻域信號的頻率;根據所述第一幅度和/或所述第二幅度確定所述待處理音頻頻域信號的幅度。
7.根據權利要求1所述的音頻信號時間尺度和頻率尺度縮放處理方法,其特征在于, 所述獲取目標音頻頻域信號的重建頻率和重建幅度包括當所述待處理音頻信號的多個原索引處的頻率映射到同一個所述目標音頻頻域信號的新索引處時,則所述目標音頻頻域信號在新索引處的重建幅度是根據所述增益控制參數和所述待處理音頻信號在多個原索引處的幅度之和確定的;當所述待處理音頻信號的多個原索引處的頻率映射到同一個所述目標音頻頻域信號的新索引處時,則所述目標音頻頻域信號在新索引處的重建頻率是根據所述變換率控制參數和所述待處理音頻信號中幅度最大的原索引處對應的頻率確定的。
8.根據權利要求7所述的音頻信號時間尺度和頻率尺度縮放處理方法,其特征在于,原索引處的信號頻率變換到所述目標音頻頻域信號在新索引處的重建頻率時,所述原索引處的信號需要映射到新索引處,其中所述新索引的取值范圍在

9.根據權利要求7所述的音頻信號時間尺度和頻率尺度縮放處理方法,其特征在于, 所述將具備所述重建頻率和重建幅度的目標音頻頻域信號轉換成目標音頻時域信號包括根據所述目標音頻信號在新索引處的重建頻率以及前一幀的重建相位確定當前幀的重建相位,其中所述重建相位的初始值為零;根據所述目標音頻信號的當前幀的重建相位和重建幅度進行直角坐標轉換,以獲得重建頻域信號;基于所述重建頻域信號作逆加窗離散傅里葉變換得到目標時域信號。
10.根據權利要求9所述的音頻信號時間尺度和頻率尺度縮放處理方法,其特征在于, 所述逆加窗離散傅里葉變換所使用的窗函數是漢明窗或者漢寧窗。
11.一種音頻信號時間尺度和頻率尺度縮放處理設備,其特征在于,包括信號采樣模塊,用于對輸入音頻信號進行采樣以生成待處理音頻時域信號,其中所述待處理音頻時域信號的幀間間隔為L,每幀包括N個采樣點;第一時頻轉換模塊,用于將所述待處理音頻時域信號轉換成待處理音頻頻域信號;第一處理模塊,用于獲取所述待處理音頻頻域信號的頻率和幅度;第二處理模塊,用于獲取目標音頻頻域信號的重建頻率和重建幅度;其中,按照變換率控制參數將所述待處理音頻信號的頻率轉換為目標音頻頻域信號的重建頻率;按照增益控制參數將所述待處理音頻信號的幅度轉換為目標音頻頻域信號的重建幅度;第二時頻轉換模塊,用于將具備所述重建頻率和重建幅度的目標音頻頻域信號轉換成目標音頻時域信號;信號輸出模塊,對所述目標音頻時域信號進行重疊累加,得到輸出點數為M的輸出音頻信號,其中,M不大于N/2。
12.根據權利要求11所述的音頻信號時間尺度和頻率尺度縮放處理設備,其特征在于,所述信號采樣模塊用于基于所述輸入音頻信號組成相同幀長和相同采樣點數目的第一向量和第二向量,其中所述第二向量和所述第一向量之間具有固定采樣點的延遲。
13.根據權利要求12所述的音頻信號時間尺度和頻率尺度縮放處理設備,其特征在于,所述固定采樣點小于等于所述幀間間隔的采樣點。
14.根據權利要求12所述的音頻信號時間尺度和頻率尺度縮放處理設備,其特征在于,所述第一時頻轉換模塊用于對所述第一向量和第二向量分別作加窗離散傅里葉變換,得到相對應的第一頻域信號和第二頻域信號。
15.根據權利要求14所述的音頻信號時間尺度和頻率尺度縮放處理設備,其特征在于,所述加窗離散傅里葉變換所使用的窗函數是漢明窗或者漢寧窗。
16.根據權利要求14所述的音頻信號時間尺度和頻率尺度縮放處理設備,其特征在于,所述第一處理模塊包括極坐標轉換模塊,用于分別對所述第一頻域信號和所述第二頻域信號進行極坐標轉換,以得到所述第一頻域信號的第一相位和第一幅度以及所述第二頻域信號的第二相位和第二幅度;頻率計算模塊,用于基于所述第一相位與所述第二相位之間的相位差計算所述待處理音頻信號的頻率;幅度計算模塊,用于根據所述第一幅度和/或所述第二幅度確定所述待處理音頻信號的幅度。
17.根據權利要求11所述的音頻信號時間尺度和頻率尺度縮放處理設備,其特征在于,所述第二處理模塊包括重建幅度確定模塊,用于當所述待處理音頻信號的多個原索引處的頻率映射到同一個所述目標音頻信號的新索引處時,則所述目標音頻信號在新索引處的重建幅度是根據所述增益控制參數和所述待處理音頻信號在多個原索引處的幅度之和確定的;重建頻率確定模塊,用于當所述待處理音頻信號的多個原索引處的頻率映射到同一個所述目標音頻信號的新索引處時,則所述目標音頻信號在新索引處的重建頻率是根據變換率控制參數和所述待處理音頻信號中幅度最大的原索引處對應的頻率確定的。
18.根據權利要求17所述的音頻信號時間尺度和頻率尺度縮放處理設備,其特征在于,原索引處的信號頻率變換到所述目標音頻信號在新索引處的重建頻率時,所述原索引處的信號需要映射到新索引處,其中所述新索引的取值范圍在

19.根據權利要求17所述的音頻信號時間尺度和頻率尺度縮放處理方法,其特征在于,所述第二時頻轉換模塊包括重建相位確定模塊,根據所述目標音頻信號在新索引處的重建頻率以及前一幀的重建相位確定當前幀的重建相位,其中所述重建相位的初始值為零;直角坐標轉換模塊,用于根據所述目標音頻信號的當前幀的重建相位和重建幅度進行直角坐標轉換,以獲得重建頻域信號;逆加窗處理模塊,用于基于所述重建頻域信號作逆加窗離散傅里葉變換得到目標時域信號。
20.根據權利要求19所述的音頻信號時間尺度和頻率尺度縮放處理設備,其特征在于,所述逆加窗離散傅里葉變換所使用的窗函數是漢明窗或者漢寧窗。
全文摘要
一種音頻信號時間尺度和頻率尺度縮放處理方法及設備,其中所述音頻信號時間尺度和頻率尺度縮放處理方法包括對輸入音頻信號進行采樣以生成待處理音頻時域信號,其中待處理音頻時域信號的幀間間隔為L,每幀包括N個采樣點;將待處理音頻時域信號轉換成待處理音頻頻域信號;獲取待處理音頻頻域信號的頻率和幅度;獲取目標音頻頻域信號的重建頻率和重建幅度;將具備重建頻率和重建幅度的目標音頻頻域信號轉換成目標音頻時域信號;對目標音頻時域信號進行重疊累加,得到輸出點數為M的輸出音頻信號,其中,M不大于N/2。本技術方案的實施方式復雜度較低、且處理質量高,并且可以獨立調節音頻信號的時間尺度和頻率尺度。
文檔編號G10L21/04GK102419981SQ20111034217
公開日2012年4月18日 申請日期2011年11月2日 優先權日2011年11月2日
發明者吳晟, 張本好, 徐晶明, 李曇, 林福輝 申請人:展訊通信(上海)有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 白朗县| 香格里拉县| 青浦区| 龙岩市| 都兰县| 资溪县| 休宁县| 临武县| 河津市| 文山县| 湾仔区| 巢湖市| 乐亭县| 德兴市| 沂水县| 禄丰县| 漾濞| 铁力市| 娄底市| 堆龙德庆县| 保定市| 建湖县| 四会市| 罗甸县| 米泉市| 巫溪县| 大姚县| 宝兴县| 云龙县| 连平县| 内乡县| 广水市| 全州县| 屏山县| 揭东县| 宁南县| 泸定县| 项城市| 邵武市| 建水县| 凤阳县|