專利名稱:基于窗函數(shù)共振峰增強(qiáng)的語音增強(qiáng)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語言處理領(lǐng)域,具體地,涉及一種基于窗函數(shù)共振峰增強(qiáng)的語音增強(qiáng)方法。
背景技術(shù):
語音編碼在通信系統(tǒng)、語音存儲(chǔ)回放系統(tǒng)、具有語音功能的消費(fèi)類產(chǎn)品中有廣泛的應(yīng)用。近些年來國(guó)際電信聯(lián)盟(ITU)、區(qū)域組織和一些國(guó)家相繼制定了一系列語音壓縮編碼標(biāo)準(zhǔn),在編碼速率為2. 4kb/s和16kb/s上達(dá)到了令人滿意的語音質(zhì)量。然而,當(dāng)將幾種不同的編碼方式級(jí)聯(lián)時(shí),例如將G729和AMR級(jí)聯(lián)時(shí),得出的語音質(zhì)量特別是可懂度很難達(dá) 到滿意的效果。語音的可懂度簡(jiǎn)稱語音可懂度,一般涉及語音的理解程度,并且是語音通信有效性的度量。講話很快或者是講話含糊不清的人可能很難被理解。但是,如果消息不是完全聽得到,或者消息在傳送過程中已經(jīng)失真或能量損失過大,則即使聽者的母語流利說出的語音也有可能會(huì)被聽者誤解。目前國(guó)內(nèi)外的語音可懂度增強(qiáng)技術(shù)的研究主要集中在由背景噪聲所降低的語音的清晰度,而這些語音的共振峰信息往往保持完好,故增強(qiáng)對(duì)話區(qū)域的共振峰便能達(dá)到提高可懂度的目的。然而現(xiàn)實(shí)生活中語音經(jīng)傳輸后能量削弱,會(huì)導(dǎo)致共振峰信息的丟失甚至是畸變,例如上述所說的G729和AMR級(jí)聯(lián),由于經(jīng)過兩次級(jí)聯(lián)語音能量特別是高頻信息損失嚴(yán)重,導(dǎo)致語音共振峰信息削弱或是丟失。在這種背景下,簡(jiǎn)單地增強(qiáng)共振峰是很難達(dá)到提高可懂度的目的的?,F(xiàn)有的用共振峰增強(qiáng)對(duì)話的方法和裝置,僅在噪聲環(huán)境下且語音共振峰保持完好的情況下可以提高語音的清晰度,一旦共振峰信息丟失、畸變或提取不正確,使用這一方法對(duì)于提高可懂度效果不理想且有可能同時(shí)放大噪聲,也就是說可懂度提升的同時(shí)會(huì)降低語音的音質(zhì);二是獲取的共振峰可靠性差、計(jì)算復(fù)雜。
發(fā)明內(nèi)容
本發(fā)明的目的在于,針對(duì)上述問題,提出一種基于窗函數(shù)共振峰增強(qiáng)的語音增強(qiáng)方法,以實(shí)現(xiàn)在增強(qiáng)語音的目的的同時(shí)計(jì)算簡(jiǎn)單、魯棒性好的優(yōu)點(diǎn)。為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是
一種基于窗函數(shù)共振峰增強(qiáng)的語音增強(qiáng)方法,包括以下步驟
使用數(shù)字濾波器對(duì)語音信號(hào)進(jìn)行了預(yù)加重;
對(duì)上述預(yù)加重后的語音信號(hào)的采用重疊分幀的方法,即前后兩幀有重疊的部分,保證幀與幀之間平滑過渡,從而保持信號(hào)的連續(xù)性,對(duì)進(jìn)行分幀;
對(duì)上述分幀后的語音信號(hào)進(jìn)行清濁音判決,提取濁音幀信號(hào);
對(duì)上述提取的濁音幀信號(hào),采用線性預(yù)測(cè)(LPC)方法,計(jì)算出上述濁音幀信號(hào)頻譜包
絡(luò);根據(jù)上述計(jì)算出的頻譜包絡(luò),搜索出共振峰,并記錄下前三個(gè)共振峰的中心頻率和幅
值;
根據(jù)上述記錄下的前三個(gè)共振峰的中心頻率和幅值,確定提升濾波器的強(qiáng)度系數(shù)和待增強(qiáng)的中心頻率;
根據(jù)上述確定的提升濾波器的強(qiáng)度系數(shù)和待增強(qiáng)的中心頻率,進(jìn)行共振峰增強(qiáng);
對(duì)上述共振峰增強(qiáng)后的共振峰增強(qiáng)譜做IFFT變換得到一組新的線性預(yù)測(cè)系數(shù)
(I,),用該)系數(shù)對(duì)當(dāng)如語首巾貞做濾波處理。根據(jù)本發(fā)明的優(yōu)選實(shí)施例,所述使用數(shù)字濾波器對(duì)語音信號(hào)進(jìn)行了預(yù)加重采用的數(shù)字濾波器如下
權(quán)利要求
1.ー種基于窗函數(shù)共振峰增強(qiáng)的語音增強(qiáng)方法,其特征在于,包括以下步驟 使用數(shù)字濾波器對(duì)語音信號(hào)進(jìn)行了預(yù)加重; 對(duì)上述預(yù)加重后的語音信號(hào)采用重疊分幀的方法對(duì)該預(yù)加重后的語音信號(hào)進(jìn)行分幀; 對(duì)上述分幀后的語音信號(hào)進(jìn)行清濁音判決,提取濁音幀信號(hào); 對(duì)上述提取的濁音幀信號(hào),采用線性預(yù)測(cè)(LPC)方法,計(jì)算出上述濁音幀信號(hào)頻譜包絡(luò); 根據(jù)上述計(jì)算出的頻譜包絡(luò),捜索出共振峰,并記錄下前三個(gè)共振峰的中心頻率和幅值; 根據(jù)上述記錄下的前三個(gè)共振峰的中心頻率和幅值,確定提升濾波器的強(qiáng)度系數(shù)和待增強(qiáng)的中心頻率; 根據(jù)上述確定的提升濾波器的強(qiáng)度系數(shù)和待增強(qiáng)的中心頻率,進(jìn)行共振峰增強(qiáng); 對(duì)上述共振峰增強(qiáng)后的共振峰增強(qiáng)譜做IFFT變換得到一組新的線性預(yù)測(cè)系數(shù)(I,c22,,…),用該(-<系數(shù)對(duì)當(dāng)前語音幀做濾波處理。
2.根據(jù)權(quán)利要求I所述的基于窗函數(shù)共振峰增強(qiáng)的語音增強(qiáng)方法,其特征在于,所述使用數(shù)字濾波器對(duì)語音信號(hào)進(jìn)行了預(yù)加重采用的數(shù)字濾波器如下 H (z) = I — 0.9 5 ニ I。
3.根據(jù)權(quán)利要求I或2所述的基于窗函數(shù)共振峰增強(qiáng)的語音增強(qiáng)方法,其特征在干,所述采用重疊分幀的方法對(duì)該預(yù)加重后的語音信號(hào)進(jìn)行分幀具體為幀長(zhǎng)在IOmslOms之間,巾貞移在5ms 20ms之間。
4.根據(jù)權(quán)利要求3所述的基于窗函數(shù)共振峰增強(qiáng)的語音增強(qiáng)方法,其特征在于,所述線性預(yù)測(cè)(LPC)方法采用萊文遜-杜賓遞推算法,其具體如下 (1)計(jì)算濁音幀的自相關(guān)函數(shù)式(J), / = 0,1,…,p,其中代表階數(shù); (2)令
5.根據(jù)權(quán)利要求4所述的基于窗函數(shù)共振峰增強(qiáng)的語音增強(qiáng)方法,其特征在于,所述確定提升濾波器的強(qiáng)度系數(shù)和待增強(qiáng)的中心頻率,其具體如下 若上述前三個(gè)共振峰均存在,則提升濾波器的強(qiáng)度系數(shù)設(shè)定為上述三個(gè)共振峰幅值的均值; 若上述前三個(gè)共振峰不全存在,則設(shè)定為存在的共振峰幅值的均值。
6.根據(jù)權(quán)利要求5所述的基于窗函數(shù)共振峰增強(qiáng)的語音增強(qiáng)方法,其特征在干,所述共振峰增強(qiáng)采用窗函數(shù)提升的方法,其具體如下 在保持語音信號(hào)原始譜包絡(luò)軌跡的基礎(chǔ)上對(duì)信號(hào)共振峰做增強(qiáng)處理,即在多個(gè)共振峰的3迎帶寬范圍內(nèi)使用提升濾波器對(duì)共振峰做相同幅度的提升。
7.根據(jù)權(quán)利要求6所述的基于窗函數(shù)共振峰增強(qiáng)的語音增強(qiáng)方法,其特征在干, 所述窗函數(shù)提升方法采用雙漢寧窗對(duì)每一共振峰的3迎帶寬做相同幅度的提升,即在每ー共振峰中心頻率兩邊采用不同的漢寧窗提升濾波器。
8.根據(jù)權(quán)利要求7所述的基于窗函數(shù)共振峰增強(qiáng)的語音增強(qiáng)方法,其特征在于,所述漢寧窗函數(shù)如下
全文摘要
本發(fā)明公開了一種基于窗函數(shù)共振峰增強(qiáng)的語音增強(qiáng)方法,包括以下步驟對(duì)語音信號(hào)進(jìn)行預(yù)加重;對(duì)預(yù)加重后的語音信號(hào)進(jìn)行分幀;對(duì)分幀后的語音信號(hào)進(jìn)行清濁音判決,提取濁音幀信號(hào);對(duì)提取的濁音幀信號(hào),采用線性預(yù)測(cè)(LPC)方法,計(jì)算出濁音幀信號(hào)頻譜包絡(luò);根據(jù)計(jì)算出的頻譜包絡(luò),搜索共振峰,并記錄下前三個(gè)共振峰的中心頻率和幅值;根據(jù)上述記錄下的前三個(gè)共振峰的中心頻率和幅值,確定提升濾波器的強(qiáng)度系數(shù)和待增強(qiáng)的中心頻率;根據(jù)上述確定的提升濾波器的強(qiáng)度系數(shù)和待增強(qiáng)的中心頻率,進(jìn)行共振峰增強(qiáng);對(duì)上述共振峰增強(qiáng)后的共振峰增強(qiáng)譜濾波處理。實(shí)現(xiàn)在增強(qiáng)語音的目的的同時(shí)計(jì)算簡(jiǎn)單、魯棒性好的優(yōu)點(diǎn)。
文檔編號(hào)G10L21/02GK102779527SQ20121027830
公開日2012年11月14日 申請(qǐng)日期2012年8月7日 優(yōu)先權(quán)日2012年8月7日
發(fā)明者何姣, 吳少智, 吳躍, 賀知明 申請(qǐng)人:無錫成電科大科技發(fā)展有限公司