本發(fā)明涉及一種聲音信號處理技術(shù),尤其是,還涉及一種收音處理方法及聲音信號處理裝置。
背景技術(shù):
1、為了讓行動裝置有較好的錄音和通話質(zhì)量,提供許多降低噪音的信號處理應(yīng)用,其中波束成形(beamforming)算法是最為普及信號處理技術(shù)。市面上的波束成形技術(shù)可以消除環(huán)境周遭的噪聲,并只保留行動裝置正前方的聲音信號。
2、然而,當(dāng)有干擾信號與用戶都在行動裝置的正前方時,目前的波束成形算法無法分清楚哪個聲音需要保留,并使得干擾信號影響使用者的聲音信號。
技術(shù)實現(xiàn)思路
1、本發(fā)明是針對一種收音處理方法及聲音信號處理裝置,可區(qū)分聲音來源,并保留目標來源的聲音信號。
2、根據(jù)本發(fā)明的實施例,收音處理方法包括(但不僅限于)下列步驟:通過麥克風(fēng)陣列接收多個輸入聲音信號,其中麥克風(fēng)陣列包括分別接收那些輸入聲音信號的多個麥克風(fēng);基于波束成形(beamforming)將那些輸入聲音信號組合成主要聲音信號,其中波束成形用于將麥克風(fēng)陣列形成對應(yīng)于多個聲音來源中的第一來源的輻射場型(pattern),且麥克風(fēng)陣列中的第一麥克風(fēng)相較于其他麥克風(fēng)還接近第一來源;分別自那些輸入聲音信號萃取出屬于主要聲音信號的多個初次萃取信號,其中事先訓(xùn)練那些輸入聲音信號分別與主要聲音信號之間的多個第一聲音特征關(guān)聯(lián),且第一聲音特征關(guān)聯(lián)用于萃取屬于主要聲音信號的部分;通過盲信號分離(blind?signal?separation,bss)自那些初次萃取信號分離出那些聲音來源對應(yīng)的多個估測聲源信號;分別自那些初次萃取信號萃取出屬于那些估測聲源信號的多個再次萃取信號,其中事先訓(xùn)練那些初次萃取信號分別與那些估測聲源信號之間的多個第二聲音特征關(guān)聯(lián),且那些第二聲音特征關(guān)聯(lián)分別用于萃取屬于那些估測聲源信號的部分;根據(jù)功率比值確定第一來源相對于麥克風(fēng)陣列的距離,其中功率比值為第一值與第二值的比值,第一值為對應(yīng)于第一來源及對應(yīng)于麥克風(fēng)陣列中不為第一麥克風(fēng)的其他麥克風(fēng)的那些再次萃取信號的功率的總和,第二值為對應(yīng)于第一來源及對應(yīng)于第一麥克風(fēng)的一再次萃取信號的功率,功率比值越小則第一來源相對于麥克風(fēng)陣列的距離越近,且功率比值越大則第一來源相對于麥克風(fēng)陣列的距離越遠;以及根據(jù)距離限制確定對應(yīng)于第一來源的估測聲源信號,其中第一來源相對于麥克風(fēng)陣列的距離在距離限制內(nèi)。
3、根據(jù)本發(fā)明的實施例,聲音信號處理裝置包括麥克風(fēng)陣列、存儲器及處理器。麥克風(fēng)陣列包括分別接收多個輸入聲音信號的多個麥克風(fēng)。存儲器用以存儲程序代碼。處理器耦接麥克風(fēng)陣列及存儲器。處理器用以加載程序代碼以執(zhí)行:基于波束成形將那些輸入聲音信號組合成主要聲音信號,其中波束成形用于將麥克風(fēng)陣列形成對應(yīng)于多個聲音來源中的第一來源的輻射場型,且麥克風(fēng)陣列中的第一麥克風(fēng)相較于其他麥克風(fēng)還接近第一來源;分別自那些輸入聲音信號萃取出屬于主要聲音信號的多個初次萃取信號,其中事先訓(xùn)練那些輸入聲音信號分別與主要聲音信號之間的多個第一聲音特征關(guān)聯(lián),且第一聲音特征關(guān)聯(lián)用于萃取屬于主要聲音信號的部分;通過盲信號分離自那些初次萃取信號分離出那些聲音來源對應(yīng)的多個估測聲源信號;分別自那些初次萃取信號萃取出屬于那些估測聲源信號的多個再次萃取信號,其中事先訓(xùn)練那些初次萃取信號分別與那些估測聲源信號之間的多個第二聲音特征關(guān)聯(lián),且那些第二聲音特征關(guān)聯(lián)分別用于萃取屬于那些估測聲源信號的部分;根據(jù)功率比值確定第一來源相對于麥克風(fēng)陣列的距離,其中功率比值為第一值與第二值的比值,第一值為對應(yīng)于第一來源及對應(yīng)于麥克風(fēng)陣列中不為第一麥克風(fēng)的其他麥克風(fēng)的那些再次萃取信號的功率的總和,第二值為對應(yīng)于第一來源及對應(yīng)于第一麥克風(fēng)的一再次萃取信號的功率,功率比值越小則第一來源相對于麥克風(fēng)陣列的距離越近,且功率比值越大則第一來源相對于麥克風(fēng)陣列的距離越遠;以及根據(jù)距離限制確定對應(yīng)于第一來源的估測聲源信號,其中第一來源相對于麥克風(fēng)陣列的距離在距離限制內(nèi)。
4、基于上述,本發(fā)明實施例的收音處理方法及聲音信號處理裝置可通過波束成形、聲音萃取及盲信號分離區(qū)別聲源信號,確定聲源信號對應(yīng)來源的相對距離,并據(jù)以確定特定來源的聲源信號。由此,可去除輻射場型涵蓋內(nèi)的其他使用者的聲音信號,從而提升錄音和通話質(zhì)量。
1.一種收音處理方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的收音處理方法,其中根據(jù)所述功率比值確定所述第一來源相對于所述麥克風(fēng)陣列的距離的步驟包括:
3.根據(jù)權(quán)利要求1所述的收音處理方法,還包括:
4.根據(jù)權(quán)利要求1所述的收音處理方法,還包括:
5.根據(jù)權(quán)利要求4所述的收音處理方法,其中所述機器學(xué)習(xí)算法為反向傳播的多層感知器,且訓(xùn)練所述第一聲音特征關(guān)聯(lián)的步驟包括:
6.一種聲音信號處理裝置,其特征在于,包括:
7.根據(jù)權(quán)利要求6所述的聲音信號處理裝置,其中所述處理器還經(jīng)配置用以:
8.根據(jù)權(quán)利要求6所述的聲音信號處理裝置,其中所述處理器還經(jīng)配置用以:
9.根據(jù)權(quán)利要求6所述的聲音信號處理裝置,其中所述處理器還經(jīng)配置用以:
10.根據(jù)權(quán)利要求9所述的聲音信號處理裝置,其中所述機器學(xué)習(xí)算法為反向傳播的多層感知器,且所述處理器還經(jīng)配置用以: