本發(fā)明涉及音頻處理,尤其涉及一種跨設(shè)備多麥克風協(xié)同處理的語音增強方法、裝置、終端及介質(zhì)。
背景技術(shù):
1、目前,外接耳機設(shè)備通常自帶麥克風,但在一些復雜環(huán)境中,單一麥克風可能無法有效地隔離干擾噪聲,對于單一麥克風即使使用深度學習降噪方法也無法去除干擾人聲,同時噪聲抑制效果有限,導致語音清晰度下降。此外,現(xiàn)有的音頻處理技術(shù)往往只依賴于外接設(shè)備的麥克風,而忽略了主機設(shè)備內(nèi)置麥克風的潛在價值,目前市面上普遍的外接耳機或耳塞設(shè)備在與主機設(shè)備(例如筆記本電腦、手機、平板等)連接后,會自動切換并啟用外接耳機設(shè)備內(nèi)的麥克風,而主機設(shè)備內(nèi)置麥克風則被禁用或者沒有被啟用。這種設(shè)計在日常音頻輸入場景下是有效的,但在嘈雜環(huán)境中,僅依賴單一麥克風的輸入容易受到環(huán)境噪聲的干擾,無法清晰捕捉到目標說話人聲音,而且沒有將主機設(shè)備內(nèi)置麥克風的潛在價值進行利用。
2、因此,現(xiàn)有技術(shù)還存在缺陷。
技術(shù)實現(xiàn)思路
1、本發(fā)明要解決的技術(shù)問題在于,針對現(xiàn)有技術(shù)的上述缺陷,提供一種跨設(shè)備多麥克風協(xié)同處理的語音增強方法、裝置、終端及介質(zhì),本發(fā)明所采用的技術(shù)方案如下:
2、第一方面,本發(fā)明提供一種跨設(shè)備多麥克風協(xié)同處理的語音增強方法,其中,所述方法包括:
3、獲取主機麥克風音頻信號和外接麥克風音頻信號,并對所述外接麥克風音頻信號進行增益補償;
4、基于所述主機麥克風音頻信號與增益補償后的外接麥克風音頻信號進行功率譜計算,并確定所述主機麥克風音頻信號與增益補償后的外接麥克風音頻信號在各個頻率處的功率譜差異比以及功率譜差異譜;
5、基于各個頻率處的功率譜差異比與所述功率譜差異譜進行噪聲估計,得到噪聲功率譜,并基于所述噪聲功率譜對所述外接麥克風音頻信號進行降噪處理,得到降噪后的外接麥克風音頻信號。
6、在一種實現(xiàn)方式中,所述方法應用于主機麥克風與外接麥克風所形成的麥克風陣列,通過同時獲取主機麥克風音頻信號和外接麥克風音頻信號以實現(xiàn)語音增強。
7、在一種實現(xiàn)方式中,所述對所述外接麥克風音頻信號進行增益補償,包括:
8、對所述主機麥克風音頻信號和所述外接麥克風音頻信號進行時域同步;
9、對時域同步后的主機麥克風音頻信號和外接麥克風音頻信號進行底噪追蹤檢測,得到所述主機麥克風音頻信號和所述外接麥克風音頻信號對應的噪聲水平;
10、基于所述主機麥克風音頻信號和所述外接麥克風音頻信號對應的噪聲水平,確定所述外接麥克風音頻信號對應的增益補償系數(shù);
11、基于所述增益補償系數(shù),對所述外接麥克風音頻信號進行增益補償。
12、在一種實現(xiàn)方式中,所述基于所述增益補償系數(shù),對所述外接麥克風音頻信號進行增益補償,包括:
13、將所述增益補償系數(shù)與所述外接麥克風音頻信號相乘,得到增益補償后的外接麥克風音頻信號。
14、在一種實現(xiàn)方式中,所述基于所述主機麥克風音頻信號與增益補償后的外接麥克風音頻信號進行功率譜計算,包括:
15、將所述主機麥克風音頻信號與增益補償后的外接麥克風音頻信號轉(zhuǎn)換成頻域信號;
16、基于所述頻域信號計算所述主機麥克風音頻信號與增益補償后的外接麥克風音頻信號對應的功率譜,所述功率譜用于反映所述主機麥克風音頻信號與增益補償后的外接麥克風音頻信號在不同頻率上的功率分布。
17、在一種實現(xiàn)方式中,所述基于各個頻率處的功率譜差異比與所述功率譜差異譜進行噪聲估計,得到噪聲功率譜,包括:
18、獲取預設(shè)的噪聲估計模型;
19、獲取所述噪聲估計模型中預設(shè)的第一閾值、第二閾值以及第三閾值,其中,所述第一閾值小于所述第二閾值;
20、將每個頻率處的功率譜差異比以及功率譜差異譜分別與第一閾值、第二閾值以及第三閾值進行比較;
21、若某個頻率處的功率譜差異比位于所述第一閾值與所述第二閾值之間,且對應的功率譜差異譜小于所述第三閾值,則確定該頻率處存在噪聲,并得到噪聲功率譜。
22、在一種實現(xiàn)方式中,所述基于所述噪聲功率譜對所述外接麥克風音頻信號進行降噪處理,得到降噪后的外接麥克風音頻信號,包括:
23、基于所述噪聲功率譜和原始的所述外接麥克風音頻信號對應的功率譜,計算濾波系數(shù);
24、基于所述濾波系數(shù)對原始的所述外接麥克風音頻信號的頻域表示進行濾波,得到降噪后的信號頻域表示;
25、將降噪后的信號的頻域表示轉(zhuǎn)換成時域表示,得到降噪后的外接麥克風音頻信號。
26、第二方面,本發(fā)明實施例還包括一種跨設(shè)備多麥克風協(xié)同處理的語音增強裝置,其中,所述裝置用于實現(xiàn)上述方案所述的跨設(shè)備多麥克風協(xié)同處理的語音增強方法的步驟,所述裝置包括:
27、增益補償模塊,用于獲取主機麥克風音頻信號和外接麥克風音頻信號,并對所述外接麥克風音頻信號進行增益補償;
28、功率譜分析模塊,用于基于所述主機麥克風音頻信號與增益補償后的外接麥克風音頻信號進行功率譜計算,并確定所述主機麥克風音頻信號與增益補償后的外接麥克風音頻信號在各個頻率處的功率譜差異比以及功率譜差異譜;
29、降噪處理模塊,用于基于各個頻率處的功率譜差異比與所述功率譜差異譜進行噪聲估計,得到噪聲功率譜,并基于所述噪聲功率譜對所述外接麥克風音頻信號進行降噪處理,得到降噪后的外接麥克風音頻信號。
30、第三方面,本發(fā)明實施例還提供一種終端,其中,所述終端包括存儲器、處理器及存儲在存儲器中并可在處理器上運行的跨設(shè)備多麥克風協(xié)同處理的語音增強程序,處理器執(zhí)行跨設(shè)備多麥克風協(xié)同處理的語音增強程序時,實現(xiàn)上述方案中任一項的跨設(shè)備多麥克風協(xié)同處理的語音增強方法的步驟。
31、第四方面,本發(fā)明實施例還提供一種計算機可讀存儲介質(zhì),其中,計算機可讀存儲介質(zhì)上存儲有跨設(shè)備多麥克風協(xié)同處理的語音增強程序,所述跨設(shè)備多麥克風協(xié)同處理的語音增強程序被處理器執(zhí)行時,實現(xiàn)上述方案中任一項所述的跨設(shè)備多麥克風協(xié)同處理的語音增強方法的步驟。
32、有益效果:與現(xiàn)有技術(shù)相比,本發(fā)明提供了一種跨設(shè)備多麥克風協(xié)同處理的語音增強方法,所述方法應用于主機麥克風與外接麥克風所形成的麥克風陣列,通過同時獲取主機麥克風音頻信號和外接麥克風音頻信號以實現(xiàn)語音增強。本發(fā)明首先獲取主機麥克風音頻信號和外接麥克風音頻信號,并對所述外接麥克風音頻信號進行增益補償。然后,基于所述主機麥克風音頻信號與增益補償后的外接麥克風音頻信號進行功率譜計算,并確定所述主機麥克風音頻信號與增益補償后的外接麥克風音頻信號在各個頻率處的功率譜差異比以及功率譜差異譜。最后,基于各個頻率處的功率譜差異比與所述功率譜差異譜進行噪聲估計,得到噪聲功率譜,并基于所述噪聲功率譜對所述外接麥克風音頻信號進行降噪處理,得到降噪后的外接麥克風音頻信號。本發(fā)明利用主機麥克風的潛在價值,通過主機麥克風和外接麥克風協(xié)同工作,有效隔離周邊噪聲信號,實現(xiàn)語音增強,有效提升語音清晰度。
1.一種跨設(shè)備多麥克風協(xié)同處理的語音增強方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的跨設(shè)備多麥克風協(xié)同處理的語音增強方法,其特征在于,所述方法應用于主機麥克風與外接麥克風所形成的麥克風陣列,通過同時獲取主機麥克風音頻信號和外接麥克風音頻信號以實現(xiàn)語音增強。
3.根據(jù)權(quán)利要求1所述的跨設(shè)備多麥克風協(xié)同處理的語音增強方法,其特征在于,所述對所述外接麥克風音頻信號進行增益補償,包括:
4.根據(jù)權(quán)利要求3所述的跨設(shè)備多麥克風協(xié)同處理的語音增強方法,其特征在于,所述基于所述增益補償系數(shù),對所述外接麥克風音頻信號進行增益補償,包括:
5.根據(jù)權(quán)利要求1所述的跨設(shè)備多麥克風協(xié)同處理的語音增強方法,其特征在于,所述基于所述主機麥克風音頻信號與增益補償后的外接麥克風音頻信號進行功率譜計算,包括:
6.根據(jù)權(quán)利要求1所述的跨設(shè)備多麥克風協(xié)同處理的語音增強方法,其特征在于,所述基于各個頻率處的功率譜差異比與所述功率譜差異譜進行噪聲估計,得到噪聲功率譜,包括:
7.根據(jù)權(quán)利要求1所述的跨設(shè)備多麥克風協(xié)同處理的語音增強方法,其特征在于,所述基于所述噪聲功率譜對所述外接麥克風音頻信號進行降噪處理,得到降噪后的外接麥克風音頻信號,包括:
8.一種跨設(shè)備多麥克風協(xié)同處理的語音增強裝置,其特征在于,所述裝置用于實現(xiàn)權(quán)利要求1-7任一項所述的跨設(shè)備多麥克風協(xié)同處理的語音增強方法的步驟,所述裝置包括:
9.一種終端,其特征在于,所述終端包括存儲器、處理器及存儲在所述存儲器中并可在所述處理器上運行的跨設(shè)備多麥克風協(xié)同處理的語音增強程序,所述處理器執(zhí)行跨設(shè)備多麥克風協(xié)同處理的語音增強程序時,實現(xiàn)如權(quán)利要求1-7任一項所述的跨設(shè)備多麥克風協(xié)同處理的語音增強方法的步驟。
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)上存儲有跨設(shè)備多麥克風協(xié)同處理的語音增強程序,所述跨設(shè)備多麥克風協(xié)同處理的語音增強程序被處理器執(zhí)行時,實現(xiàn)如權(quán)利要求1-7任一項所述的跨設(shè)備多麥克風協(xié)同處理的語音增強方法的步驟。