本申請涉及聲學處理,具體而言,涉及一種結合深度學習和聲學參量陣的信號處理方法及裝置。
背景技術:
1、聲學參量陣在音頻定向播音技術方向得到廣泛關注,其工作原理是:基于信號預處理和非線性聲學。首先,音頻信號以特定的預處理和調制方式加載于超聲載波之上,形成一種復合信號形式,隨后借助換能器將其發射至空氣介質中。在傳播過程中,空氣介質的非線性特性發揮了關鍵作用。原始音頻信號由于空氣分子間相互作用的非線性效應,開始逐步從超聲載波中發生自解調。與此同時,作為音頻信號載體的超聲波自身具備高度指向性。在傳播過程中,超聲波能夠有效地將能量集中于特定方向,使得自解調后的音頻信號沿著這一預定方向進行傳播,進而實現了聲音的定向傳播效果,這一特性在諸如音頻廣播、聲學成像以及特定環境下的聲音傳輸等諸多領域有著不可替代的應用潛力。聲學參量陣其核心理論依據為經典的berktay?公式。該公式描述了以超聲波作為載波的調制信號,在經歷空氣非線性作用自解調后所得到的音頻信號,與原始調制信號包絡平方的二次導數呈正比關系。所以,如果要顯著提升音頻的還原品質,實現近乎理想的音頻重現效果,就必須著力于降低諧波失真并優化相關信號處理算法。預處理算法難點在于:空氣自解調過程中涉及非線性聲學,而整個非線性過程中在實際場景中,受到空氣溫濕度等各方面影響,僅依靠berktay公式存在大量誤差。
技術實現思路
1、本申請實施例的目的在于提供一種結合深度學習和聲學參量陣的信號處理方法及裝置,用以解決了現有技術存在的上述問題,通過神經網絡端到端反推預處理算法,能夠改善超聲參量陣揚聲器的音質問題。
2、第一方面,提供了一種結合深度學習和聲學參量陣的信號處理方法,該方法可以包括:
3、獲取待處理的音頻信號;
4、采用訓練好的預處理模型,對所述待處理的音頻信號進行預處理,輸出相應的超聲信號;所述訓練好的預處理模型是結合訓練好的非線性處理模型,將音頻信號輸入樣本輸入待訓練的預處理模型訓練得到的;
5、采集所述超聲信號通過配置的超聲參量陣揚聲器后的自解調音頻信號,所述自解調音頻信號為所述待處理的音頻信號中逼近真實音頻信號的音頻信號。
6、在一個可能的實現中,所述非線性處理模型的訓練過程包括:
7、獲取不同頻帶的歷史超聲信號;
8、在所述超聲參量陣揚聲器的輸出方向的預設距離值上放置麥克風,并將所述歷史超聲信號通過所述超聲參量陣揚聲器后,獲取所述麥克風接收的自解調后的麥克風信號;
9、將所述歷史超聲信號作為輸入樣本,將所述麥克風信號作為樣本標簽,對待訓練的神經網絡模型進行訓練,得到訓練好的非線性處理模型。
10、在一個可能的實現中,獲取所述麥克風接收的自解調后的麥克風信號,包括:
11、采集麥克風接收的自解調后的初始信號;
12、采用最小值統計方法,對所述自解調后的初始信號進行處理,得到當前環境中的噪聲功率譜;
13、利用預設的譜減法,對所述自解調后的初始信號進行處理,得到自解調后的麥克風信號。
14、在一個可能的實現中,所述方法還包括:
15、在訓練好的非線性處理模型后,對待訓練的神經網絡模型進行訓練,得到訓練好的預處理模型,其中,所述預處理模型的訓練過程包括:
16、將獲取的歷史音頻信號作為樣本標簽,將歷史音頻信號與不同噪聲信號混合后的信號作為不同的音頻信號輸入樣本;
17、針對任一音頻信號輸入樣本,獲取所述音頻信號輸入樣本輸入待訓練的預處理模型后輸出的相應的超聲信號樣本;
18、采集所述超聲信號樣本通過配置的超聲參量陣揚聲器后的自解調音頻信號樣本;
19、采用訓練好的非線性處理模型,對所述超聲信號樣本進行處理,輸出擬合逼近歷史音頻信號的音頻信號輸出樣本;
20、采用預設的損失函數,對每次迭代的歷史音頻信號與相應的音頻信號輸出樣本進行處理,得到損失值,若所述損失值不滿足迭代終止條件,則對模型參數進行優化,并繼續進行迭代訓練,直至滿足迭代終止條件,以得到訓練好的預處理模型。
21、在一個可能的實現中,在對待訓練的神經網絡模型進行訓練,得到訓練好的預處理模型之前,所述方法還包括:
22、設置模型訓練的超參,學習率和優化函數。
23、在一個可能的實現中,所述損失函數為均方誤差損失函數。
24、第二方面,提供了一種結合深度學習和聲學參量陣的信號處理裝置,該裝置可以包括:
25、獲取單元,用于獲取待處理的音頻信號;
26、處理單元,用于采用訓練好的預處理模型,對所述待處理的音頻信號進行預處理,輸出相應的超聲信號;所述訓練好的預處理模型是結合訓練好的非線性處理模型,將音頻信號輸入樣本輸入待訓練的預處理模型訓練得到的;
27、采集單元,用于采集所述超聲信號通過配置的超聲參量陣揚聲器后的自解調音頻信號,所述自解調音頻信號為所述待處理的音頻信號中逼近真實音頻信號的音頻信號。
28、第三方面,提供了一種電子設備,該電子設備包括處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信;
29、存儲器,用于存放計算機程序;
30、處理器,用于執行存儲器上所存放的程序時,實現上述第一方面中任一所述的方法步驟。
31、第四方面,提供了一種計算機可讀存儲介質,該計算機可讀存儲介質內存儲有計算機程序,所述計算機程序被處理器執行時實現上述第一方面中任一所述的方法步驟。
32、本申請實施例提供的結合深度學習和聲學參量陣的信號處理方法在獲取待處理的音頻信號后,采用訓練好的預處理模型,對待處理的音頻信號進行預處理,輸出相應的超聲信號;訓練好的預處理模型是結合訓練好的非線性處理模型,將音頻信號輸入樣本輸入待訓練的預處理模型訓練得到的;采集超聲信號通過配置的超聲參量陣揚聲器后的自解調音頻信號,自解調音頻信號為自解調后逼近待處理的音頻信號中實際音頻信號的音頻信號。該方法通過神經網絡端到端可反推得出預處理模型的信號預處理算法,從而能夠改善超聲參量陣揚聲器的音質問題。
1.一種結合深度學習和聲學參量陣的信號處理方法,其特征在于,所述方法包括:
2.如權利要求1所述的方法,其特征在于,所述非線性處理模型的訓練過程包括:
3.如權利要求2所述的方法,其特征在于,獲取所述麥克風接收的自解調后的麥克風信號,包括:
4.如權利要求2所述的方法,其特征在于,所述方法還包括:
5.如權利要求4所述的方法,其特征在于,在對待訓練的神經網絡模型進行訓練,得到訓練好的預處理模型之前,所述方法還包括:
6.如權利要求4所述的方法,其特征在于,所述損失函數為均方誤差損失函數。
7.一種結合深度學習和聲學參量陣的信號處理裝置,其特征在于,所述裝置包括:
8.一種電子設備,其特征在于,所述電子設備包括處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信;
9.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質內存儲有計算機程序,所述計算機程序被處理器執行時實現權利要求1-6任一所述的方法。