本技術涉及車輛音頻系統,特別涉及一種自適應車載音頻設備的聲音調節方法、裝置、車輛及介質。
背景技術:
1、隨著汽車技術的不斷發展,人們對車內音頻體驗的需求也日益增加。為了滿足這種需求,市場上出現了各種車載音頻設備,包括音響系統、車載播放器等。
2、相關技術中,車載音頻設備通常需要用戶手動調整音頻設置,以滿足個人偏好。
3、然而,這種手動調整不夠便利,并且無法根據車內人員的性別年齡和聽覺特征進行自適應調整,亟需完善。
技術實現思路
1、本技術提供一種自適應車載音頻設備的聲音調節方法、裝置、車輛及介質,以解決現有技術通過手動調整音頻設置不夠便利,以及無法根據車內人員的性別年齡和聽覺特征進行自適應調整的問題,以提升車內音頻體驗的個性化和智能化。
2、為達到上述目的,本技術第一方面實施例提出一種自適應車載音頻設備的聲音調節方法,包括以下步驟:
3、獲取當前用戶的面部圖像;
4、利用預設的人臉性別-年齡識別模型分析所述面部圖像,確定所述當前用戶的性別和年齡;
5、基于所述當前用戶的性別和年齡,利用預設的性別-年齡-聽力頻率匹配模型,確定當前音頻參數,并基于所述當前音頻參數控制車載揚聲器系統發聲。
6、根據本技術的一個實施例,所述基于所述當前音頻參數控制車載揚聲器系統發聲,包括:
7、基于所述當前音頻參數生成對應的音頻信號;
8、將所述音頻信號發送至功率放大器,得到增強型音頻信號,并將所述增強型音頻信號傳輸至所述車載揚聲器系統,以驅動所述車載揚聲器系統發聲。
9、根據本技術的一個實施例,在利用所述預設的人臉性別-年齡識別模型分析所述面部圖像,確定所述當前用戶的性別和年齡之前,還包括:
10、獲取包含標注性別和年齡的人臉圖像數據集;
11、對所述人臉圖像數據集進行預處理,得到預處理后的人臉圖像數據集;
12、利用特征提取器對所述預處理后的人臉圖像數據集進行特征提取,得到人臉特征集,并將所述人臉特征集劃分為第一訓練集和第一驗證集;
13、利用所述第一訓練集對第一預設神經網絡進行訓練得到第一初始神經網絡模型,并利用所述第一驗證集驗證所述第一初始神經網絡模型,直到所述第一初始神經網絡模型滿足第一預設條件,結束對所述第一預設神經網絡的迭代訓練得到所述預設的人臉性別-年齡識別模型,否則調整超參數后繼續迭代訓練。
14、根據本技術的一個實施例,在基于所述當前用戶的性別和年齡,利用所述預設的性別-年齡-聽力頻率匹配模型,確定所述當前音頻參數之前,還包括:
15、獲取不同性別和年齡群組的標準聽力測試數據,其中,所述標準聽力測試數據為所述不同性別和年齡群組與音頻參數之間的對應關系;
16、對所述標準聽力測試數據進行預處理,并將預處理后的標準聽力測試數據劃分為第二訓練集和第二驗證集;
17、基于性別-年齡-聽力頻率敏感度理論,利用所述第二訓練集對第二預設神經網絡進行訓練得到第二初始神經網絡模型,并利用所述第二驗證集驗證所述第二初始神經網絡模型,直到所述第二初始神經網絡模型滿足第二預設條件,結束對所述第二預設神經網絡的迭代訓練得到所述預設的性別-年齡-聽力頻率匹配模型,否則調整超參數后繼續迭代訓練。
18、根據本技術的一個實施例,所述音頻參數包括頻率、音調和響度。
19、根據本技術的一個實施例,在基于所述當前音頻參數控制所述車載揚聲器系統發聲之后,還包括:
20、利用車載顯示屏顯示所述當前音頻參數,以使得所述當前用戶參看所述當前音頻參數對應的具體數值。
21、根據本技術實施例提出的自適應車載音頻設備的聲音調節方法,通過獲取當前用戶的面部圖像,可以利用預設的人臉性別-年齡識別模型分析面部圖像,確定當前用戶的性別和年齡;基于當前用戶的性別和年齡,利用預設的性別-年齡-聽力頻率匹配模型,確定當前音頻參數,并基于當前音頻參數控制車載揚聲器系統發聲。由此,通過根據車內人員的性別和年齡自動調整音頻參數,解決了現有技術通過手動調整音頻設置不夠便利,以及無法根據車內人員的性別年齡和聽覺特征進行自適應調整的問題,以提升車內音頻體驗的個性化和智能化。
22、為達到上述目的,本技術第二方面實施例提出一種自適應車載音頻設備的聲音調節裝置,包括:
23、獲取模塊,用于獲取當前用戶的面部圖像;
24、第一確定模塊,用于利用預設的人臉性別-年齡識別模型分析所述面部圖像,確定所述當前用戶的性別和年齡;
25、第二確定模塊,用于基于所述當前用戶的性別和年齡,利用預設的性別-年齡-聽力頻率匹配模型,確定當前音頻參數,并基于所述當前音頻參數控制車載揚聲器系統發聲。
26、根據本技術的一個實施例,所述第二確定模塊,具體用于:
27、基于所述當前音頻參數生成對應的音頻信號;
28、將所述音頻信號發送至功率放大器,得到增強型音頻信號,并將所述增強型音頻信號傳輸至所述車載揚聲器系統,以驅動所述車載揚聲器系統發聲。
29、根據本技術的一個實施例,在利用所述預設的人臉性別-年齡識別模型分析所述面部圖像,確定所述當前用戶的性別和年齡之前,所述第一確定模塊,還用于:
30、獲取包含標注性別和年齡的人臉圖像數據集;
31、對所述人臉圖像數據集進行預處理,得到預處理后的人臉圖像數據集;
32、利用特征提取器對所述預處理后的人臉圖像數據集進行特征提取,得到人臉特征集,并將所述人臉特征集劃分為第一訓練集和第一驗證集;
33、利用所述第一訓練集對第一預設神經網絡進行訓練得到第一初始神經網絡模型,并利用所述第一驗證集驗證所述第一初始神經網絡模型,直到所述第一初始神經網絡模型滿足第一預設條件,結束對所述第一預設神經網絡的迭代訓練得到所述預設的人臉性別-年齡識別模型,否則調整超參數后繼續迭代訓練。
34、根據本技術的一個實施例,在基于所述當前用戶的性別和年齡,利用所述預設的性別-年齡-聽力頻率匹配模型,確定所述當前音頻參數之前,所述第二確定模塊,還用于:
35、獲取不同性別和年齡群組的標準聽力測試數據,其中,所述標準聽力測試數據為所述不同性別和年齡群組與音頻參數之間的對應關系;
36、對所述標準聽力測試數據進行預處理,并將預處理后的標準聽力測試數據劃分為第二訓練集和第二驗證集;
37、基于性別-年齡-聽力頻率敏感度理論,利用所述第二訓練集對第二預設神經網絡進行訓練得到第二初始神經網絡模型,并利用所述第二驗證集驗證所述第二初始神經網絡模型,直到所述第二初始神經網絡模型滿足第二預設條件,結束對所述第二預設神經網絡的迭代訓練得到所述預設的性別-年齡-聽力頻率匹配模型,否則調整超參數后繼續迭代訓練。
38、根據本技術的一個實施例,所述音頻參數包括頻率、音調和響度。
39、根據本技術的一個實施例,在基于所述當前音頻參數控制所述車載揚聲器系統發聲之后,所述第二確定模塊,還用于:
40、利用車載顯示屏顯示所述當前音頻參數,以使得所述當前用戶參看所述當前音頻參數對應的具體數值。
41、根據本技術實施例提出的自適應車載音頻設備的聲音調節裝置,通過獲取當前用戶的面部圖像,可以利用預設的人臉性別-年齡識別模型分析面部圖像,確定當前用戶的性別和年齡;基于當前用戶的性別和年齡,利用預設的性別-年齡-聽力頻率匹配模型,確定當前音頻參數,并基于當前音頻參數控制車載揚聲器系統發聲。由此,通過根據車內人員的性別和年齡自動調整音頻參數,解決了現有技術通過手動調整音頻設置不夠便利,以及無法根據車內人員的性別年齡和聽覺特征進行自適應調整的問題,以提升車內音頻體驗的個性化和智能化。
42、為達到上述目的,本技術第三方面實施例提出一種車輛,包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執行所述程序,以實現如上述實施例所述的自適應車載音頻設備的聲音調節方法。
43、為達到上述目的,本技術第四方面實施例提出一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行,以用于實現如上述實施例所述的自適應車載音頻設備的聲音調節方法。
44、本技術附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本技術的實踐了解到。