本發明涉及移動終端技術領域,尤其涉及一種耳機通話自適應調整方法、裝置、移動終端及存儲介質。
背景技術:
目前,手機的應用已經非常普遍,人們也越來越習慣利用耳機進行語音通話,通常情況下,人們讓麥克風正常下垂來進行通話,但是利用該種方式進行通話時存在著通話音量小的問題,現有技術中,通常利用自動增益控制(automaticgaincontrol,agc)自適應調整增益的方式,來提高通話音量,但是,agc自適應調整增益的方式來提高通話音量的同時,會對整個語音信號均進行放大,勢必會放大語音信號中的環境噪聲,反而導致通話的質量降低。
技術實現要素:
本發明實施例提供一種耳機通話自適應調整方法、裝置、移動終端及存儲介質,可以解決現有技術中存在的通過agc自適應調整增益的方式來提高通話音量的同時,會對整個語音信號均進行放大,勢必會放大語音信號中的環境噪聲,反而導致通話的質量降低的問題。
為實現上述目的,本發明實施例第一方面提供一種耳機通話自適應調整方法,包括:
在移動終端處于耳機通話模式下,采集環境中的語音信號;
解析所述語音信號,并通過預置的聲紋特征識別庫從解析得到的聲紋特征中,匹配得到目標聲紋特征;
確定所述目標聲紋特征所屬的聲音在所述語音信號中的語音幅值;
根據所述語音幅值調整所述語音信號中所述目標聲紋特征所屬的聲音的響度值及頻率值。
為實現上述目的,本發明實施例第二方面提供一種耳機通話自適應調整裝置,包括:
采集模塊,用于在移動終端處于耳機通話模式下,采集環境中的語音信號;
解析匹配模塊,用于解析所述語音信號,并通過預置的聲紋特征識別庫從解析得到的聲紋特征中,匹配得到目標聲紋特征;
確定模塊,用于確定所述目標聲紋特征所屬的聲音在所述語音信號中的語音幅值;
調整模塊,用于根據所述語音幅值調整所述語音信號中所述目標聲紋特征所屬的聲音的響度值及頻率值。
為實現上述目的,本發明實施例第三方面提供一種移動終端,包括:存儲器,處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時,實現第一方面所述的耳機通話自適應調整方法中的各個步驟。
為實現上述目的,本發明實施例第四方面提供一種存儲介質,所述存儲介質為計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時,實現第一方面所述的耳機通話自適應調整方法中的各個步驟。
本發明實施例提供一種耳機通話自適應調整方法、裝置、移動終端及存儲介質,該方法包括:在移動終端處于耳機通話模式下,采集環境中的語音信號,解析語音信號,并通過預置的聲紋特征識別庫從解析得到的聲紋特征中,匹配得到目標聲紋特征,確定目標聲紋特征所屬的聲音在語音信號中的語音幅值,根據語音幅值調整語音信號中目標聲紋特征所屬的聲音的響度值及頻率值。相對于現有技術,在耳機通話模式下,針對采集到的語音信號,通過預置的聲紋特征識別庫匹配出目標聲紋特征,對目標聲紋特征所屬的聲音的響度值及頻率值進行調整,相對于agc自適應增益調節方式,在提高通話音量的同時,能夠有效避免對環境噪聲放大的問題,提升通話質量。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為一種移動終端的結構框圖;
圖2為本發明第一實施例提供的一種耳機通話自適應調整方法的流程示意圖;
圖3是本發明第一實施中的步驟202的細化步驟的流程示意圖;
圖4是本發明第一實施中的步驟204的細化步驟的流程示意圖;
圖5為本發明第二實施例提供的一種耳機通話自適應調整方法的流程示意圖;
圖6為本發明第三實施例提供的一種耳機通話自適應調整裝置的結構示意圖;
圖7為本發明第三實施例中的解析匹配模塊602的細化結構示意圖;
圖8為本發明第三實施例中的調整模塊604的細化結構示意圖;
圖9為本發明第四實施例提供的一種耳機通話自適應調整裝置的結構示意圖。
具體實施方式
為使得本發明的發明目的、特征、優點能夠更加的明顯和易懂,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而非全部實施例。基于本發明中的實施例,本領域技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
圖1示出了一種移動終端的結構框圖。本發明實施例提供的耳機通話自適應調整方法可應用于如圖1所示的移動終端10中,移動終端10可以但不限于包括:需依靠電池維持正常運行且支持網絡及下載功能的智能手機、筆記本、平板電腦、穿戴智能設備等。
如圖1所示,移動終端10包括存儲器101、存儲控制器102,一個或多個(圖中僅示出一個)處理器103、外設接口104、射頻模塊105、按鍵模塊106、音頻模塊107以及觸控屏幕108。這些組件通過一條或多條通訊總線/信號線109相互通訊。
可以理解,圖1所示的結構僅為示意,其并不對移動終端的結構造成限定。移動終端10還可包括比圖1所示更多或者更少的組件,或者具有與圖1所示不同的配置。圖1所示的各組件可以采用硬件、軟件或其組合實現。
存儲器101可用于存儲軟件程序以及模塊,如本發明實施例中的耳機通話自適應調整方法及裝置對應的程序指令/模塊,處理器103通過運行存儲在存儲器101內的軟件程序以及模塊,從而執行各種功能應用以及數據處理,即實現上述的耳機通話自適應調整方法及裝置。
存儲器101可包括高速隨機存儲器,還可包括非易失性存儲器,如一個或者多個磁性存儲裝置、閃存、或者其他非易失性固態存儲器。在一些實例中,存儲器101可進一步包括相對于處理器103遠程設置的存儲器,這些遠程存儲器可以通過網絡連接至移動終端10。上述網絡的實例包括但不限于互聯網、企業內部網、局域網、移動通信網及其組合。處理器103以及其他可能的組件對存儲器101的訪問可在存儲控制器102的控制下進行。
外設接口104將各種輸入/輸入裝置耦合至cpu以及存儲器101。處理器103運行存儲器101內的各種軟件、指令以執行移動終端10的各種功能以及進行數據處理。
在一些實施例中,外設接口104,處理器103以及存儲控制器102可以在單個芯片中實現。在其他一些實例中,他們可以分別由獨立的芯片實現。
射頻模塊105用于接收以及發送電磁波,實現電磁波與電信號的相互轉換,從而與通訊網絡或者其他設備進行通訊。射頻模塊105可包括各種現有的用于執行這些功能的電路元件,例如,天線、射頻收發器、數字信號處理器、加密/解密芯片、用戶身份模塊(sim)卡、存儲器等等。射頻模塊105可與各種網絡如互聯網、企業內部網、預置類型的無線網絡進行通訊或者通過預置類型的無線網絡與其他設備進行通訊。上述的預置類型的無線網絡可包括蜂窩式電話網、無線局域網或者城域網。上述的預置類型的無線網絡可以使用各種通信標準、協議及技術,包括但并不限于全球移動通信系統(globalsystemformobilecommunication,gsm),增強型移動通信技術(enhanceddatagsmenvironment,edge),寬帶碼分多址技術(widebandcodedivisionmultipleaccess,w-cdma),碼分多址技術(codedivisionaccess,cdma),時分多址技術(timedivisionmultipleaccess,tdma),藍牙,無線保真技術(wireless-fidelity,wifi)(如美國電氣和電子工程師協會標準ieee802.11a、ieee802.11b、ieee802.11g和/或ieee802.11n),網絡電話(voiceoverinternetprotocal,voip),全球微波互聯接入(worldwideinteroperabilityformicrowaveaccess,wi-max),其他用于郵件、即時通訊及短消息的協議,以及任何其他合適的通訊協議。
按鍵模塊106提供用戶向移動終端進行輸入的接口,用戶可以通過按下不同的按鍵以使移動終端10執行不同的功能。
音頻模塊107向用戶提供音頻接口,其可包括一個或多個麥克風、一個或者多個揚聲器以及音頻電路。音頻電路從外設接口104處接收聲音數據,將聲音數據轉換為電信息,將電信息傳輸至揚聲器。揚聲器將電信息轉換為人耳能聽到的聲波。音頻電路還從麥克風處接收電信息,將電信號轉換為聲音數據,并將聲音數據傳輸至外設接口104中以進行進一步的處理。音頻數據可以從存儲器101處或者通過射頻模塊105獲取。此外,音頻數據也可以存儲至存儲器101中或者通過射頻模塊105進行發送。在一些實例中,音頻模塊107還可包括一個耳機播孔,用于向耳機或者其他設備提供音頻接口。
觸控屏幕108在移動終端與用戶之間同時提供一個輸出及輸入界面。具體地,觸控屏幕108向用戶顯示視頻輸出,這些視頻輸出的內容可包括文字、圖形、視頻、及其任意組合。一些輸出結果是對應于一些用戶界面對象。觸控屏幕108還接收用戶的輸入,例如用戶的點擊、滑動等手勢操作,以便用戶界面對象對這些用戶的輸入做出響應。檢測用戶輸入的技術可以是基于電阻式、電容式或者其他任意可能的觸控檢測技術。觸控屏幕108顯示單元的具體實例包括但并不限于液晶顯示器或發光聚合物顯示器。
基于上述移動終端描述本發明實施例中耳機通話自適應調整方法。
由于現有技術中,通過agc自適應調整增益的方式來提高通話音量的同時,會對整個語音信號均進行放大,勢必會放大語音信號中的環境噪聲,反而導致通話的質量降低的問題。
為了解決上述問題,本發明提出一種耳機通話自適應調整方法,在耳機通話模式下,針對采集到的語音信號,通過預置的聲紋特征識別庫匹配出目標聲紋特征,對目標聲紋特征所屬的聲音的響度值及頻率值進行調整,相對于agc自適應增益調節方式,在提高通話音量的同時,能夠有效避免對環境噪聲放大的問題,提升通話質量。
請參閱圖2,為本發明第一實施例中耳機通話自適應調整方法的流程示意圖,該方法包括:
步驟201、在移動終端處于耳機通話模式下,采集環境中的語音信號;
在本發明實施例中,上述的耳機通話自適應調整方法由耳機通話自適應調整裝置(以下簡稱為:調整裝置)實現,該調整裝置為程序模塊,存儲在移動終端的計算機可讀存儲介質中,可以由處理器執行。
在通話過程中,若移動終端處于耳機通話模式下,移動終端上的麥克風將采集環境中的語音信號,該調整裝置將實時獲取到麥克風采集到的語音信號,可以理解的是,該語音信號中至少包含該移動終端的通話者的聲音,且若環境中有其他聲音,麥克風也將采集到環境中存在的其他聲音。
其中,若移動終端處于耳機通話模式,則有兩種耳機通話方式,第一種是將耳機的麥克風靠近嘴邊來進行通話,第二種是讓麥克風正常下垂來進行通話。
步驟202、解析所述語音信號,并通過預置的聲紋特征識別庫從解析得到的聲紋特征中,匹配得到目標聲紋特征;
在本發明實施例中,聲紋在用電學儀器顯示時,是可以觀看到的攜帶語言信息的聲波頻譜,人類語言產生時,人體語言中樞與發音器官之間有一個復雜的生物物理過程,人在講話時所使用的發聲器官包括:舌、喉頭、肺、鼻腔等等,由于每一個人的發聲器官在尺寸和形態上各不相同,所以彼此的聲紋圖譜也會存在差異。聲紋特征是聲紋所具備的特征參數,是使得聲紋可靠的參數,不同的聲紋特征可以區分不同的聲音。
其中,每個移動終端中至少有一個預置的聲紋特征識別庫,該預置的聲紋特征識別庫中存儲該移動終端的使用者的聲紋特征。
在本發明實施例中,對于采集到的語音信號,將解析該語音信號,并將解析得到的聲紋特征與預置的聲紋特征識別庫進行匹配,從解析得到的聲紋特征中識別哪個才是當前的通話者的聲紋特征,并將識別的聲紋特征作為目標聲紋特征。
步驟203、確定所述目標聲紋特征所屬的聲音在所述語音信號中的語音幅值;
步驟204、根據所述語音幅值調整所述語音信號中所述目標聲紋特征所屬的聲音的響度值及頻率值。
在本發明實施例中,調整裝置確定該目標聲紋特征所屬的聲音在語音信號中的語音幅值,其中,該目標聲紋特征所屬的聲音即是通話者的聲音,且該語音幅值是指通話者的聲音所形成的聲波中波幅的平均值,或者是波幅的最小值。
其中,調整裝置將根據語音幅值調整語音信號中目標聲紋特征所屬的聲音的響度值及頻率值。
其中,響度值用于衡量音量的大小,頻率值用于衡量聲音的清晰度。
需要說明的是,在完成對語音信號的調整之后,可以將該語音信號發送給另一端的通話對象所使用的移動終端,以便該通話對象能夠收聽到清晰且音量合適的語音。
在本發明實施例中,在移動終端處于耳機通話模式下,采集環境中的語音信號,解析語音信號,并通過預置的聲紋特征識別庫從解析得到的聲紋特征中,匹配得到目標聲紋特征,確定目標聲紋特征所屬的聲音在語音信號中的語音幅值,根據語音幅值調整語音信號中目標聲紋特征所屬的聲音的響度值及頻率值。相對于現有技術,在耳機通話模式下,針對采集到的語音信號,通過預置的聲紋特征識別庫匹配出目標聲紋特征,對目標聲紋特征所屬的聲音的響度值及頻率值進行調整,相對于agc自適應增益調節方式,在提高通話音量的同時,能夠有效避免對環境噪聲放大的問題,提升通話質量。
請參閱圖3,為本發明第一實施例中的步驟202的細化步驟的流程示意圖,包括:
步驟301、解析所述語音信號,獲取所述語音信號中不同來源的各聲音的聲紋特征;
在本發明實施例中,不同來源的各聲音可以是通話者、電視、動物、機器等等各種各樣的能夠產生聲音的人或物或設備。
步驟302、查找所述聲紋特征識別庫,判斷所述各聲音的聲紋特征中,是否存在與所述聲紋特征識別庫中的聲紋特征相匹配的聲紋特征;
在本發明實施例中,移動終端內預置了聲紋特征識別庫,包括一個或多個用戶的聲紋特征,具體設置方式可以是:用戶通過點擊操作進入移動終端的設置界面,并選擇聲紋設置功能,以便移動終端的顯示界面顯示聲紋設置的開始按鈕,用戶點擊該按鈕之后說任意的內容,或者念出顯示界面顯示的內容,由移動終端上的麥克風采集用戶說的內容,并進行聲紋特征的分析,判斷分析得到的聲紋特征是否符合要求,若符合要求,則保存該聲紋特征至聲紋特征庫中,以完成聲紋特征的設置,若不符合要求,則顯示提示消息,提示用戶重新進行設置。通過該種方式,可以實現一個或多個用戶在一臺移動終端上的聲紋特征的設置。
步驟303、若存在匹配的聲紋特征,則將所述匹配的聲紋特征確定為所述目標聲紋特征;
在本發明實施例中,將解析得到的聲紋特征與預置的聲紋特征識別庫進行匹配,從解析得到的聲紋特征中識別哪個才是當前的通話者的聲紋特征,并將識別的聲紋特征作為目標聲紋特征。
在本發明實施例中,在移動終端處于耳機通話模式下,采集環境中的語音信號,解析語音信號,獲取語音信號中不同來源的各聲音的聲紋特征,查找聲紋特征識別庫,判斷各聲音的聲紋特征中,是否存在與聲紋特征識別庫中的聲紋特征相匹配的聲紋特征,若存在匹配的聲紋特征,則將匹配的聲紋特征確定為目標聲紋特征,確定目標聲紋特征所屬的聲音在語音信號中的語音幅值,根據語音幅值調整語音信號中目標聲紋特征所屬的聲音的響度值及頻率值。相對于現有技術,在耳機通話模式下,針對采集到的語音信號,通過預置的聲紋特征識別庫匹配出目標聲紋特征,對目標聲紋特征所屬的聲音的響度值及頻率值進行調整,相對于agc自適應增益調節方式,在提高通話音量的同時,能夠有效避免對環境噪聲放大的問題,提升通話質量。
請參閱圖4,為本發明第一實施例中的步驟204的細化步驟的流程示意圖,包括:
步驟401、查找預置的參數調整表,確定與所述語音幅值對應的目標響度值及目標頻率值,其中,所述參數調整表包括語音幅值、響度值及頻率值的映射關系;
步驟402、判斷所述目標響度值是否小于或等于預置閾值;
在本發明實施例中,移動終端預置了一個參數調整表,該參數調整表包括語音幅值、響度值及頻率值的映射關系,參數調整表預先設置一個標準參數,例如,語音幅值為10,對應的響度值及頻率值都為40,語音幅值為30,對應的響度值及頻率值都為70,該參數調整表中的響度值需要比語音幅值大40,40即為標準參數。
其中,預置一個閾值是為了防止響度值增加過大,出現破音現象。
步驟403、若所述目標響度小于或等于所述預置閾值,則將所述目標聲紋特征所屬的聲音的響度值及頻率值分別調整為所述目標響度值及所述目標頻率值。
在本發明實施例中,預置閾值是一個響度極限值,當目標響度值超過預置閾值時,在將目標聲紋特征所屬的聲音的響度值調整為目標響度值時,會出現破音現象。
在本發明實施例中,進行語音通話的時候,當本端通話者將耳機靠近嘴邊的時候,因目標響度小于或等于預置閾值,在將目標聲紋特征所屬的聲音的響度值調整為目標響度值時,對端通話者接收到語音信號時,不會出現破音的現象,因此目標響度小于或等于預置閾值,則將目標聲紋特征所屬的聲音的響度值及頻率值分別調整為目標響度值及目標頻率值。例如,預置閾值為100,語音幅值為10,對應的響度值及頻率值都為40,40小于100,則將目標聲紋特征所屬的聲音的響度值及頻率值分別調整為40。
進一步地,在步驟402之后還包括步驟404,步驟404與步驟403為并列關系,具體的:
步驟404、若所述目標響度大于所述預置閾值,則將所述目標聲紋特征所屬的聲音的響度值及頻率值分別調整為所述預置閾值及與所述預置閾值對應的預置頻率值。
在本發明實施例中,當本端通話者將耳機靠近嘴邊的時候,在目標響度大于預置閾值時,若將目標聲紋特征所屬的聲音的響度值及頻率值分別調整為目標響度值及目標頻率值,對端通話者接收到語音信號時,會出現破音的現象,因此,將目標聲紋特征所屬的聲音的響度值及頻率值分別調整為預置閾值及與預置閾值對應的預置頻率值。例如,預置閾值為100,語音幅值為70,對應的響度值及頻率值都為110,110大于100,則將目標聲紋特征所屬的聲音的響度值及頻率值分別調整為100,其中,通過判斷目標響度與預置閾值的關系,可以準確地調整目標聲紋特征所屬的聲音的響度值及頻率值,增強目標聲紋特征所屬的聲音的響度值及頻率值,提高通話音量的同時,防止接收方接聽語音信號時出現破音現象。
在本發明實施例中,若移動終端處于耳機通話模式,則有兩種耳機通話方式,第一種是將耳機的麥克風靠近嘴邊來進行通話,該方式存在破音現象;第二種是讓麥克風正常下垂來進行通話,該方式的通話音量小,現有技術中通過agc自適應增益調節方式來兼容這兩種通話方式,即提高通話音量的同時,防止破音現象,但是agc自適應增益調節方式在提高通話音量的同時,會對整個語音信號均進行放大,勢必會放大語音信號中的環境噪聲,反而導致通話的質量降低,本發明實施例中,通過調整目標聲紋特征所屬的聲音的響度值及頻率值來提高通話音量,通過判斷目標響度與預置閾值的關系從而防止出現破音,保證了通話語音質量。
請參閱圖5,為本發明第二實施例中語音信號自適應調整方法的流程示意圖,包括:
步驟501、在移動終端處于耳機通話模式下,采集環境中的語音信號;
步驟502、解析所述語音信號,并通過預置的聲紋特征識別庫從解析得到的聲紋特征中,匹配得到目標聲紋特征;
步驟503、確定所述目標聲紋特征所屬的聲音在所述語音信號中的語音幅值;
步驟504、根據所述語音幅值調整所述語音信號中所述目標聲紋特征所屬的聲音的響度值及頻率值;
步驟505、從所述語音信號中提取除所述目標聲紋特征以外的其他聲紋特征所屬的聲音,得到干擾語音信號;
步驟506、對所述干擾語音信號進行降噪處理。
可以理解的是,步驟501至步驟504分別與第一實施例中的步驟201至步驟204描述的內容相似,具體可以參閱第一實施例,此處不做贅述。
在本發明實施例中,在針對目標聲紋特征所屬的聲音進行調整后,為了進一步提高通話質量,還可以針對其他的聲音進行調整,具體的:調整裝置將從語音信號中提取除目標聲紋特征以外的其他聲紋特征所屬的聲音,得到干擾語音信號,例如,若語音信號中包含通話者的聲音、電機機播放廣告的聲音,則該通話者的聲音即為目標聲紋特征所屬的聲音,調整裝置將從該語音信號中提取電視機播放廣告的聲音,并作為干擾語音信號。進一步的,調整裝置將對該干擾語音信號進行降噪處理,以便在將調整后的語音信號發送給另一端的通話對象之后,該通話對象收聽到的語音信號中有效信號(即通話者的聲音)更加清晰且音量合適,而無效信號(即干擾語音信號)更弱。
其中,該降噪處理可以采用的方式有多種,如噪聲門降噪法、采樣降噪法、濾波降噪法等等。
在本發明實施例中,在對語音信號中目標聲紋特征所屬的聲音進行調整后,還將進一步的對語音信號中的干擾語音信號進行降噪處理,以便進一步的提升通話質量,改善通話體驗。
請參閱圖6,為本發明第三實施例中耳機通話自適應調整裝置的結構示意圖,該裝置包括采集模塊601、解析匹配模塊602、確定模塊603及調整模塊604,具體的:
采集模塊601,用于在移動終端處于耳機通話模式下,采集環境中的語音信號;
在本發明實施例中,上述的耳機通話自適應調整方法由耳機通話自適應調整裝置(以下簡稱為:調整裝置)實現,該調整裝置為程序模塊,存儲在移動終端的計算機可讀存儲介質中,可以由處理器執行。
在通話過程中,若移動終端處于耳機通話模式下,移動終端上的麥克風將采集環境中的語音信號,采集模塊601將實時獲取到麥克風采集到的語音信號,可以理解的是,該語音信號中至少包含該移動終端的通話者的聲音,且若環境中有其他聲音,麥克風也將采集到環境中存在的其他聲音。
其中,若移動終端處于耳機通話模式,則有兩種耳機通話方式,第一種是將耳機的麥克風靠近嘴邊來進行通話,第二種是讓麥克風正常下垂來進行通話。
解析匹配模塊602,用于解析所述語音信號,并通過預置的聲紋特征識別庫從解析得到的聲紋特征中,匹配得到目標聲紋特征;
在本發明實施例中,聲紋在用電學儀器顯示時,是可以觀看到的攜帶語言信息的聲波頻譜,人類語言產生時,人體語言中樞與發音器官之間有一個復雜的生物物理過程,人在講話時所使用的發聲器官包括:舌、喉頭、肺、鼻腔等等,由于每一個人的發聲器官在尺寸和形態上各不相同,所以彼此的聲紋圖譜也會存在差異。聲紋特征是聲紋所具備的特征參數,是使得聲紋可靠的參數,不同的聲紋特征可以區分不同的聲音。
其中,每個移動終端中至少有一個預置的聲紋特征識別庫,該預置的聲紋特征識別庫中存儲該移動終端的使用者的聲紋特征。
在本發明實施例中,對于采集到的語音信號,解析匹配模塊602將解析該語音信號,并將解析得到的聲紋特征與預置的聲紋特征識別庫進行匹配,從解析得到的聲紋特征中識別哪個才是當前的通話者的聲紋特征,并將識別的聲紋特征作為目標聲紋特征。
確定模塊603,用于確定所述目標聲紋特征所屬的聲音在所述語音信號中的語音幅值;
調整模塊604,用于根據所述語音幅值調整所述語音信號中所述目標聲紋特征所屬的聲音的響度值及頻率值。
在本發明實施例中,確定模塊603確定該目標聲紋特征所屬的聲音在語音信號中的語音幅值,其中,該目標聲紋特征所屬的聲音即是通話者的聲音,且該語音幅值是指通話者的聲音所形成的聲波中波幅的平均值,或者是波幅的最小值。
其中,調整模塊604將根據所述語音幅值調整所述語音信號中所述目標聲紋特征所屬的聲音的響度值及頻率值。
其中,響度值用于衡量音量的大小,頻率值用于衡量聲音的清晰度。
需要說明的是,在完成對語音信號的調整之后,可以將該語音信號發送給另一端的通話對象所使用的移動終端,以便該通話對象能夠收聽到清晰且音量合適的語音。
在本發明實施例中,在移動終端處于耳機通話模式下,采集模塊601采集環境中的語音信號,解析匹配模塊602解析語音信號,并通過預置的聲紋特征識別庫從解析得到的聲紋特征中,匹配得到目標聲紋特征,確定模塊603確定目標聲紋特征所屬的聲音在語音信號中的語音幅值,調整模塊604根據語音幅值調整語音信號中目標聲紋特征所屬的聲音的響度值及頻率值。相對于現有技術,在耳機通話模式下,針對采集到的語音信號,通過預置的聲紋特征識別庫匹配出目標聲紋特征,對目標聲紋特征所屬的聲音的響度值及頻率值進行調整,相對于agc自適應增益調節方式,在提高通話音量的同時,能夠有效避免對環境噪聲放大的問題,提升通話質量。
請參閱圖7,為本發明第三實施例中的解析匹配模塊602的細化結構示意圖,包括解析單元701、第一查找單元702及確定單元703,具體的:
解析單元701,用于解析所述語音信號,獲取所述語音信號中不同來源的各聲音的聲紋特征;
在本發明實施例中,不同來源的各聲音可以是通話者、電視、動物、機器等等各種各樣的能夠產生聲音的人或物或設備。
第一查找單元702,用于查找所述聲紋特征識別庫,判斷所述各聲音的聲紋特征中,是否存在與所述聲紋特征識別庫中的聲紋特征相匹配的聲紋特征;
在本發明實施例中,移動終端內預置了聲紋特征識別庫,包括一個或多個用戶的聲紋特征,具體設置方式可以是:用戶通過點擊操作進入移動終端的設置界面,并選擇聲紋設置功能,以便移動終端的顯示界面顯示聲紋設置的開始按鈕,用戶點擊該按鈕之后說任意的內容,或者念出顯示界面顯示的內容,由移動終端上的麥克風采集用戶說的內容,并進行聲紋特征的分析,判斷分析得到的聲紋特征是否符合要求,若符合要求,則保存該聲紋特征至聲紋特征庫中,以完成聲紋特征的設置,若不符合要求,則顯示提示消息,提示用戶重新進行設置。通過該種方式,可以實現一個或多個用戶在一臺移動終端上的聲紋特征的設置。
確定單元703,用于若存在匹配的聲紋特征,則將所述匹配的聲紋特征確定為所述目標聲紋特征;
在本發明實施例中,將解析得到的聲紋特征與預置的聲紋特征識別庫進行匹配,從解析得到的聲紋特征中識別哪個才是當前的通話者的聲紋特征,并將識別的聲紋特征作為目標聲紋特征。
在本發明實施例中,在移動終端處于耳機通話模式下,采集環境中的語音信號,解析單元701解析語音信號,獲取語音信號中不同來源的各聲音的聲紋特征,第一查找單元702查找聲紋特征識別庫,判斷各聲音的聲紋特征中,是否存在與聲紋特征識別庫中的聲紋特征相匹配的聲紋特征,若存在匹配的聲紋特征,確定單元703則將匹配的聲紋特征確定為目標聲紋特征,確定目標聲紋特征所屬的聲音在語音信號中的語音幅值,根據語音幅值調整語音信號中目標聲紋特征所屬的聲音的響度值及頻率值。相對于現有技術,在耳機通話模式下,針對采集到的語音信號,通過預置的聲紋特征識別庫匹配出目標聲紋特征,對目標聲紋特征所屬的聲音的響度值及頻率值進行調整,相對于agc自適應增益調節方式,在提高通話音量的同時,能夠有效避免對環境噪聲放大的問題,提升通話質量。
請參閱圖8,為本發明第三實施例中的調整模塊604的細化結構示意圖,包括第二查找單元801、判斷單元802、第一調整單元803及第二調整單元804,具體的:
第二查找單元801,用于查找預置的參數調整表,確定與所述語音幅值對應的目標響度值及目標頻率值,其中,所述參數調整表包括語音幅值、響度值及頻率值的映射關系;
判斷單元802,用于判斷所述目標響度值是否小于或等于預置閾值;
在本發明實施例中,移動終端預置了一個參數調整表,該參數調整表包括語音幅值、響度值及頻率值的映射關系,參數調整表預先設置一個標準參數,例如,語音幅值為10,對應的響度值及頻率值都為40,語音幅值為30,對應的響度值及頻率值都為70,該參數調整表中的響度值需要比語音幅值大40,40即為標準參數。
其中,預置一個閾值是為了防止響度值增加過大,出現破音現象。
第一調整單元803,用于若所述目標響度小于或等于所述預置閾值,則將所述目標聲紋特征所屬的聲音的響度值及頻率值分別調整為所述目標響度值及所述目標頻率值。
在本發明實施例中,預置閾值是一個響度極限值,當目標響度值超過預置閾值時,在將目標聲紋特征所屬的聲音的響度值調整為目標響度值時,會出現破音現象。
在本發明實施例中,進行語音通話的時候,當本端通話者將耳機靠近嘴邊的時候,因目標響度小于或等于預置閾值,在將目標聲紋特征所屬的聲音的響度值調整為目標響度值時,對端通話者接收到語音信號時,不會出現破音的現象,因此目標響度小于或等于預置閾值,則將目標聲紋特征所屬的聲音的響度值及頻率值分別調整為目標響度值及目標頻率值。例如,預置閾值為100,語音幅值為10,對應的響度值及頻率值都為40,40小于100,則將目標聲紋特征所屬的聲音的響度值及頻率值分別調整為40。
第二調整單元804,用于若所述目標響度大于所述預置閾值,則將所述目標聲紋特征所屬的聲音的響度值及頻率值分別調整為所述預置閾值及與所述預置閾值對應的預置頻率值。
在本發明實施例中,當本端通話者將耳機靠近嘴邊的時候,在目標響度大于預置閾值,若將目標聲紋特征所屬的聲音的響度值及頻率值分別調整為目標響度值及目標頻率值,對端通話者接收到語音信號時,會出現破音的現象,因此,將目標聲紋特征所屬的聲音的響度值及頻率值分別調整為預置閾值及與預置閾值對應的預置頻率值。例如,預置閾值為100,語音幅值為70,對應的響度值及頻率值都為110,110大于100,則將目標聲紋特征所屬的聲音的響度值及頻率值分別調整為100,其中,判斷單元802通過判斷目標響度與預置閾值的關系,可以準確地調整目標聲紋特征所屬的聲音的響度值及頻率值,增強目標聲紋特征所屬的聲音的響度值及頻率值,提高通話質量的同時,防止接收方接聽語音信號時出現破音現象。
在本發明實施例中,若移動終端處于耳機通話模式,則有兩種耳機通話方式,第一種是將耳機的麥克風靠近嘴邊來進行通話,該方式存在破音現象;第二種是讓麥克風正常下垂來進行通話,該方式的通話音量小,現有技術中通過agc自適應增益調節方式來兼容這兩種通話方式,即提高通話音量的同時,防止破音現象,但是agc自適應增益調節方式在提高通話音量的同時,會對整個語音信號均進行放大,勢必會放大語音信號中的環境噪聲,反而導致通話的質量降低,本發明實施例中,通過調整目標聲紋特征所屬的聲音的響度值及頻率值來提高通話音量,通過判斷目標響度與預置閾值的關系從而防止出現破音,保證了通話語音質量。
請參閱圖9,為本發明第四實施例中耳機通話自適應調整裝置的結構示意圖,該裝置包括采集模塊601、解析匹配模塊602、確定模塊603、調整模塊604、提取模塊901及降噪模塊902,具體的:
采集模塊601,用于在移動終端處于耳機通話模式下,采集環境中的語音信號;
解析匹配模塊602,用于解析所述語音信號,并通過預置的聲紋特征識別庫從解析得到的聲紋特征中,匹配得到目標聲紋特征;
確定模塊603,用于確定所述目標聲紋特征所屬的聲音在所述語音信號中的語音幅值;
調整模塊604,用于根據所述語音幅值調整所述語音信號中所述目標聲紋特征所屬的聲音的響度值及頻率值;
其中,本發明實施例中的采集模塊601、解析匹配模塊602、確定模塊603及調整模塊604分別與第三實施例中的采集模塊601、解析匹配模塊602、確定模塊603及調整模塊604描述的內容一致,此處不再贅述
提取模塊901,用于從所述語音信號中提取除所述目標聲紋特征以外的其他聲紋特征所屬的聲音,得到干擾語音信號;
降噪模塊902,用于對所述干擾語音信號進行降噪處理。
在本發明實施例中,在針對目標聲紋特征所屬的聲音進行調整后,為了進一步提高通話質量,還可以針對其他的聲音進行調整,具體的:提取模塊901將從語音信號中提取除目標聲紋特征以外的其他聲紋特征所屬的聲音,得到干擾語音信號,例如,若語音信號中包含通話者的聲音、電機機播放廣告的聲音,則該通話者的聲音即為目標聲紋特征所屬的聲音,提取模塊901將從該語音信號中提取電視機播放廣告的聲音,并作為干擾語音信號。進一步的,降噪模塊902將對該干擾語音信號進行降噪處理,以便在將調整后的語音信號發送給另一端的通話對象之后,該通話對象收聽到的語音信號中有效信號(即通話者的聲音)更加清晰且音量合適,而無效信號(即干擾語音信號)更弱。
其中,該降噪處理可以采用的方式有多種,如噪聲門降噪法、采樣降噪法、濾波降噪法等等。
在本發明實施例中,在提取模塊901對語音信號中目標聲紋特征所屬的聲音進行調整后,降噪模塊902還將進一步的對語音信號中的干擾語音信號進行降噪處理,以便進一步的提升通話質量,改善通話體驗。
本發明實施例還提供一種移動終端,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,處理器執行計算機程序時,實現第一實施例至第二實施例中任意一實施例中的耳機通話自適應調整方法中的各個步驟。
本發明實施例還提供一種存儲介質,該存儲介質具體可以為計算機可讀存儲介質,其上存儲有計算機程序,計算機程序被處理器執行時,實現第一實施例至第二實施例中任意一實施例中的耳機通話自適應調整方法中的各個步驟。
在本申請所提供的幾個實施例中,應該理解到,所揭露的裝置和方法,可以通過其它的方式實現。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述模塊的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個模塊或組件可以結合或者可以集成到另一個系統,或一些特征可以忽略,或不執行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或模塊的間接耦合或通信連接,可以是電性,機械或其它的形式。
所述作為分離部件說明的模塊可以是或者也可以不是物理上分開的,作為模塊顯示的部件可以是或者也可以不是物理模塊,即可以位于一個地方,或者也可以分布到多個網絡模塊上。可以根據實際的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。
另外,在本發明各個實施例中的各功能模塊可以集成在一個處理模塊中,也可以是各個模塊單獨物理存在,也可以兩個或兩個以上模塊集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現,也可以采用軟件功能模塊的形式實現。
所述集成的模塊如果以軟件功能模塊的形式實現并作為獨立的產品銷售或使用時,可以存儲在一個計算機可讀取存儲介質中。基于這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟件產品的形式體現出來,該計算機軟件產品存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)執行本發明各個實施例所述方法的全部或部分步驟。而前述的存儲介質包括:u盤、移動硬盤、只讀存儲器(rom,read-onlymemory)、隨機存取存儲器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲程序代碼的介質。
需要說明的是,對于前述的各方法實施例,為了簡便描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本發明并不受所描述的動作順序的限制,因為依據本發明,某些步驟可以采用其它順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬于優選實施例,所涉及的動作和模塊并不一定都是本發明所必須的。
在上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有詳述的部分,可以參見其它實施例的相關描述。
以上為對本發明所提供的一種耳機通話自適應調整方法、裝置、移動終端及存儲介質的描述,對于本領域的技術人員,依據本發明實施例的思想,在具體實施方式及應用范圍上均會有改變之處,綜上,本說明書內容不應理解為對本發明的限制。