移動終端及其語音輸入方法和裝置與流程

文檔序號：12476014閱讀：308來源：國知局

本發明涉及到語音處理領域，特別是涉及到移動終端及其語音輸入方法和裝置。

背景技術：

具有語音識別等功能的移動終端，一般都具有音頻打斷功能，比如后視鏡行車記錄儀，需要具備打斷功能，即支持漸進理解自由打斷的功能，可隨時根據語音指令對系統播報進行糾正和更改等；該功能需要使用到常用的回聲+喚醒技術。其主要處理的流程為：在一個空間內同時存在移動終端播放的音頻信號和聲源信號，系統通過麥克風錄音時能夠采集到此兩種信號，同時對移動終端播放的音頻信號進行采樣從而獲得單獨的參考信號，將此參考信號和麥克風采集到的兩種信號混合后的聲音信號做回聲消除處理，只保留聲源信號，最后將保留的聲源信號送到喚醒引擎做喚醒處理，喚醒成功之后移動終端的系統會反饋給到主機，完成整個回聲消除+喚醒過程。上述移動終端播放的音頻信號即為后視鏡行車記錄儀等移動終端本身發出的音頻信號，或者移動終端通過藍牙、WIFI等通訊模塊接收的音頻信號，該音頻信號可以稱之為原生音頻信號，也就是非外部聲源產生的信號，移動終端播放音頻信號的狀態可認為移動終端處于音頻輸出狀態；如果移動終端未播放音頻信號，則認為移動終端處于拾音狀態，此狀態下，移動終端無需進行回聲消除處理。

現有MT6753等只支持兩路麥克風輸入的聲音處理平臺，使用較為廣泛，其中，上述聲音處理平臺的第一音頻輸入接口連接一枚麥克風拾取聲音，另外的第二音頻輸入接口接收參考信號進行回聲消除參考用；因此述聲音處理平臺在不增加單獨的語音處理IC的情況下，麥克風拾取聲音只能實現單麥克風降噪，在環境噪聲復雜的情況下會大大降低環境降噪的能力；而通過增加單獨的語音處理IC(integratedcircuit，縮寫：IC；其為半導體元件產品的統稱，包括：1.集成電路；2.二、三極管；3.特殊電子元件)來實現多麥克風降噪能力，其成本會太高，性價比很低。

技術實現要素：

本發明的主要目的為提供一種無需增加語音處理IC即可實現多麥克風降噪的移動終端及其語音輸入方法和裝置。

為了上述發明目的，本發明提出一種語音輸入方法，其應用于移動終端，其中，第一麥克風接入所述移動終端的第一音頻輸入接口，所述語音輸入方法包括：

移動終端判斷其語音輸入環境所處的狀態；

如果判定語音輸入環境處于音頻輸出狀態，則將參考信號接入所述移動終端預設的第二音頻輸入接口；

如果判定語音輸入環境處于拾音狀態，則將第二麥克風接入所述移動終端預設的第二音頻輸入接口。

進一步地，所述移動終端判斷其語音輸入環境所處的狀態的步驟，包括：

判斷移動終端是否輸出原生音頻信號至音頻功放；

如果是，則判定語音輸入環境處于所述音頻輸出狀態；否則，判定語音輸入環境處于所述拾音狀態。

進一步地，所述如果判定語音輸入環境處于音頻輸出狀態，則將參考信號接入所述移動終端預設的第二音頻輸入接口的步驟之后，包括：

通過第一麥克風接收所述音頻功放播放的對應所述原生音頻信號的原生聲音信號；

根據所述參考信號對所述原生聲音信號進行回音消除處理。

進一步地，所述如果判定語音輸入環境處于音頻輸出狀態，則將參考信號接入所述移動終端預設的第二音頻輸入接口的步驟之后，包括：

調用預設的單麥克風的降噪算法進行降噪處理。

進一步地，所述根據所述參考信號對所述原生聲音信號進行回音消除處理的步驟之后，包括：

通過第一麥克風獲取預設的語音命令，根據所述語音命令執行對應的任務。

進一步地，所述通過第一麥克風獲取預設的語音命令，根據所述語音命令執行對應的任務的步驟之后，包括：

所述任務完成指定時間長度后，控制所述移動終端輸出原生音頻信號至音頻功放。

進一步地，所述如果判定語音輸入環境處于拾音狀態，則將第二麥克風接入所述移動終端預設的第二音頻輸入接口的步驟之后，包括：

通過所述第一麥克風和第二麥克風接收外部聲源的聲音信號，并調用預設的雙麥克風的降噪算法進行降噪處理。

進一步地，所述如果判定語音輸入環境處于拾音狀態，則將第二麥克風接入所述移動終端預設的第二音頻輸入接口的步驟之后，包括：

通過第一麥克風和第二麥克風接收語音信息，并判斷語音信息中是否含有第一關鍵字語音；

如果含有所述第一關鍵字語音，則記錄所述第一麥克風和第二麥克風接收到第一關鍵字語音時的定位信息；

根據各所述麥克風的位置坐標，以及所述定位信息，計算發出所述第一關鍵字語音的聲源位置。

進一步地，所述根據各所述麥克風的位置坐標，以及所述定位信息，計算發出所述第一關鍵字語音的聲源位置的步驟之后，包括：

根據所述聲源位置，利用預設的拾音算法拾取所述聲源方向的語音信息。

進一步地，所述移動終端判斷其語音輸入環境所處的狀態的步驟之前，包括：

如果接收到來電信號，則直接進入所述拾音狀態。

本發明還提供一種語音輸入裝置，其應用于移動終端，其中，第一麥克風接入所述移動終端的第一音頻輸入接口，所述語音輸入裝置包括：

判斷單元，用于移動終端判斷其語音輸入環境所處的狀態；

第一接入單元，用于如果判定語音輸入環境處于音頻輸出狀態，則將參考信號接入所述移動終端預設的第二音頻輸入接口；

第二接入單元，用于如果判定語音輸入環境處于拾音狀態，則將第二麥克風接入所述移動終端預設的第二音頻輸入接口。

進一步地，所述判斷單元，包括：

判斷模塊，用于判斷移動終端是否輸出原生音頻信號至音頻功放；

判定模塊，用于如果移動終端輸出原生音頻信號至音頻功放，則判定語音輸入環境處于所述音頻輸出狀態；否則，判定語音輸入環境處于所述拾音狀態。

進一步地，所述語音輸入裝置，還包括：

接收單元，用于通過第一麥克風接收所述音頻功放播放的對應所述原生音頻信號的原生聲音信號；

消音單元，用于根據所述參考信號對所述原生聲音信號進行回音消除處理。

進一步地，所述語音輸入裝置，還包括：

第一調用單元，用于調用預設的單麥克風的降噪算法進行降噪處理。

進一步地，所述語音輸入裝置，還包括：

獲取執行單元，用于通過第一麥克風獲取預設的語音命令，根據所述語音命令執行對應的任務。

進一步地，所述語音輸入裝置，還包括：

控制輸出單元，用于所述任務完成指定時間長度后，控制所述移動終端輸出原生音頻信號至音頻功放。

進一步地，所述語音輸入裝置，還包括：

第二調用單元，用于通過所述第一麥克風和第二麥克風接收外部聲源的聲音信號，并調用預設的雙麥克風的降噪算法進行降噪處理。

進一步地，所述語音輸入裝置，還包括：

關鍵音判斷單元，用于通過第一麥克風和第二麥克風接收語音信息，并判斷語音信息中是否含有第一關鍵字語音；

記錄單元，用于如果含有所述第一關鍵字語音，則記錄所述第一麥克風和第二麥克風接收到第一關鍵字語音時的定位信息；

計算定位單元，用于根據各所述麥克風的位置坐標，以及所述定位信息，計算發出所述第一關鍵字語音的聲源位置。

進一步地，所述語音輸入裝置，還包括：

定向拾音單元，用于根據所述聲源位置，利用預設的拾音算法拾取所述聲源方向的語音信息。

進一步地，所述語音輸入裝置，還包括：

接收進入單元，用于如果接收到來電信號，則直接進入所述拾音狀態。

本發明還提供一種移動終端，包括處理器、第一麥克風、第二麥克風、模擬開關、音頻功放、參考信號線路、以及設置第一音頻輸入接口和第二音頻輸入接口的音頻數模轉換器；

所述處理器分別與所述模擬開關、音頻數模轉換器通信連接；所述音頻數模轉換器通信連接所述音頻功放；所述第一麥克風接入所述第一音頻輸入接口；所述第二麥克風和參考信號線路連接所述模擬開關；所述模擬開關接入所述第二音頻輸入接口；

所述處理器接收音頻數模轉換器的工作信號，判斷所述移動終端的語音輸入環境所處的狀態；

如果判定語音輸入環境處于音頻輸出狀態，則通過所述模擬開關將所述參考信號接入所述第二音頻輸入接口；

如果判定語音輸入環境處于拾音狀態，則通過所述模擬開關將第二麥克風接入所述移動終端預設的第二音頻輸入接口。

進一步地，所述處理器判斷所述移動終端的語音輸入環境所處的狀態的方法，包括：

判斷移動終端是否輸出原生音頻信號至音頻功放；如果是，則判定語音輸入環境處于所述音頻輸出狀態；否則，判定語音輸入環境處于所述拾音狀態。

進一步地，所述處理器判定語音輸入環境處于音頻輸出狀態后，通過所述第一麥克風接收所述音頻功放播放的對應所述原生音頻信號的原生聲音信號；根據所述參考信號對所述原生聲音信號進行回音消除處理。

進一步地，所述處理器判定語音輸入環境處于音頻輸出狀態后，調用預設的單麥克風的降噪算法進行降噪處理。

進一步地，所述處理器通過所述第一麥克風獲取預設的語音命令，根據所述語音命令執行對應的任務。

進一步地，所述處理器在所述任務完成指定時間長度后，控制所述音頻數模轉換器輸出原生音頻信號至音頻功放。

進一步地，所述處理器判定語音輸入環境處于拾音狀態后，通過所述第一麥克風和第二麥克風接收外部聲源的聲音信號，并調用預設的雙麥克風的降噪算法進行降噪處理。

進一步地，所述處理器判定語音輸入環境處于拾音狀態后，通過第一麥克風和第二麥克風接收語音信息，并判斷語音信息中是否含有第一關鍵字語音；如果含有所述第一關鍵字語音，則記錄所述第一麥克風和第二麥克風接收到第一關鍵字語音時的定位信息；根據各所述麥克風的位置坐標，以及所述定位信息，計算發出所述第一關鍵字語音的聲源位置。

進一步地，所述處理器根據所述聲源位置，利用預設的拾音算法拾取所述聲源方向的語音信息。

進一步地，所述處理器在判斷所述移動終端的語音輸入環境所處的狀態之前，如果移動終端接收到來電信號，則控制移動終端直接進入所述拾音狀態。

本發明的移動終端及其語音輸入方法和裝置，可以實現在移動終端不同狀態下采用單麥克風和雙麥克風拾音，保證了移動終端必備的打斷功能，同時還實現了外部環境噪聲復雜時通過雙麥克風拾音，提高語音輸入的準確性。而且本發明只需要基于兩路音頻輸入接口完成，無需添加語音處理IC，降低移動終端的成本。

附圖說明

圖1為本發明一實施例的語音輸入方法的流程示意圖；

圖2為本發明一具體實施例的語音輸入方法的流程示意圖；

圖3為本發明一實施例的語音輸入裝置的結構示意框圖；

圖4為本發明一實施例的判斷單元的結構示意框圖；

圖5為本發明一具體實施例的語音輸入裝置的結構示意框圖；

圖6為本發明一實施例的移動終端的結構示意框圖。

本發明目的的實現、功能特點及優點將結合實施例，參照附圖做進一步說明。

具體實施方式

應當理解，此處所描述的具體實施例僅僅用以解釋本發明，并不用于限定本發明。

本技術領域技術人員可以理解，除非特意聲明，這里使用的單數形式“一”、“一個”、“所述”和“該”也可包括復數形式。應該進一步理解的是，本發明的說明書中使用的措辭“包括”是指存在所述特征、整數、步驟、操作、元件和/或組件，但是并不排除存在或添加一個或多個其他特征、整數、步驟、操作、元件、組件和/或它們的組。這里使用的措辭“和/或”包括一個或更多個相關聯的列出項的全部或任一單元和全部組合。

本技術領域技術人員可以理解，除非另外定義，這里使用的所有術語(包括技術術語和科學術語)，具有與本發明所屬領域中的普通技術人員的一般理解相同的意義。還應該理解的是，諸如通用字典中定義的那些術語，應該被理解為具有與現有技術的上下文中的意義一致的意義，并且除非像這里一樣被特定定義，否則不會用理想化或過于正式的含義來解釋。

本技術領域技術人員可以理解，這里的移動終端是指智能手機、電腦、平板電腦、形成記錄儀等可以運行計算機程序的電子設備。

參照圖1，本發明實施例提供一種語音輸入方法，其應用于移動終端，其中，第一麥克風接入所述移動終端的第一音頻輸入接口，所述語音輸入方法包括步驟：

S1、移動終端判斷其語音輸入環境所處的狀態；

S2、如果判定語音輸入環境處于音頻輸出狀態，則將參考信號接入所述移動終端預設的第二音頻輸入接口；

S3、如果判定語音輸入環境處于拾音狀態，則將第二麥克風接入所述移動終端預設的第二音頻輸入接口。

如上述步驟S1、S2、S3所述，上述移動終端的語音輸入環境一般包括兩種，即音頻輸出狀態和拾音狀態。上述音頻輸出狀態，是指移動終端本身輸出音頻的狀態，如移動終端播放其自身播放的音樂音頻，或者接收電臺的廣播音頻、或者通過藍牙/WIFI等通信模塊接收的音頻等。上述拾音狀態，是指移動終端沒有輸出音頻信號，即移動終端本身并沒有輸出音頻。本實施例中，上述移動終端的語音輸入環境處于音頻輸出狀態時，同樣可以拾音，但是在拾音的過程中還會輸出音樂等音頻信號。上述參考信號即為移動終端采集其本身輸出音頻的采樣信號。上述第二麥克風即為拾音裝置。上述步驟S2和S3是并列的兩個步驟，移動終端會根據語音輸入環境所處的狀態進行擇一進行，也就是步驟S2和S3不會同時進行。本實施例中，上述參考信號和第二麥克風共用同一個第二音頻輸入接口，根據語音輸入環境所處的狀態進行轉換，在移動終端的音頻數模轉換器只要設置兩個音頻輸入接口的情況下，既可以準確地實現音頻打斷功能，還可以實現雙麥克風拾音，提高拾音效果。更為重要的時，無需在移動終端的音頻數模轉換器添加單獨的語音處理IC，大大地減低生產成本。

本實施例中，上述移動終端判斷其語音輸入環境所處的狀態的步驟S1，包括：

S11、判斷移動終端是否輸出原生音頻信號至音頻功放；

S12、如果是，則判定語音輸入環境處于所述音頻輸出狀態；否則，判定語音輸入環境處于所述拾音狀態。

如上述步驟S11和S12所述，移動終端可以清楚地知道其是否發出原生音頻信號至音頻功放，如果發送，則判定語音輸入環境處于所述音頻輸出狀態，如果未發送，判定語音輸入環境處于所述拾音狀態，方法簡單、高效，準確率高。上述原生音頻信號即為移動終端本身發出的音頻信號，或者移動終端通過藍牙、WIFI等通訊模塊接收的音頻信號。即，原生音頻信號不是通過麥克風拾取移動終端外部聲源發出的音頻信號。

參照圖2，本實施例中，上述如果判定語音輸入環境處于音頻輸出狀態，則將參考信號接入所述移動終端預設的第二音頻輸入接口的步驟S2之后，包括：

S21、通過第一麥克風接收所述音頻功放播放的對應所述原生音頻信號的原生聲音信號；

S22、根據所述參考信號對所述原生聲音信號進行回音消除處理。

如上述步驟S21和S22所述，上述第一麥克風同樣是拾音裝置，其單獨連接在移動終端的音頻數模轉換器上的第一音頻輸入接口。上述音頻功放全名為音頻功率放大器，是用于推動揚聲器發聲，從而重現聲音的功放裝置，其連接揚聲器。上述原生聲音信號即為原生音頻信號通過音頻功放處理后由揚聲器發出的聲音信號。因為原生音頻信號在經過音頻功放之前會被采樣得到上述參考信號，然后參考信號與第一麥克風接收到聲音信號進行比對，將與參考信號匹配的聲音信號進行消除處理，而與參考信號匹配的信號一般即為上述原生聲音信號，所以，當第一麥克風采集到原生聲音信號和外部聲源的聲音信號后，可以將原生聲音信號過濾掉，只保留外部聲源的聲音信號，如果外部聲源的聲音信號為語音命令時，會更容易被移動終端準確識別。

參照圖2，本實施例中，上述如果判定語音輸入環境處于音頻輸出狀態，則將參考信號接入所述移動終端預設的第二音頻輸入接口的步驟S2之后，包括：

S23、調用預設的單麥克風的降噪算法進行降噪處理。

如上述步驟S23所述，上述單麥克風的降噪算法包括多種，比如，預設噪音的頻譜，在外部聲源和環境音被麥克風一起拾取后，將與預設噪音的頻譜相同的聲音信號進行過濾；或者，麥克風先獲取環境音并記錄，當外部聲源和環境音被麥克風一起拾取后，將與先獲取記錄的環境音相同或近似的聲音信號消除，保留外部聲源的聲音信號等。

參照圖2，本實施例中，所述根據參考信號對所述原生聲音信號進行回音消除處理的步驟S22之后，包括：

S24、通過第一麥克風獲取預設的語音命令，根據所述語音命令執行對應的任務。

如上述步驟S24所述，上述語音命令即為移動終端預設的命令，其一般會設置一個命令列表，該命令列表上記錄有至少一個命令，每個命令對應一個指定的語音命令。比如，移動終端為行車記錄儀，命令列表上記錄“導航”、“撥打電話”、“朗讀短息”等命令，其對應的語音命令為“導航”、“撥打電話”、“朗讀短息”的漢語發音，當獲取到“導航”漢語發音時，行車記錄執行“導航”的命令進入導航頁面等。本實施例中，因為將原生聲音信號進行回音消除處理，所以語音命令被準確識別的概率提高。

參照圖2，本實施例中，上述通過第一麥克風獲取預設的語音命令，根據所述語音命令執行對應的任務的步驟S24之后，包括：

S25、所述任務完成指定時間長度后，控制所述移動終端輸出原生音頻信號至音頻功放。

如上述步驟S25所述，即移動終端在執行語音命令之后一定時間后，會再次自動啟動原生音頻信號輸出的動作。比如，移動終端是行車記錄儀，該行車記錄儀在播放音樂，當獲取到“導航”漢語發音時，行車記錄執行“導航”的命令進入導航頁面，過了指定時間長度后，移動終端自動再次啟動播放音樂的動作。因為在導航過程中，并不會實時的發出導航語音，用戶可能還是想要聽音樂，當過指定時間長度后，移動終端自動再次啟動播放音樂的動作，無需用戶進行相應的操作，提高駕駛安全，同時提高用戶的使用體驗。上述指定時間長度即為時間閾值，不同的任務，其對應的時間閾值可以不同，比如，對應“導航”的時間長度為20秒，而對應“撥打電話”的時間長度可以為掛掉電話后的5秒等。

參照圖2，本實施例中，上述如果判定語音輸入環境處于拾音狀態，則將第二麥克風接入所述移動終端預設的第二音頻輸入接口的步驟S3之后，包括：

S31、通過所述第一麥克風和第二麥克風接收外部聲源的聲音信號，并調用預設的雙麥克風的降噪算法進行降噪處理。

如上述步驟S31所述，上述雙麥克風的降噪算法包括多種，常見的如一個麥克風穩定保持清晰通話，另一個麥克風物理主動消除噪音，通過收集外界的聲音，進行處理后，發出與噪音相反的聲波，利用抵消原理消除噪音。本實施例中會預設兩種降噪算法，分別為單麥克風的降噪算法和雙麥克風的降噪算法，這兩種降噪算法根據移動終端的語音輸入環境進行對應的切換。

參照圖2，本實施例中，上述如果判定語音輸入環境處于拾音狀態，則將第二麥克風接入所述移動終端預設的第二音頻輸入接口的步驟S3之后，包括：

S32、通過第一麥克風和第二麥克風接收語音信息，并判斷語音信息中是否含有第一關鍵字語音；

S33、如果含有所述第一關鍵字語音，則記錄所述第一麥克風和第二麥克風接收到第一關鍵字語音時的定位信息；

S34、根據各所述麥克風的位置坐標，以及所述定位信息，計算發出所述第一關鍵字語音的聲源位置。

如上述步驟S32、S33、S34所述，上述第一關鍵字語音可以是某個指定的字、某個指定的詞組或某一句指定的話等的語音，比如“你好，小新”、“我要發言”等語句的發音。判斷語音信息中是否含有第一關鍵字語音的方法可以為：將所述語音信息與預設的第一關鍵字語音列表中的第一關鍵字語音進行匹配；如果匹配成功，則判定所述語音信息中存在第一關鍵字語音。上述定位信息即為一些接收到第一關鍵詞語音時生成的信息，如上述的麥克風接收到第一關鍵字語音的時間、聲強等。由于麥克風的位置坐標是已知的，所以根據麥克風的位置坐標以及指定的定位信息即可計算出聲源位置。比如，利用高分辨率譜估計技術計算聲源位置，其利用麥克風陣列所獲取的聲音信號計算空間譜的相關矩陣等。又或者，根據各麥克風的坐標和預設的音速值，計算各麥克風距離所述聲源的距離，根據各麥克風接收到第一關鍵詞語音的時間之差，以及各麥克風距離所述聲源的距離，計算所處聲源的坐標，即為基于聲達時間差(time difference of arrival,TDOA)的定位技術，利用到達各麥克風的聲音信號間的時間差來定位聲源，再利用這些時延求得聲音到達不同位置麥克風的距離差，最后用搜索或幾何知識確定聲源位置。基于到達時間差估計定位法計算量較小，硬件成本較低，定位精度較高，同時也易于實時實現，適用于實時處理。本實施例中，由于只有兩個麥克風，所以，會根據麥克風設置的位置，和接收第一關鍵詞語音的時間，預估聲源的大概方向，比如，移動終端為行車記錄儀，第一麥克風和第二麥克風沿汽車的橫向水平設置，第一麥克風靠近過司機位置，第二麥克風靠近副駕駛位置，當第一麥克風先接收到第一關鍵詞語音，則可以基本判定聲源的大概方向是司機位置。在其它實施例中，還可以根據第一麥克風和第二麥克風接收第一關鍵詞的聲強等，判斷聲源的位置。

參照圖2，本實施例中，上述根據各所述麥克風的位置坐標，以及所述定位信息，計算發出所述第一關鍵字語音的聲源位置的步驟S34之后，包括：

S35、根據所述聲源位置，利用預設的拾音算法拾取所述聲源方向的語音信息。

如上述步驟S35所述，上述預設的拾音算法即為利用兩個麥克風組成的陣列與聲源相關性、相變和最大相似性處理等技術，從多人交談的場合中快速定位聲源方向的算法。這樣可以最大限度的接收聲源發出的聲音，以提高拾取聲音的準確性和使用的效率。

本實施例中，當移動終端接收所述聲源發出的第二關鍵字語音，解除第一麥克風和第二麥克風朝向所述聲源方向拾音的狀態。

本實施例中，上述移動終端判斷其語音輸入環境所處的狀態的步驟S1之前，包括：

S10、如果接收到來電信號，則直接進入所述拾音狀態。

如上述步驟S10所述，上述來電信號即為接收到語音通訊的信號，如接聽電話等，此時需要良好的通話環境，所以，直接進入拾音狀態，使用第一麥克風和第二麥克風進行拾音，進行雙麥克風的降噪算法，提高通話質量。

在一具體實施例中，上述移動終端為行車記錄儀，該行車記錄儀上設置第一麥克風和第二麥克風，其中第一麥克風接入音頻數模轉換器的第一音頻輸入接口，第二麥克風與參考信號共用第二音頻輸入接口，并根據行車記錄儀語音輸入環境所處的狀態進行切換。當語音輸入環境處于音頻輸出狀態時，參考信號接入所述第二音頻輸入接口，同時調用預設的單麥克風的降噪算法；當語音輸入環境處于拾音狀態，第二麥克風接入第二音頻輸入接口，同時調用雙麥克風的降噪算法。當語音輸入環境處于拾音狀態，還可以根據第一關鍵字語音判斷聲源的位置，進而進行定向拾音，以提高語音輸入的準確性等。

本發明實施例的語音輸入方法，其使用的平臺一般為MT6753平臺，MT6753為一種音頻數模轉換器，其自身只支持兩路麥克風輸入。使用本實施例的方法可以實現在移動終端不同狀態下采用單麥克風和雙麥克風拾音，保證了移動終端必備的打斷功能，同時還實現了外部環境噪聲復雜時通過雙麥克風拾音，提高語音輸入的準確性。而且本發明只需要基于兩路音頻輸入接口完成，無需添加語音處理IC，降低移動終端的成本。

參照圖3，本發明實施例還提供一種語音輸入裝置，其應用于移動終端，其中，第一麥克風接入所述移動終端的第一音頻輸入接口，所述語音輸入裝置包括：

判斷單元10，用于移動終端判斷其語音輸入環境所處的狀態；

第一接入單元20，用于如果判定語音輸入環境處于音頻輸出狀態，則將參考信號接入所述移動終端預設的第二音頻輸入接口；

第二接入單元30，用于如果判定語音輸入環境處于拾音狀態，則將第二麥克風接入所述移動終端預設的第二音頻輸入接口。

如上述判斷單元10、第一接入單元20和第二接入單元30，上述移動終端的語音輸入環境一般包括兩種，即音頻輸出狀態和拾音狀態。上述音頻輸出狀態，是指移動終端本身輸出音頻的狀態，如移動終端播放其自身播放的音樂音頻，或者接收電臺的廣播音頻、或者通過藍牙/WIFI等通信模塊接收的音頻等。上述拾音狀態，是指移動終端沒有輸出音頻信號，即移動終端本身并沒有輸出音頻。本實施例中，上述移動終端的語音輸入環境處于音頻輸出狀態時，同樣可以拾音，但是在拾音的過程中還會輸出音樂等音頻信號。上述參考信號即為移動終端采集其本身輸出音頻的采樣信號。上述第二麥克風即為拾音裝置。上述第一接入單元20和第二接入單元30是并列的兩個并列的模塊，會根據語音輸入環境所處的狀態進行擇一進行，也就是第一接入單元20和第二接入單元30不會同時運行。本實施例中，上述參考信號和第二麥克風共用同一個第二音頻輸入接口，根據語音輸入環境所處的狀態進行轉換，在移動終端的音頻數模轉換器只要設置兩個音頻輸入接口的情況下，既可以準確地實現音頻打斷功能，還可以實現雙麥克風拾音，提高拾音效果。更為重要的時，無需在移動終端的音頻數模轉換器添加單獨的語音處理IC，大大地減低生產成本。

參照圖4，本實施例中，上述判斷單元10，包括：

判斷模塊11，用于判斷移動終端是否輸出原生音頻信號至音頻功放；

判定模塊12，用于如果移動終端輸出原生音頻信號至音頻功放，則判定語音輸入環境處于所述音頻輸出狀態；否則，判定語音輸入環境處于所述拾音狀態。

如上述判斷模塊11和判定模塊12，移動終端可以清楚地知道其是否發出原生音頻信號至音頻功放，如果發送，則通過判定模塊12判定語音輸入環境處于所述音頻輸出狀態，如果未發送，判定語音輸入環境處于所述拾音狀態，方法簡單、高效，準確率高。上述原生音頻信號即為移動終端本身發出的音頻信號，或者移動終端通過藍牙、WIFI等通訊模塊接收的音頻信號。即，原生音頻信號不是通過麥克風拾取移動終端外部聲源發出的音頻信號。

參照圖5，本實施例中，上述語音輸入裝置，還包括：

接收單元21，用于通過第一麥克風接收所述音頻功放播放的對應所述原生音頻信號的原生聲音信號；

消音單元22，用于根據所述參考信號對所述原生聲音信號進行回音消除處理。

如上述接收單元21和消音單元22，上述第一麥克風同樣是拾音裝置，其單獨連接在移動終端的音頻數模轉換器上的第一音頻輸入接口。上述音頻功放全名為音頻功率放大器，是用于推動揚聲器發聲，從而重現聲音的功放裝置，其連接揚聲器。上述原生聲音信號即為原生音頻信號通過音頻功放處理后由揚聲器發出的聲音信號。因為原生音頻信號在經過音頻功放之前會被采樣得到上述參考信號，然后參考信號與第一麥克風接收到聲音信號進行比對，將與參考信號匹配的聲音信號進行消除處理，而與參考信號匹配的信號一般即為上述原生聲音信號，所以，當第一麥克風采集到原生聲音信號和外部聲源的聲音信號后，可以將原生聲音信號過濾掉，只保留外部聲源的聲音信號，如果外部聲源的聲音信號為語音命令時，會更容易被移動終端準確識別。

參照圖5，本實施例中，上述語音輸入裝置，還包括：

第一調用單元23，用于調用預設的單麥克風的降噪算法進行降噪處理。

如上述第一調用單元23，上述單麥克風的降噪算法包括多種，比如，預設噪音的頻譜，在外部聲源和環境音被麥克風一起拾取后，將與預設噪音的頻譜相同的聲音信號進行過濾；或者，麥克風先獲取環境音并記錄，當外部聲源和環境音被麥克風一起拾取后，將與先獲取記錄的環境音相同或近似的聲音信號消除，保留外部聲源的聲音信號等。

參照圖5，本實施例中，上述語音輸入裝置，還包括：

獲取執行單元24，用于通過第一麥克風獲取預設的語音命令，根據所述語音命令執行對應的任務。

如上述獲取執行單元24，上述語音命令即為移動終端預設的命令，其一般會設置一個命令列表，該命令列表上記錄有至少一個命令，每個命令對應一個指定的語音命令。比如，移動終端為行車記錄儀，命令列表上記錄“導航”、“撥打電話”、“朗讀短息”等命令，其對應的語音命令為“導航”、“撥打電話”、“朗讀短息”的漢語發音，當獲取到“導航”漢語發音時，行車記錄執行“導航”的命令進入導航頁面等。本實施例中，因為將原生聲音信號進行回音消除處理，所以語音命令被準確識別的概率提高。

參照圖5，本實施例中，上述語音輸入裝置，還包括：

控制輸出單元25，用于所述任務完成指定時間長度后，控制所述移動終端輸出原生音頻信號至音頻功放。

如上述控制輸出單元25，即移動終端在執行語音命令之后一定時間后，會再次自動啟動原生音頻信號輸出的動作。比如，移動終端是行車記錄儀，該行車記錄儀在播放音樂，當獲取到“導航”漢語發音時，行車記錄執行“導航”的命令進入導航頁面，過了指定時間長度后，移動終端自動再次啟動播放音樂的動作。因為在導航過程中，并不會實時的發出導航語音，用戶可能還是想要聽音樂，當過指定時間長度后，移動終端自動再次啟動播放音樂的動作，無需用戶進行相應的操作，提高駕駛安全，同時提高用戶的使用體驗。上述指定時間長度即為時間閾值，不同的任務，其對應的時間閾值可以不同，比如，對應“導航”的時間長度為20秒，而對應“撥打電話”的時間長度可以為掛掉電話后的5秒等。

參照圖5，本實施例中，上述語音輸入裝置，還包括：

第二調用單元31，用于通過所述第一麥克風和第二麥克風接收外部聲源的聲音信號，并調用預設的雙麥克風的降噪算法進行降噪處理。

如上述第二調用單元31，上述雙麥克風的降噪算法包括多種，常見的如一個麥克風穩定保持清晰通話，另一個麥克風物理主動消除噪音，通過收集外界的聲音，進行處理后，發出與噪音相反的聲波，利用抵消原理消除噪音。本實施例中會預設兩種降噪算法，分別為單麥克風的降噪算法和雙麥克風的降噪算法，這兩種降噪算法根據移動終端的語音輸入環境進行對應的切換。

參照圖5，本實施例中，上述語音輸入裝置，還包括：

關鍵音判斷單元32，用于通過第一麥克風和第二麥克風接收語音信息，并判斷語音信息中是否含有第一關鍵字語音；

記錄單元33，用于如果含有所述第一關鍵字語音，則記錄所述第一麥克風和第二麥克風接收到第一關鍵字語音時的定位信息；

計算定位單元34，用于根據各所述麥克風的位置坐標，以及所述定位信息，計算發出所述第一關鍵字語音的聲源位置。

如上述關鍵音判斷單元32、記錄單元33和計算定位單元34，上述第一關鍵字語音可以是某個指定的字、某個指定的詞組或某一句指定的話等的語音，比如“你好，小新”、“我要發言”等語句的發音。判斷語音信息中是否含有第一關鍵字語音的方法可以為：將所述語音信息與預設的第一關鍵字語音列表中的第一關鍵字語音進行匹配；如果匹配成功，則判定所述語音信息中存在第一關鍵字語音。上述定位信息即為一些接收到第一關鍵詞語音時生成的信息，如上述的麥克風接收到第一關鍵字語音的時間、聲強等。由于麥克風的位置坐標是已知的，所以根據麥克風的位置坐標以及指定的定位信息即可計算出聲源位置。比如，利用高分辨率譜估計技術計算聲源位置，其利用麥克風陣列所獲取的聲音信號計算空間譜的相關矩陣等。又或者，根據各麥克風的坐標和預設的音速值，計算各麥克風距離所述聲源的距離，根據各麥克風接收到第一關鍵詞語音的時間之差，以及各麥克風距離所述聲源的距離，計算所處聲源的坐標，即為基于聲達時間差的定位技術，利用到達各麥克風的聲音信號間的時間差來定位聲源，再利用這些時延求得聲音到達不同位置麥克風的距離差，最后用搜索或幾何知識確定聲源位置。基于到達時間差估計定位法計算量較小，硬件成本較低，定位精度較高，同時也易于實時實現，適用于實時處理。本實施例中，由于只有兩個麥克風，所以，會根據麥克風設置的位置，和接收第一關鍵詞語音的時間，預估聲源的大概方向，比如，移動終端為行車記錄儀，第一麥克風和第二麥克風沿汽車的橫向水平設置，第一麥克風靠近過司機位置，第二麥克風靠近副駕駛位置，當第一麥克風先接收到第一關鍵詞語音，則可以基本判定聲源的大概方向是司機位置。在其它實施例中，還可以根據第一麥克風和第二麥克風接收第一關鍵詞的聲強等，判斷聲源的位置。

參照圖5，本實施例中，上述語音輸入裝置，還包括：

定向拾音單元35，用于根據所述聲源位置，利用預設的拾音算法拾取所述聲源方向的語音信息。

如上述定向拾音單元35，上述預設的拾音算法即為利用兩個麥克風組成的陣列與聲源相關性、相變和最大相似性處理等技術，從多人交談的場合中快速定位聲源方向的算法。這樣可以最大限度的接收聲源發出的聲音，以提高拾取聲音的準確性和使用的效率。

本實施例中，當移動終端接收所述聲源發出的第二關鍵字語音，解除第一麥克風和第二麥克風朝向所述聲源方向拾音的狀態。

本實施例中，上述語音輸入裝置，還包括：

接收進入單元，用于如果接收到來電信號，則直接進入所述拾音狀態.

如上述接收進入單元，上述來電信號即為接收到語音通訊的信號，如接聽電話等，此時需要良好的通話環境，所以，直接進入拾音狀態，使用第一麥克風和第二麥克風進行拾音，進行雙麥克風的降噪算法，提高通話質量。

本發明實施例的語音輸入裝置，其使用的平臺一般為MT6753平臺，MT6753為一種音頻數模轉換器，其自身只支持兩路麥克風輸入。使用本實施例的方法可以實現在移動終端不同狀態下采用單麥克風和雙麥克風拾音，保證了移動終端必備的打斷功能，同時還實現了外部環境噪聲復雜時通過雙麥克風拾音，提高語音輸入的準確性。而且本發明只需要基于兩路音頻輸入接口完成，無需添加語音處理IC，降低移動終端的成本。

參照圖6，本發明實施例還提供一種移動終端，包括處理器100、第一麥克風501、第二麥克風502、模擬開關400、音頻功放300、參考信號線路、以及設置第一音頻輸入接口和第二音頻輸入接口的音頻數模轉換器200；所述處理器100分別與所述模擬開關400、音頻數模轉換器200通信連接；所述音頻數模轉換器200通信連接所述音頻功放300；所述第一麥克風501接入所述第一音頻輸入接口；所述第二麥克風502和參考信號線路連接所述模擬開關400；所述模擬開關400接入所述第二音頻輸入接口；所述處理器100接收音頻數模轉換器200的工作信號，判斷所述移動終端的語音輸入環境所處的狀態；如果判定語音輸入環境處于音頻輸出狀態，則通過所述模擬開關400將所述參考信號接入所述第二音頻輸入接口；如果判定語音輸入環境處于拾音狀態，則通過所述模擬開關400將第二麥克風502接入所述移動終端預設的第二音頻輸入接口。

本是實施例中，上述第一麥克風501和第二麥克風502即為拾音裝置；上述音頻功放300全名為音頻功率放大器，是用于推動揚聲器600發聲，從而重現聲音的功放裝置，其連接揚聲器600。上述參考信號線路即為將采集到的參考信號傳送給音頻數模轉換器200的線路；上述第一音頻輸入接口和第二音頻輸入接口即為接收音頻信號的借口等。上述模擬開關400即為控制第二麥克風502和參考信號線路切換的開關，其可以根據高低電平的變化而進行切換。上述移動終端的語音輸入環境一般包括兩種，即音頻輸出狀態和拾音狀態。上述音頻輸出狀態，是指移動終端本身通過音頻數模轉換器200輸出音頻的狀態，如移動終端播放其自身播放的音樂音頻，或者接收電臺的廣播音頻、或者通過藍牙/WIFI等通信模塊接收的音頻等。上述拾音狀態，是指移動終端沒有輸出音頻信號，即移動終端本身并沒有輸出音頻。本實施例中，上述移動終端的語音輸入環境處于音頻輸出狀態時，同樣可以拾音，但是在拾音的過程中還會輸出音樂等音頻信號。上述參考信號即為移動終端采集其本身輸出音頻的采樣信號。本實施例中，移動終端會根據語音輸入環境所處的狀態進行擇一選擇第二麥克風502和參考信號線路中的一個接入第二音頻輸入借口。本實施例中，上述參考信號線路和第二麥克風502共用同一個第二音頻輸入接口，根據語音輸入環境所處的狀態進行轉換，在移動終端的音頻數模轉換器200只要設置兩個音頻輸入接口的情況下，既可以準確地實現音頻打斷功能，還可以實現雙麥克風拾音，提高拾音效果。更為重要的時，無需在移動終端的音頻數模轉換器200添加單獨的語音處理IC，大大地減低生產成本。

本實施例中，上述處理器100判斷所述移動終端的語音輸入環境所處的狀態的方法，包括：判斷移動終端是否輸出原生音頻信號至音頻功放300；如果是，則判定語音輸入環境處于所述音頻輸出狀態；否則，判定語音輸入環境處于所述拾音狀態。移動終端可以清楚地知道其是否發出原生音頻信號至音頻功放300，如果發送，則判定語音輸入環境處于所述音頻輸出狀態，如果未發送，判定語音輸入環境處于所述拾音狀態，方法簡單、高效，準確率高。上述原生音頻信號即為移動終端本身發出的音頻信號，或者移動終端通過藍牙、WIFI等通訊模塊接收的音頻信號。即，原生音頻信號不是通過麥克風拾取移動終端外部聲源發出的音頻信號。

本實施例中，上述處理器100判定語音輸入環境處于音頻輸出狀態后，通過所述第一麥克風501接收所述音頻功放300播放的對應所述原生音頻信號的原生聲音信號；根據所述參考信號對所述原生聲音信號進行回音消除處理。上述原生聲音信號即為原生音頻信號通過音頻功放300處理后由揚聲器600發出的聲音信號。因為原生音頻信號在經過音頻功放300之前會被采樣得到上述參考信號，然后參考信號與第一麥克風501接收到聲音信號進行比對，將與參考信號匹配的聲音信號進行消除處理，而與參考信號匹配的信號一般即為上述原生聲音信號，所以，當第一麥克風501采集到原生聲音信號和外部聲源的聲音信號后，可以將原生聲音信號過濾掉，只保留外部聲源的聲音信號，如果外部聲源的聲音信號為語音命令時，會更容易被移動終端準確識別

本實施例中，上述處理器100判定語音輸入環境處于音頻輸出狀態后，調用預設的單麥克風的降噪算法進行降噪處理。上述單麥克風的降噪算法包括多種，比如，預設噪音的頻譜，在外部聲源和環境音被麥克風一起拾取后，將與預設噪音的頻譜相同的聲音信號進行過濾；或者，麥克風先獲取環境音并記錄，當外部聲源和環境音被麥克風一起拾取后，將與先獲取記錄的環境音相同或近似的聲音信號消除，保留外部聲源的聲音信號等。

本實施例中，上述處理器100通過所述第一麥克風501獲取預設的語音命令，根據所述語音命令執行對應的任務。上述語音命令即為移動終端預設的命令，其一般會設置一個命令列表，該命令列表上記錄有至少一個命令，每個命令對應一個指定的語音命令。比如，移動終端為行車記錄儀，命令列表上記錄“導航”、“撥打電話”、“朗讀短息”等命令，其對應的語音命令為“導航”、“撥打電話”、“朗讀短息”的漢語發音，當獲取到“導航”漢語發音時，行車記錄執行“導航”的命令進入導航頁面等。本實施例中，因為將原生聲音信號進行回音消除處理，所以語音命令被準確識別的概率提高。

本實施例中，上述處理器100在所述任務完成指定時間長度后，控制所述音頻數模轉換器200輸出原生音頻信號至音頻功放300。即移動終端在執行語音命令之后一定時間后，會再次自動啟動原生音頻信號輸出的動作。比如，移動終端是行車記錄儀，該行車記錄儀在播放音樂，當獲取到“導航”漢語發音時，行車記錄執行“導航”的命令進入導航頁面，過了指定時間長度后，移動終端自動再次啟動播放音樂的動作。因為在導航過程中，并不會實時的發出導航語音，用戶可能還是想要聽音樂，當過指定時間長度后，移動終端自動再次啟動播放音樂的動作，無需用戶進行相應的操作，提高駕駛安全，同時提高用戶的使用體驗。上述指定時間長度即為時間閾值，不同的任務，其對應的時間閾值可以不同，比如，對應“導航”的時間長度為20秒，而對應“撥打電話”的時間長度可以為掛掉電話后的5秒等。

本實施例中，上述處理器100判定語音輸入環境處于拾音狀態后，通過所述第一麥克風501和第二麥克風502接收外部聲源的聲音信號，并調用預設的雙麥克風的降噪算法進行降噪處理。上述雙麥克風的降噪算法包括多種，常見的如一個麥克風穩定保持清晰通話，另一個麥克風物理主動消除噪音，通過收集外界的聲音，進行處理后，發出與噪音相反的聲波，利用抵消原理消除噪音。本實施例中會預設兩種降噪算法，分別為單麥克風的降噪算法和雙麥克風的降噪算法，這兩種降噪算法根據移動終端的語音輸入環境進行對應的切換。

本實施例中，上述處理器100判定語音輸入環境處于拾音狀態后，通過第一麥克風501和第二麥克風502接收語音信息，并判斷語音信息中是否含有第一關鍵字語音；如果含有所述第一關鍵字語音，則記錄所述第一麥克風501和第二麥克風502接收到第一關鍵字語音時的定位信息；根據各所述麥克風的位置坐標，以及所述定位信息，計算發出所述第一關鍵字語音的聲源位置。上述第一關鍵字語音可以是某個指定的字、某個指定的詞組或某一句指定的話等的語音，比如“你好，小新”、“我要發言”等語句的發音。判斷語音信息中是否含有第一關鍵字語音的方法可以為：將所述語音信息與預設的第一關鍵字語音列表中的第一關鍵字語音進行匹配；如果匹配成功，則判定所述語音信息中存在第一關鍵字語音。上述定位信息即為一些接收到第一關鍵詞語音時生成的信息，如上述的麥克風接收到第一關鍵字語音的時間、聲強等。由于麥克風的位置坐標是已知的，所以根據麥克風的位置坐標以及指定的定位信息即可計算出聲源位置。比如，利用高分辨率譜估計技術計算聲源位置，其利用麥克風陣列所獲取的聲音信號計算空間譜的相關矩陣等。又或者，根據各麥克風的坐標和預設的音速值，計算各麥克風距離所述聲源的距離，根據各麥克風接收到第一關鍵詞語音的時間之差，以及各麥克風距離所述聲源的距離，計算所處聲源的坐標，即為基于聲達時間差的定位技術，利用到達各麥克風的聲音信號間的時間差來定位聲源，再利用這些時延求得聲音到達不同位置麥克風的距離差，最后用搜索或幾何知識確定聲源位置。基于到達時間差估計定位法計算量較小，硬件成本較低，定位精度較高，同時也易于實時實現，適用于實時處理。本實施例中，由于只有兩個麥克風，所以，會根據麥克風設置的位置，和接收第一關鍵詞語音的時間，預估聲源的大概方向，比如，移動終端為行車記錄儀，第一麥克風501和第二麥克風502沿汽車的橫向水平設置，第一麥克風501靠近過司機位置，第二麥克風502靠近副駕駛位置，當第一麥克風501先接收到第一關鍵詞語音，則可以基本判定聲源的大概方向是司機位置。在其它實施例中，還可以根據第一麥克風501和第二麥克風502接收第一關鍵詞的聲強等，判斷聲源的位置。

本實施例中，上述處理器100根據所述聲源位置，利用預設的拾音算法拾取所述聲源方向的語音信息。上述預設的拾音算法即為利用兩個麥克風組成的陣列與聲源相關性、相變和最大相似性處理等技術，從多人交談的場合中快速定位聲源方向的算法。這樣可以最大限度的接收聲源發出的聲音，以提高拾取聲音的準確性和使用的效率。

本實施例中，當移動終端接收所述聲源發出的第二關鍵字語音，解除第一麥克風501和第二麥克風502朝向所述聲源方向拾音的狀態。

本實施例中，上述處理器100在判斷所述移動終端的語音輸入環境所處的狀態之前，如果移動終端接收到來電信號，則控制移動終端直接進入所述拾音狀態。上述來電信號即為接收到語音通訊的信號，如接聽電話等，此時需要良好的通話環境，所以，直接進入拾音狀態，使用第一麥克風501和第二麥克風502進行拾音，進行雙麥克風的降噪算法，提高通話質量。

在一具體實施例中，上述移動終端為行車記錄儀，該行車記錄儀上設置第一麥克風501和第二麥克風502，其中第一麥克風501接入音頻數模轉換器200的第一音頻輸入接口，第二麥克風502與參考信號線路共用第二音頻輸入接口，并根據行車記錄儀語音輸入環境所處的狀態通過模擬開關400進行切換。當語音輸入環境處于音頻輸出狀態時，參考信號接入所述第二音頻輸入接口，同時調用預設的單麥克風的降噪算法；當語音輸入環境處于拾音狀態，第二麥克風502接入第二音頻輸入接口，同時調用雙麥克風的降噪算法。當語音輸入環境處于拾音狀態，還可以根據第一關鍵字語音判斷聲源的位置，進而進行定向拾音，以提高語音輸入的準確性等。

本發明實施例的移動終端，其使用的平臺一般為MT6753平臺，MT6753為一種音頻數模轉換器200，其自身只支持兩路麥克風輸入。使用本實施例的方法可以實現在移動終端不同狀態下采用單麥克風和雙麥克風拾音，保證了移動終端必備的打斷功能，同時還實現了外部環境噪聲復雜時通過雙麥克風拾音，提高語音輸入的準確性。而且本發明只需要基于兩路音頻輸入接口完成，無需添加語音處理IC，降低移動終端的成本。

以上所述僅為本發明的優選實施例，并非因此限制本發明的專利范圍，凡是利用本發明說明書及附圖內容所作的等效結構或等效流程變換，或直接或間接運用在其他相關的技術領域，均同理包括在本發明的專利保護范圍內。

A1、一種語音輸入方法，其應用于移動終端，其中，第一麥克風接入所述移動終端的第一音頻輸入接口，所述語音輸入方法包括：

所述移動終端判斷其語音輸入環境所處的狀態；

如果判定語音輸入環境處于音頻輸出狀態，則將參考信號接入所述移動終端預設的第二音頻輸入接口；

如果判定語音輸入環境處于拾音狀態，則將第二麥克風接入所述移動終端預設的第二音頻輸入接口。

A2、根據A1所述的語音輸入方法，所述移動終端判斷其語音輸入環境所處的狀態的步驟，包括：

判斷移動終端是否輸出原生音頻信號至音頻功放；

如果是，則判定語音輸入環境處于所述音頻輸出狀態；否則，判定語音輸入環境處于所述拾音狀態。

A3、根據A2所述的語音輸入方法，所述如果判定語音輸入環境處于音頻輸出狀態，則將參考信號接入所述移動終端預設的第二音頻輸入接口的步驟之后，包括：

通過第一麥克風接收所述音頻功放播放的對應所述原生音頻信號的原生聲音信號；

根據所述參考信號對所述原生聲音信號進行回音消除處理。

A4、根據A3所述的語音輸入方法，所述如果判定語音輸入環境處于音頻輸出狀態，則將參考信號接入所述移動終端預設的第二音頻輸入接口的步驟之后，包括：

調用預設的單麥克風的降噪算法進行降噪處理。

A5、根據A3所述的語音輸入方法，所述根據所述參考信號對所述原生聲音信號進行回音消除處理的步驟之后，包括：

通過第一麥克風獲取預設的語音命令，根據所述語音命令執行對應的任務。

A6、根據A5所述的語音輸入方法，所述通過第一麥克風獲取預設的語音命令，根據所述語音命令執行對應的任務的步驟之后，包括：

所述任務完成指定時間長度后，控制所述移動終端輸出原生音頻信號至音頻功放。

A7、根據A2所述的語音輸入方法，所述如果判定語音輸入環境處于拾音狀態，則將第二麥克風接入所述移動終端預設的第二音頻輸入接口的步驟之后，包括：

通過所述第一麥克風和第二麥克風接收外部聲源的聲音信號，并調用預設的雙麥克風的降噪算法進行降噪處理。

A8、根據A7所述的語音輸入方法，所述如果判定語音輸入環境處于拾音狀態，則將第二麥克風接入所述移動終端預設的第二音頻輸入接口的步驟之后，包括：

通過第一麥克風和第二麥克風接收語音信息，并判斷語音信息中是否含有第一關鍵字語音；

如果含有所述第一關鍵字語音，則記錄所述第一麥克風和第二麥克風接收到第一關鍵字語音時的定位信息；

根據各所述麥克風的位置坐標，以及所述定位信息，計算發出所述第一關鍵字語音的聲源位置。

A9、根據A8所述的語音輸入方法，所述根據各所述麥克風的位置坐標，以及所述定位信息，計算發出所述第一關鍵字語音的聲源位置的步驟之后，包括：

根據所述聲源位置，利用預設的拾音算法拾取所述聲源方向的語音信息。

A10、根據A1所述的語音輸入方法，所述移動終端判斷其語音輸入環境所處的狀態的步驟之前，包括：

如果接收到來電信號，則直接進入所述拾音狀態。

B1、一種語音輸入裝置，其應用于移動終端，其中，第一麥克風接入所述移動終端的第一音頻輸入接口，所述語音輸入裝置包括：

判斷單元，用于移動終端判斷其語音輸入環境所處的狀態；

第一接入單元，用于如果判定語音輸入環境處于音頻輸出狀態，則將參考信號接入所述移動終端預設的第二音頻輸入接口；

第二接入單元，用于如果判定語音輸入環境處于拾音狀態，則將第二麥克風接入所述移動終端預設的第二音頻輸入接口。

B2、根據B1所述的語音輸入裝置，所述判斷單元，包括：

判斷模塊，用于判斷移動終端是否輸出原生音頻信號至音頻功放；

B3、根據B2所述的語音輸入裝置，還包括：

接收單元，用于通過第一麥克風接收所述音頻功放播放的對應所述原生音頻信號的原生聲音信號；

消音單元，用于根據所述參考信號對所述原生聲音信號進行回音消除處理。

B4、根據B3所述的語音輸入裝置，還包括：

第一調用單元，用于調用預設的單麥克風的降噪算法進行降噪處理。

B5、根據B3所述的語音輸入裝置，還包括：

獲取執行單元，用于通過第一麥克風獲取預設的語音命令，根據所述語音命令執行對應的任務。

B6、根據B5所述的語音輸入裝置，還包括：

控制輸出單元，用于所述任務完成指定時間長度后，控制所述移動終端輸出原生音頻信號至音頻功放。

B7、根據B2所述的語音輸入裝置，還包括：

第二調用單元，用于通過所述第一麥克風和第二麥克風接收外部聲源的聲音信號，并調用預設的雙麥克風的降噪算法進行降噪處理。

B8、根據B7所述的語音輸入裝置，還包括：

關鍵音判斷單元，用于通過第一麥克風和第二麥克風接收語音信息，并判斷語音信息中是否含有第一關鍵字語音；

記錄單元，用于如果含有所述第一關鍵字語音，則記錄所述第一麥克風和第二麥克風接收到第一關鍵字語音時的定位信息；

計算定位單元，用于根據各所述麥克風的位置坐標，以及所述定位信息，計算發出所述第一關鍵字語音的聲源位置。

B9、根據B8所述的語音輸入裝置，還包括：

定向拾音單元，用于根據所述聲源位置，利用預設的拾音算法拾取所述聲源方向的語音信息。

B10、根據B1所述的語音輸入裝置，還包括：

接收進入單元，用于如果接收到來電信號，則直接進入所述拾音狀態。

C1、一種移動終端，包括處理器、第一麥克風、第二麥克風、模擬開關、音頻功放、參考信號線路、以及設置第一音頻輸入接口和第二音頻輸入接口的音頻數模轉換器；

所述處理器接收音頻數模轉換器的工作信號，判斷所述移動終端的語音輸入環境所處的狀態；

如果判定語音輸入環境處于音頻輸出狀態，則通過所述模擬開關將所述參考信號接入所述第二音頻輸入接口；

如果判定語音輸入環境處于拾音狀態，則通過所述模擬開關將第二麥克風接入所述移動終端預設的第二音頻輸入接口。

C2、根據C1所述的移動終端，所述處理器判斷所述移動終端的語音輸入環境所處的狀態的方法，包括：

判斷移動終端是否輸出原生音頻信號至音頻功放；如果是，則判定語音輸入環境處于所述音頻輸出狀態；否則，判定語音輸入環境處于所述拾音狀態。

C3、根據C2所述的移動終端，所述處理器判定語音輸入環境處于音頻輸出狀態后，通過所述第一麥克風接收所述音頻功放播放的對應所述原生音頻信號的原生聲音信號；根據所述參考信號對所述原生聲音信號進行回音消除處理。

C4、根據C3所述的移動終端，所述處理器判定語音輸入環境處于音頻輸出狀態后，調用預設的單麥克風的降噪算法進行降噪處理。

C5、根據C3所述的移動終端，所述處理器通過所述第一麥克風獲取預設的語音命令，根據所述語音命令執行對應的任務。

C6、根據C5所述的移動終端，所述處理器在所述任務完成指定時間長度后，控制所述音頻數模轉換器輸出原生音頻信號至音頻功放。

C7、根據C2所述的移動終端，所述處理器判定語音輸入環境處于拾音狀態后，通過所述第一麥克風和第二麥克風接收外部聲源的聲音信號，并調用預設的雙麥克風的降噪算法進行降噪處理。

C8、根據C7所述的移動終端，所述處理器判定語音輸入環境處于拾音狀態后，通過第一麥克風和第二麥克風接收語音信息，并判斷語音信息中是否含有第一關鍵字語音；如果含有所述第一關鍵字語音，則記錄所述第一麥克風和第二麥克風接收到第一關鍵字語音時的定位信息；根據各所述麥克風的位置坐標，以及所述定位信息，計算發出所述第一關鍵字語音的聲源位置。

C9、根據C8所述的移動終端，所述處理器根據所述聲源位置，利用預設的拾音算法拾取所述聲源方向的語音信息。

C10、根據C1所述的移動終端，所述處理器在判斷所述移動終端的語音輸入環境所處的狀態之前，如果移動終端接收到來電信號，則控制移動終端直接進入所述拾音狀態。

完整全部詳細技術資料下載

當前第1頁1 2 3