本發明屬于語音識別領域,具體地涉及一種語音識別測試系統和方法。
背景技術:
語音交互是目前ai近年來發展速度較快的一種,它脫離常規的人與機器界面交互的方式,語音智能的產品在國內外不斷的升溫,占據了市場上不小的份額,而語音識別測試繁冗而復雜,涉及各方面的因素較多,特別是針對前期麥克風拾音方位、喚醒,回音消噪、背景消噪聲紋識別等評估。然而現有的語音識別測試系統功能都較單一,要完成整個語音識別測試則需要用到許多測試系統,使得整個測試流程復雜繁瑣,操作麻煩,測試效率低,且測試不夠系統全面,測試準確率較低。
技術實現要素:
本發明目的在于為解決上述問題而提供一種系統集成度高,使整個測試流程操作簡便,測試效率高,測試系統全面,提高測試準確率的語音識別測試系統和方法。
為此,本發明公開了一種語音識別測試系統,包括主控制模塊、實時信號測試模塊、錄音質量測試模塊、標準環境下語音測試模塊和常規情景下語音測試模塊,所述實時信號測試模塊、錄音質量測試模塊、標準環境下語音測試模塊和常規情景下語音測試模塊分別與主控制模塊連接,所述實時信號測試模塊用于測試拾取信號的質量完整性及電性能參數,所述錄音質量測試模塊用于測試錄音信號質量的電性能參,所述標準環境下語音測試模塊用于測試標準環境下語音識別率,所述常規情景下語音測試模塊用于測試常規使用環境下語音識別率。
進一步的,所述實時信號測試模塊包括標準信號源播放模塊、麥克風、信號采集處理模塊、主控制模塊和信號分析儀,所述標準信號源播放模塊設置在消音室內,用于播放標準信號聲源,所述麥克風采集標準信號源,并將采集到的信號傳輸給信號采集處理模塊,信號采集處理模塊對信號進行處理后傳輸給主控制模塊,主控制模塊對信號進行處理后傳輸給信號分析儀,信號分析儀對信號的電性能進行數據分析。
更進一步的,所述信號采集處理模塊通過有線或無線與主控制模塊通信連接。
進一步的,所述錄音質量測試模塊包括標準信號源/聲源播放模塊、麥克風、信號采集處理模塊、主控制模塊、功放模塊和信號分析儀,所述標準信號源/聲源播放模塊設置在消音室內,用于播放智能合成的語音語料庫音頻文件,所述麥克風采集標準信號源/聲源播放模塊播放的標準信號源/聲源,并將采集到的信號傳輸給信號采集處理模塊,信號采集處理模塊對信號進行處理后傳輸給主控制模塊,主控制模塊對信號進行錄制后將錄音信號傳輸給功放模塊,功放模塊對錄音信號進行功放后傳輸給信號分析儀,信號分析儀對錄音信號的電性能進行數據分析。
進一步的,所述標準環境下語音測試模塊包括標準聲源播放模塊、麥克風、信號采集處理模塊、主控制模塊和離線語音合成模塊,所述離線語音合成模塊將被測試的語音語料庫的內容轉換成內置文件傳輸至主控制模塊,所述標準聲源播放模塊設置在消音室內,用于播放語音語料庫音頻文件,所述麥克風采集標準聲源播放模塊播放的標準聲源,并將采集到的信號傳輸給信號采集處理模塊,信號采集處理模塊對信號進行處理后傳輸給主控制模塊,主控制模塊對信號進行語音合成,并與離線語音合成模塊的內置文件進行對比,顯示測試數據的分析結果并計算語音識別準確率。
進一步的,所述常規情景下語音測試模塊包括標準聲源播放模塊、麥克風、信號采集處理模塊、主控制模塊和離線語音合成模塊,所述離線語音合成模塊將被測試的語音語料庫的內容轉換成內置文件傳輸至主控制模塊,所述標準聲源播放模塊設置在常規使用環境中,用于播放語音語料庫音頻文件,所述麥克風采集標準聲源播放模塊播放的標準聲源,并將采集到的信號傳輸給信號采集處理模塊,信號采集處理模塊對信號進行處理后傳輸給主控制模塊,主控制模塊對信號進行語音合成,并與離線語音合成模塊的內置文件進行對比,顯示測試數據的分析結果并計算語音識別準確率。
進一步的,所述麥克風包括麥克風單體或麥克風陣列。
更進一步的,所述麥克風為駐極體麥克風、模擬mems麥克風或數字mems麥克風。
本發明還公開一種基于上述的語音識別測試系統的語音識別測試方法,包括如下步驟:
s1,采用實時信號測試模塊測試拾取信號的質量完整性及電性能參數是否達到設計要求,如果是,則進入步驟s2;如果否,則改善實時信號后重復步驟s1;
s2,采用錄音質量測試模塊測試錄音信號質量,確保其與實時測試信號電性能參數保持一致,進入步驟s3;
s3,采用標準環境下語音測試模塊測試標準環境下語音識別率,進入步驟s4;
s4,采用常規情景下語音測試模塊測試常規使用環境下語音識別率。
進一步的,所述步驟s3中還包括整體在標準測試環境中對測試標準聲源的錄音質量的維度進行主觀音質評價量化;所述步驟s4中還包括整體在情景交互測試環境中對測試標準聲源的錄音質量的維度進行主觀音質評價量化。
本發明的有益技術效果:
1、方便評估前期單體麥克風或陣列麥克風模型聲學模型。
2、系統集成度高,提高測試效率:系統集成度高,包含實時信號測試、標準環境下語音測試、常規情景下語音測試和錄音質量測試(兼容信號和語音質量),方便各階段的測試數據分析,提高了測試效率。
3、提高測試準確率:從拾取信號質量分析到主客觀判定語音測試結果,整體綜合性強,減少誤差,提高了測試準確率。
附圖說明
圖1為本發明具體實施例的系統結構示意圖;
圖2為本發明具體實施例的實時信號測試模塊的結構示意圖;
圖3為本發明的實時信號測試模塊的另一種結構示意圖;
圖4為本發明具體實施例的錄音質量測試模塊的結構示意圖;
圖5為本發明具體實施例的標準環境下語音測試模塊的結構示意圖;
圖6為本發明具體實施例的常規情景下語音測試模塊的結構示意圖;
圖7為本發明具體實施例的方法流程圖;
圖8為本發明具體實施例的測試流程圖。
具體實施方式
現結合附圖和具體實施方式對本發明進一步說明。
如圖1-6所示,一種語音識別測試系統,包括主控制模塊1、實時信號測試模塊2、錄音質量測試模塊3、標準環境下語音測試模塊4和常規情景下語音測試模塊5,所述實時信號測試模塊2、錄音質量測試模塊3、標準環境下語音測試模塊4和常規情景下語音測試模塊5分別與主控制模塊1連接,主控制模塊1控制實時信號測試模塊2、錄音質量測試模塊3、標準環境下語音測試模塊4和常規情景下語音測試模塊5按照一定邏輯順序進行測試。
本具體實施例中,主控制模塊1為mcu處理器,其操作系統可以是android或ios操作系統,當然,在其它實施例中,主控制模塊1也可以是單片機、plc控制器等。
所述實時信號測試模塊2用于測試拾取信號的質量完整性及電性能參數,得出信號的幅度、失真、信噪比、頻響范圍等參數,本具體實施例中,如圖2所示,實時信號測試模塊2為有線實時信號測試模塊,包括標準信號源播放模塊21、麥克風3、信號采集處理模塊7、主控制模塊1和信號分析儀8,所述標準信號源播放模塊21設置在消音室內,以排除環境的噪聲,混響,回音,簡正振動等對標準信號的干擾,標準信號源播放模塊21用于播放由主控制模塊1提供的標準信號源,所述麥克風6采集標準信號源,并將采集到的信號傳輸給信號采集處理模塊7,信號采集處理模塊7對信號進行處理后傳輸給主控制模塊1,主控制模塊1對信號進行處理后即轉換成audio信號后傳輸給信號分析儀8,信號分析儀8對信號的電性能進行數據分析,得出信號的幅度,失真,信噪比,頻響范圍等參數。
當然,在其它實施例中,實時信號測試模塊2可以為無線實時信號測試模塊,如圖3所示,包括標準信號源播放模塊21、麥克風3、信號采集處理模塊7、rf信號發射模塊22、rf信號接收模塊23、主控制模塊1和信號分析儀8,所述標準信號源播放模塊21設置在消音室內,以排除環境的噪聲,混響,回音,簡正振動等對標準信號的干擾,標準信號源播放模塊21用于播放由主控制模塊1提供的標準信號源,所述麥克風6采集標準信號源,并將采集到的信號傳輸給信號采集處理模塊7,信號采集處理模塊7對信號進行處理后傳輸給rf信號發射模塊22,rf信號發射模塊22將信號無線發射給rf信號接收模塊23,rf信號接收模塊23接收后將信號傳輸給主控制模塊1,主控制模塊1對信號進行處理后即轉換成audio信號后傳輸給信號分析儀8,信號分析儀8對信號的電性能進行數據分析,得出信號的幅度,失真,信噪比,頻響范圍等參數。
所述錄音質量測試模塊3用于測試錄音信號質量的電性能參,本具體實施例中,如圖4所示,所述錄音質量測試模塊3包括標準信號源/聲源播放模塊31、麥克風6、信號采集處理模塊7、主控制模塊1、功放模塊32和信號分析儀8,所述標準信號源/聲源播放模塊31設置在消音室內,用于播放主控制模塊1中存儲的智能合成的語音語料庫音頻文件,所述麥克風6采集標準信號源/聲源播放模塊31播放的標準信號源/聲源,并將采集到的信號傳輸給信號采集處理模塊7,信號采集處理模塊7對信號進行處理后傳輸給主控制模塊1,主控制模塊1對信號進行錄制后將錄音信號傳輸給功放模塊32,功放模塊32對錄音信號進行功放后傳輸給信號分析儀8,信號分析儀8對錄音信號的電性能進行數據分析。
所述標準環境下語音測試模塊4用于測試標準環境下語音識別率,本具體實施例中,如圖5所示,標準環境下語音測試模塊4包括標準聲源播放模塊41、麥克風6、信號采集處理模塊7、主控制模塊1和離線語音合成模塊9,所述離線語音合成模塊9將被測試的語音語料庫的內容轉換成內置文件傳輸至主控制模塊1,所述標準聲源播放模塊41設置在消音室內,用于播放主控制模塊1存儲的被測試的語音語料庫音頻文件,所述麥克風6采集標準聲源播放模塊41播放的標準聲源,并將采集到的信號傳輸給信號采集處理模塊7,信號采集處理模塊7對信號進行處理后傳輸給主控制模塊1,主控制模塊1對信號進行語音合成后與離線語音合成模塊9的內置文件進行對比,顯示測試數據的分析結果并計算語音識別準確率。
本具體實施例中,標準環境下語音測試模塊4還包括錄音文件播放模塊10,主控制模塊1還對信號進行錄音,并將錄音信號傳輸給錄音文件播放模塊10進行播放,以進行主觀音質評價量化。
所述常規情景下語音測試模塊5用于測試常規使用環境下語音識別率,本具體實施例中,如圖6所示,常規情景下語音測試模塊5包括標準聲源播放模塊51、麥克風6、信號采集處理模塊7、主控制模塊1和離線語音合成模塊9,所述離線語音合成模塊9將被測試的語音語料庫的內容轉換成內置文件傳輸至主控制模塊1,所述標準聲源播放模塊51設置在常規使用環境中,用于播放主控制模塊1存儲的被測試的語音語料庫音頻文件,所述麥克風6采集標準聲源播放模塊51播放的標準聲源,并將采集到的信號傳輸給信號采集處理模塊7,信號采集處理模塊7對信號進行處理后傳輸給主控制模塊1,主控制模塊1對信號進行語音合成,并與離線語音合成模塊9的內置文件進行對比,顯示測試數據的分析結果并計算語音識別準確率。
本具體實施例中,常規情景下語音測試模塊5還包括錄音文件播放模塊10,主控制模塊1還對信號進行錄音,并將錄音信號傳輸給錄音文件播放模塊10進行播放,以進行主觀音質評價量化。
本具體實施例中,所述麥克風6可以是麥克風單體或麥克風陣列,麥克風的類型可以是駐極體麥克風、模擬mems麥克風或數字mems麥克風。
本具體實施例中,標準聲源可以可以是人工合成聲源,也可是人聲錄音標準普通話版聲源。
本具體實施例中,信號分析儀8可以是audioprecision音頻測試分析儀或b&k音頻測試儀等相關設備。
本具體實施例中,信號采集處理模塊7采用現有的信號采集處理芯片,功放模塊32采用現有的功率放大芯片,此是本領域技術人員可以輕易實現的,不再詳細說明。
本具體實施例中,常規使用環境可以是真實的常規使用環境,也可以是在室內模擬常規使用環境。
本具體實施例中,標準信號源播放模塊21、標準信號源/聲源播放模塊31、標準聲源播放模塊41和標準聲源播放模塊51采用同一個高保真音響來實現,高保真音響校準并根據所需音量進行播放。當然,在其它實施例中,也可以采用人工嘴來實現。錄音文件播放模塊10為高保真音響。
本具體實施例中,測試中可自由對被測麥克風6的位置進行變動。
如圖7所示,本發明還公開一種基于上述的語音識別測試系統的語音識別測試方法,包括如下步驟:
s1,采用實時信號測試模塊測試拾取信號的質量完整性及電性能參數,包括幅度,失真,信噪比,頻響范圍等參數是否達到設計要求,如果是,則進入步驟s2;如果否,則改善實時信號后重復步驟s1。
本步驟主要是確定測試系統的拾取信號線路是否完整,還原的波形是否異常,信號的完整的電性能測試否達到設計標準等環節定義拾音信號的質量,為后續標準化測試做優先平臺,從而提高測試準確度。
s2,采用錄音質量測試模塊測試錄音信號質量,確保其與實時測試信號電性能參數保持一致,進入步驟s3。
錄音質量測試綜合反饋測試系統的錄制信號完整性,信號處理,信號質量并對比實時信號參考要求,確認錄音信號質量與實時測試信號電性能參數保持一致
通過錄音信號質量與實時信號質量進行對比,確認錄音信號的電性能達到與實時信號電性能同樣的設計要求,另外通過對錄音的標準聲源進行主觀音質評價維度,綜合了主觀和客觀的數據分析。
s3,采用標準環境下語音測試模塊測試標準環境下語音識別率,進入步驟s4。
具體的,本步驟的測試環境仍定義在消音室內,主要目的是確認標準環境下語音識別率,其結果可參照常規情境下測試的語音識別率作對比,為后續優化語音識別或提高準確提供參考依據,同時整體在標準測試環境中對測試標準聲源的錄音質量的維度進行主觀音質評價量化。
s4,采用常規情景下語音測試模塊測試常規使用環境下語音識別率。
具體的,模擬常規使用環境測試,考慮室內噪聲,混響,回音,簡正振動等因素,確認其語音識別率,及結果更加偏向用戶使用模式,同時整體在情景交互測試環境中對測試標準聲源的錄音質量的維度進行主觀音質評價量化。
具體測試流程圖可以參見圖8,此不再細說。
通過以上四個步驟測試對信號數據分析,并結合主觀音質考評進一步提高語音識別測試準確率。
本發明同樣適用于在線語音識別測試,即聯網推送云端
盡管結合優選實施方案具體展示和介紹了本發明,但所屬領域的技術人員應該明白,在不脫離所附權利要求書所限定的本發明的精神和范圍內,在形式上和細節上可以對本發明做出各種變化,均為本發明的保護范圍。