一種語音數據識別方法及裝置制造方法

文檔序號：2826169閱讀：324來源：國知局

一種語音數據識別方法及裝置制造方法
【專利摘要】本發明實施例公開了一種語音數據識別方法及裝置，所述方法包括：獲取語音數據；對所述語音數據進行識別，如果識別出所述語音數據為命令語音數據，則確定所述命令語音數據對應的命令代碼；將所述命令代碼通過命令控制信道發送給桌面云服務端，以便于所述桌面云服務端根據所述命令代碼確定對應的標準語音數據，并將所述標準語音數據插入到音頻重定向數據隊列中進行識別。本發明實施例解決了現有技術中，采用音頻有損編解碼或實時傳輸協議方式，都會導致語音識別成功率下降的技術問題。
【專利說明】一種語音數據識別方法及裝置

【技術領域】
[0001] 本發明涉及通信【技術領域】，特別涉及一種語音數據識別方法及裝置。

【背景技術】
[0002] 在現有的桌面云重定向場景中，為了確保在網絡傳輸的時候得到最小的帶寬消耗并降低傳輸時延，桌面云客戶端對音頻數據通常會采用有損編碼方式（比如采用speex、 vobis音頻編碼方式等)，即針對原始PCM數據進行有損壓縮，然后將壓縮后的數據傳輸給桌面云服務器，由桌面云服務器解壓后還原成PCM數據，并將還原后的PCM數據發送給音頻重定向驅動程序，以便于完成相應音頻操作。
[0003] 但是，在該語音識別的場景中，語音指令識別成功率，將取決于輸入的PCM音頻數據是否完整清晰，然而，在現有的重定向音頻編解碼的過程中，由于采用了有損壓縮，雖然減小了帶寬和降低傳輸時延，但是解壓后音質都有所下降，從而導致語音指令的識別成功率相應的下降。
[0004] 當然，在現有的桌面云重定向場景中，桌面云客戶端對音頻數據也會采取實時傳輸協議(例如RTP)來進行重定向傳輸。這種音頻數據傳輸方式，雖然實時性很強，但是可靠性較低，會造成語音指令數據存在丟包的可能行，從而降低了語音指令的完整性，進而導致語音指令的識別成功率相應的下降。
[0005] 在對現有技術的研究和實踐過程中，本發明的發明人發現，現有的桌面云重定向場景中，無論采用音頻有損編解碼方式，還是采用實時傳輸協議方式，均會導致語音識別成功率下降的問題。

【發明內容】

[0006] 本發明實施例中提供了一種語音數據識別方法及裝置，以解決現有技術中，采用音頻有損編解碼或實時傳輸協議方式，都會導致語音識別成功率下降的技術問題。
[0007] 為了解決上述技術問題，本發明實施例公開了如下技術方案：
[0008] 第一方面提供了一種語音數據識別方法，所述方法包括：
[0009] 獲取語音數據；
[0010] 對所述語音數據進行識別，如果識別出所述語音數據為命令語音數據，則確定所述命令語音數據對應的命令代碼；
[0011] 將所述命令代碼通過命令控制信道發送給桌面云服務端，以便于所述桌面云服務端根據所述命令代碼確定對應的標準語音數據，并將所述標準語音數據插入到音頻重定向數據隊列中進行識別。
[0012] 在第一方面的第一種可能的實現方式中，所述方法還包括：
[0013] 如果識別出所述語音數據為普通語音數據，則對所述普通語音數據進行音頻編碼，并將編碼后的語音數據通過數據通道發送給桌面云服務端，以便于所述桌面云服務端將所述普通語音數插入所述音頻重定向數據隊列中進行識別。
[0014] 結合第一方面或第一方面的第一種可能的實現方式，在第二種可能的實現方式中，所述方法還包括：
[0015] 在獲取所述語音數據后，判斷所述語音數據的模式；
[0016] 如果所述語音數據的模式為語音識別模式，則執行所述對所述語音數據進行識別的步驟；
[0017] 如果所述語音數據的模式為普通語音模式，則執行所述對所述普通語音數據進行音頻編碼的步驟。
[0018] 結合第一方面或第一方面的第一種或第二種可能的實現方式，在第三種可能的實現方式中，所述方法還包括：
[0019] 預先存儲配置的所述命令語音數據，以及所述命令語音數據對應的命令代碼。
[0020] 結合第一方面或第一方面的第一種或第二種或第三種可能的實現方式，在第四種可能的實現方式中，所述對所述語音數據進行識別，具體包括：
[0021] 將所述語音數據與存儲的所述命令語音數據進行匹配，如果匹配成功，則所述語音數據為可識別的命令語音數據。
[0022] 結合第一方面或第一方面的第一種或第二種或第三種或第四種可能的實現方式，在第五種可能的實現方式中，所述方法還包括：
[0023] 接收管理系統下發的更新命令，所述更新命令包括：更新后的命令語音數據以及所述命令語音數據對應的命令代碼；
[0024] 根據所述更新命令更新存儲的所述命令語音數據，以及所述命令語音數據對應的命令代碼。
[0025] 第二方面提供了一種語音數據識別方法，所述方法包括：
[0026] 接收桌面云客戶端通過命令控制信道發送的命令代碼，所述命令代碼對應可識別的命令語音數據；
[0027] 根據所述命令代碼確定對應的標準語音數據；
[0028] 將所述標準語音數據插入到音頻重定向數據隊列中進行識別。
[0029] 在第二方面的第一種可能的實現方式中，所述方法還包括：
[0030] 接收桌面云客戶端通過數據信道發送的普通語音數據；
[0031] 對所述普通語音數據進行音頻解碼，并將解碼后的普通語音數據插入所述音頻重定向數據隊列中進行識別。
[0032] 結合第二方面或第二方面的第一種可能的實現方式，在第二種可能的實現方式中，所述方法還包括：預先存儲配置的所述命令代碼，以及所述命令代碼對應的標準語音數據。
[0033] 結合第二方面或第二方面的第一種或第二種可能的實現方式，在第三種可能的實現方式中，所述方法還包括：
[0034] 接收管理系統下發的更新命令，所述更新命令包括：更新的命令代碼以及所述命令代碼對應的標準語音數據；
[0035] 根據所述更新命令更新所述命令代碼以及所述命令代碼對應的標準語音數據。
[0036] 第三方面提供了一種語音數據識別方法，所述方法包括：
[0037] 接收桌面云客戶端通過命令控制信道發送的命令代碼，所述命令代碼對應命令語音數據；
[0038] 根據所述命令代碼調用對應的語音識別軟件開發接口識別出所述命令語音數據對應的語音數據。
[0039] 第四方面提供了一種語音數據識別裝置，包括：
[0040] 獲取單元，用于獲取語音數據；
[0041] 識別單元，用于對所述語音數據進行識別；
[0042] 確定單元，用于在所述識別單元識別出所述語音數據為命令語音數據時，確定所述命令語音數據對應的命令代碼；
[0043] 第一發送單元，用于將所述命令代碼通過命令控制信道發送給桌面云服務端，以便于所述桌面云服務端根據所述命令代碼確定對應的標準語音數據，并將所述標準語音數據插入到音頻重定向數據隊列中進行識別。
[0044] 在第四方面的第一種可能的實現方式中，還包括：
[0045] 編碼單元，用于在所述識別單元識別出所述語音數據為普通語音數據時，對所述普通語音數據進行音頻編碼；
[0046] 第二發送單元，用于將編碼后的語音數據通過數據通道發送給桌面云服務端，以便于所述桌面云服務端將所述普通語音數插入所述音頻重定向數據隊列中進行識別。
[0047] 結合第四方面或第四方面的第一種可能的實現方式，在第二種可能的實現方式中，還包括：
[0048] 判斷單元，用于在所述獲取單元獲取所述語音數據后，判斷所述語音數據的模式，并將所述語音數據的模式為語音識別模式的判斷結果發送給所述識別單元；將所述語音數據的模式為普通語音模式的判斷結果發送給所述編碼單元；
[0049] 所述識別單元，還用于在接收到所述判斷單元發送的所述語音數據的模式為語音識別模式的判斷結果時，對所述語音數據進行識別；
[0050] 所述編碼單元，還用于在接收到所述判斷單元發送的所述語音數據的模式為普通語音模式的判斷結果時，對所述普通語音數據進行音頻編碼。
[0051] 結合第四方面或第四方面的第一種或第二種可能的實現方式，在第三種可能的實現方式中，還包括：
[0052] 存儲單元，用于預先存儲所述命令語音數據，以及所述命令語音數據對應的命令代碼。
[0053] 結合第四方面或第四方面的第一種或第二種或第三種可能的實現方式，在第四種可能的實現方式中，還包括：
[0054] 接收單元，用于接收管理系統下發的更新命令；所述更新命令包括：更新后的命令語音數據以及所述命令語音數據對應的命令代碼；
[0055] 更新單元，用于根據所述更新命令更新存儲的所述命令識別數據，以及所述命令語音數據對應的命令代碼。
[0056] 第五方面提供了一種語音數據識別裝置，包括：
[0057] 第一接收單元，用于接收桌面云客戶端通過命令控制信道發送的命令代碼，所述命令代碼對應可識別的命令語音數據；
[0058] 確定單元，用于根據所述命令代碼確定對應的標準語音數據；
[0059] 第一識別單元，用于將所述標準語音數據插入到音頻重定向數據隊列中進行識別。
[0060] 在第五方面的第一種可能的實現方式中，還包括：
[0061] 第二接收單元，用于接收桌面云客戶端通過數據信道發送的普通語音數據；
[0062] 解碼單元，用于對所述普通語音數據進行音頻解碼；
[0063] 第二識別單元，用于將解碼后的普通語音數據插入所述音頻重定向數據隊列中進行識別。
[0064] 結合第五方面或第五方面的第一種可能的實現方式，在第二種可能的實現方式中，還包括：
[0065] 存儲單元，用于預先存儲配置的所述命令代碼，以及所述命令代碼對應的標準語音數據。
[0066] 結合第五方面或第五方面的第一種或第二種可能的實現方式，在第三種可能的實現方式中，還包括：
[0067] 第三接收單元，用于接收管理系統下發的更新命令；所述更新命令包括：更新的命令代碼以及所述命令代碼對應的標準語音數據；
[0068] 更新單元，用于根據所述更新命令更新存儲的所述命令代碼對應的標準語音數據。
[0069] 第六方面提供了一種語音數據識別裝置，包括：
[0070] 接收單元，用于接收桌面云客戶端通過命令控制信道發送的命令代碼，所述命令代碼對應可識別的命令語音數據；
[0071] 識別單元，用于根據所述命令代碼調用對應的語音識別軟件開發接口識別出所述命令語音數據對應的語音數據。
[0072] 由上述技術方案可知，本發明實施例中，將能識別出具體命令的語音數據先轉換為命令代碼，然后通過命令控制信道發送給桌面云服務端，節省了傳輸帶寬，降低了數據傳輸延遲；而桌面云服務端按照接收到的命令代碼從本地查找到對應的標準語音數據，并將該標準語音數據插入到音頻重定向數據隊列中進行識別，減少了音頻重定向的編解碼操作，提高了語音識別成功率。

【專利附圖】

【附圖說明】
[0073] 為了更清楚地說明本發明實施例或現有技術中的技術方案，下面將對實施例中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發明的一些實施例，對于本領域普通技術人員來講，在不付出創造性勞動的前提下，還可以根據這些附圖獲得其他的附圖。
[0074] 圖1為本發明實施例提供的一種語音數據識別方法的流程圖；
[0075] 圖2為本發明實施例提供的一種語音數據識別方法的另一流程圖；
[0076] 圖3為本發明實施例提供的一種語音數據識別方法的另一流程圖；
[0077] 圖4為本發明實施例提供的一種語音數據識別方法另一流程圖；
[0078] 圖5為本發明實施例提供的一種語音數據識別裝置的結構示意圖；
[0079] 圖6為本發明實施例提供的一種語音數據識別裝置的另一結構示意圖；
[0080] 圖7為本發明實施例提供的一種語音數據識別裝置的另一結構示意圖；
[0081] 圖8為本發明實施例提供的一種桌面云架構的示意圖；
[0082] 圖9為本發明實施例提供的第一應用實例的流程圖；
[0083] 圖10為本發明實施例提供的第二應用實例的流程圖；
[0084] 圖11為本發明實施例提供的第三應用實例的流程圖；
[0085] 圖12為本發明實施例提供的第四應用實例的流程圖。

【具體實施方式】
[0086] 下面將結合本發明實施例中的附圖，對本發明實施例中的技術方案進行清楚、完整的描述，顯然，所描述的實施例僅僅是本發明一部分實施例，而不是全部的實施例。基于本發明中的實施例，本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例，都屬于本發明保護的范圍。
[0087] 請參閱圖1，圖1為本發明實施例提供的一種語音數據識別方法的流程圖；所述方法包括：
[0088] 步驟101 :獲取語音數據；
[0089] 該步驟中，桌面云客戶端通過聲音采集系統獲取用戶輸入的語音數據，通常情況下，該語音數據為脈沖編碼調制（PCM，Pulse Code Modulation)語音數據。其中，聲音采集系比如麥克風等。
[0090] 步驟102 :對所述語音數據進行識別，如果識別出所述語音數據為命令語音數據，則確定所述命令語音數據對應的命令代碼；
[0091] 在該步驟中，將該語音數據與預先存儲的命令語音數據進行匹配，如果匹配成功，則說明該語音數據為可識別的命令語音數據，然后從本地查找出該命令語音數據對應的命令代碼。
[0092] 步驟103 :將所述命令代碼通過命令控制信道發送給桌面云服務端，以便于所述桌面云服務端根據所述命令代碼確定對應的標準語音數據，并將所述標準語音數據插入到音頻重定向數據隊列中進行識別。
[0093] 本發明實施例中，將能識別出具體命令的語音數據先轉換為命令代碼，然后通過命令控制信道發送給桌面云服務端，節省了傳輸帶寬，降低了數據傳輸延遲；而桌面云服務端按照接收到的命令代碼從本地查找到對應的標準語音數據，并將該標準語音數據插入到音頻重定向數據隊列中進行識別，減少了音頻重定向的編解碼操作，提高了語音識別成功率。
[0094] 還請參閱圖2,圖2為本發明實施例提供的一種語音數據識別方法的另一流程圖，所述方法包括：
[0095] 步驟201 :獲取語音數據；
[0096] 其獲取語音數據的過程詳見步驟101。
[0097] 步驟202 :判斷所述語音數據的模式；如果所述語音數據的模式為語音識別模式，執行步驟203 ;如果所述語音數據的模式為普通語音模式，執行步驟206 ;
[0098] 該步驟中，可以通過模式切換，將語音識別模式和普通語音模式的語音數據進行分開處理，且各個模式的處理過程互不干擾，便于提高處理效率。
[0099] 步驟203 :對所述語音數據進行識別，如果識別出所述語音數據為命令語音數據，執行步驟204 ;如果識別出所述語音數據為普通語音數據，執行步驟206 ;
[0100] 該步驟中，將所述語音數據與存儲的所述命令語音數據進行匹配，如果匹配成功，則所述語音數據為可識別的命令語音數據。也就是說，如果能夠識別出該語音數據中的具體命令，則說明該語音數據為可識別的命令語音數據；如果不可以，則說明該語音數據為普通語音數據。
[0101] 步驟204 :確定所述命令語音數據對應的命令代碼；
[0102] 在該步驟，通過查找桌面云客戶端的數據庫（即本地數據庫)，獲取所述命令語音數據對應的命令代碼，其中，在本地數據庫中預先存儲配置的所述命令語音數據，以及所述命令語音數據對應的命令代碼。
[0103] 步驟205 :將所述命令代碼通過命令控制信道發送給桌面云服務端，以便于所述桌面云服務端根據所述命令代碼確定對應的標準語音數據，并將所述標準語音數據插入到音頻重定向數據隊列中進行識別；
[0104] 該步驟中，將命令代碼通過命令控制信道發送給桌面云服務端，節省了傳輸帶寬，而桌面云服務端根據接收地的所述命令代碼從桌面云服務端的數據庫查找到對應的標準語音數據，避免了編解碼操作，提高了音質，以及對指令的識別成功率。
[0105] 步驟206 :對所述普通語音數據進行音頻編碼；
[0106] 如果不能識別出所述語音數據的具體命令，則認為，該語音數據為普通語音數據，則對所述普通語音數據進行音頻編碼，其編碼過程與現有技術相同，在此不再贅述。
[0107] 步驟207 :將編碼后的語音數據通過數據通道發送給桌面云服務端，以便于所述桌面云服務端將所述普通語音數插入所述音頻重定向數據隊列中進行識別。
[0108] 可選的，在上述圖1和圖2的實施例中，所述方法還可以包括：接收管理系統下發的更新命令，所述更新命令包括：更新后的命令語音數據以及所述命令語音數據對應的命令代碼；根據所述更新命令更新存儲的所述命令語音數據，以及所述命令語音數據對應的命令代碼。
[0109] 該實施例中，可以實時或定時更新本地存儲的命令語音數據，以及所述命令語音數據對應的命令代碼。
[0110] 還請參閱圖3,圖3為本發明實施例提供的一種語音數據識別方法的另一流程圖。所述方法包括：
[0111] 步驟301 :接收桌面云客戶端通過命令控制信道發送的命令代碼，所述命令代碼對應可識別的命令語音數據；
[0112] 步驟302 :根據所述命令代碼確定對應的標準語音數據；
[0113] 該步驟中，由于桌面云服務端中預先存儲有命令代碼，以及所述命令代碼對應的標準語音數據，在接收到命令代碼可以，可以查找桌面云服務端的數據庫（即本地數據庫)，從而得到對應的標準語音數據。
[0114] 步驟303 :將所述標準語音數據插入到音頻重定向數據隊列中進行識別。
[0115] 本發明實施例中，在接收到命令代碼后，通過查找的方式可以得到該命令代碼對應的標準語音數據，并將該標準語音數據插入到音頻重定向數據隊列中進行識別，減少了音頻重定向的編碼解碼操作，提高了語音識別成功率。
[0116] 可選的，在另一實施例中，該實施例在上述實施例的基礎上，所述方法還可以包括：接收桌面云客戶端通過數據信道發送的普通語音數據；對所述普通語音數據進行音頻解碼，并將解碼后的普通語音數據插入所述音頻重定向數據隊列中進行識別。
[0117] 該實施例中，桌面云客戶端將能識別的語音數據轉換為命令代碼后，通過信令控制信道傳輸桌面云服務端，而將不能識別的普通語音數據通過數據通道傳輸給桌面云服務端；節省了傳輸帶寬；而桌面云服務端在接收到命令代碼后，本地查找到所述命令代碼對應的標準語音數據，提高了語音的識別成功率。
[0118] 可選的，在另一實施例中，該實施例在上述所有實施例的基礎上，所述方法還可以包括：接收管理系統下發的更新命令，所述更新命令包括：更新的命令代碼以及所述命令代碼對應的標準語音數據；根據所述更新命令更新所述命令代碼對應的標準語音數據。
[0119] 還請參閱圖4,圖4為本發明實施例提供的一種語音數據識別方法另一流程圖，所述方法包括：
[0120] 步驟401 :接收桌面云客戶端通過命令控制信道發送的命令代碼，所述命令代碼對應可識別的命令語音數據；
[0121] 步驟402 :根據所述命令代碼調用對應的語音識別軟件開發接口識別出所述命令語音數據對應的語音數據。
[0122] 上述實施例中，桌面云服務端將接收到的命令代碼再次替換(通過查找的方式）成語音數據，而該實施例中，還可以在接收到代碼命令后，如果桌面云服務端，則可以直接執行此命令代碼：比如，當語音識別軟件開放一定的開發接口，或者桌面云服務器能完全理解此命令代碼的含義，都可直接執行該代碼命令，而不用再轉成語音數據段，這樣又可以減少一次識別過程，從而提高了命令的執行效率。
[0123] 基于上述方法的實現過程，本發明實施例還提供一種語音數據識別裝置，其結構示意圖如圖5所示，所述裝置包括：獲取單元51，識別單元52,確定單元53和第一發送單元 54,其中，
[0124] 所述獲取單元51，用于獲取語音數據；所述識別單元52,用于對所述語音數據進行識別；具體用于將所述語音數據與存儲的所述命令語音數據進行匹配，如果匹配成功，則所述語音數據為可識別的語音數據；所述確定單元53,用于在所述識別單元識別出所述語音數據為命令語音數據時，確定所述命令語音數據對應的命令代碼；所述第一發送單元 54,用于將所述命令代碼通過命令控制信道發送給桌面云服務端，以便于所述桌面云服務端根據所述命令代碼確定對應的標準語音數據，并將所述標準語音數據插入到音頻重定向數據隊列中進行識別。
[0125] 可選的，所述裝置還可以包括：編碼單元和第二發送單元，其中，所述編碼單元，用于在所述識別單元識別出所述語音數據為普通語音數據時，對所述普通語音數據進行音頻編碼；所述第二發送單元，用于將編碼后的語音數據通過數據通道發送給桌面云服務端，以便于所述桌面云服務端將所述普通語音數插入所述音頻重定向數據隊列中進行識別。
[0126] 可選的，所述裝置還可以包括：判斷單元，其中，所述判斷單元，用于在所述獲取單元獲取所述語音數據后，判斷所述語音數據的模式，并將所述語音數據的模式為語音識別模式的判斷結果發送給所述識別單元；將所述語音數據的模式為普通語音模式的判斷結果發送給所述編碼單元；所述識別單元，還用于在接收到所述判斷單元發送的所述語音數據的模式為語音識別模式的判斷結果時，對所述語音數據進行識別；所述編碼單元，還用于在接收到所述判斷單元發送的所述語音數據的模式為普通語音模式的判斷結果時，對所述普通語音數據進行音頻編碼。
[0127] 可選的，所述裝置還可以包括：存儲單元，用于預先存儲所述命令語音數據，以及所述命令語音數據對應的命令代碼。
[0128] 可選的，所述裝置還可以包括：接收單元和更新單元，其中，所述接收單元，用于接收管理系統下發的更新命令，所述更新命令包括：更新后的命令語音數據以及所述命令語音數據對應的命令代碼；所述更新單元，用于根據所述更新命令更新存儲的所述命令識別數據，以及所述命令語音數據對應的命令代碼。
[0129] 可選的，所述裝置可集成在桌面云客戶端，也可以獨立部署，本實施例不作限制。
[0130] 所述裝置中各個單元的功能和作用的實現過程，詳見上述方法中對應步驟的實現過程，在此不再贅述。
[0131] 還請參閱圖6,圖6為本發明實施例提供的一種語音數據識別裝置的另一結構示意圖，所述裝置包括：第一接收單元61，確定單元62和第一識別單元63,其中，所述第一接收單元61，用于接收桌面云客戶端通過命令控制信道發送的命令代碼，所述命令代碼對應可識別的命令語音數據；所述確定單元62,用于根據所述命令代碼確定對應的標準語音數據；所述第一識別單元63,用于將所述標準語音數據插入到音頻重定向數據隊列中進行識別。
[0132] 可選的，所述裝置還可以包括：第二接收單元，解碼單元和第二識別單元，其中，所述第二接收單元，用于接收桌面云客戶端通過數據信道發送的普通語音數據；所述解碼單元，用于對所述普通語音數據進行音頻解碼；所述第二識別單元，用于將解碼后的普通語音數據插入所述音頻重定向數據隊列中進行識別。
[0133] 可選的，所述裝置還可以包括：存儲單元，與所述確定單元連接，用于預先存儲配置的所述命令代碼，以及所述命令代碼對應的標準語音數據。
[0134] 可選的，所述裝置還可以包括：第三接收單元和更新單元，其中，所述第三接收單元，用于接收管理系統下發的更新命令；所述更新命令包括：更新的命令代碼以及所述命令代碼對應的標準語音數據；所述更新單元，用于根據所述更新命令更新存儲的所述命令代碼對應的標準語音數據。
[0135] 可選的，所述裝置可集成在桌面云服務端，也可以獨立部署，本實施例不作限制。
[0136] 所述裝置中各個單元的功能和作用的實現過程，詳見上述方法中對應步驟的實現過程，在此不再贅述。
[0137] 還請參閱圖7,圖7為本發明實施例提供的一種語音數據識別裝置的另一結構示意圖，所述裝置包括：接收單元71和識別單元72,其中，
[0138] 所述接收單元71，用于接收桌面云客戶端通過命令控制信道發送的命令代碼，所述命令代碼對應可識別的命令語音數據；所述識別單元72,用于根據所述命令代碼調用對應的語音識別軟件開發接口識別出所述命令語音數據對應的語音數據。
[0139] 可選的，所述裝置還可以包括：第二接收單元，解碼單元和第二識別單元，其中，所述第二接收單元，用于接收桌面云客戶端通過數據信道發送的普通語音數據；所述解碼單元，用于對所述普通語音數據進行音頻解碼；所述第二識別單元，用于將解碼后的普通語音數據插入音頻重定向數據隊列中進行識別。
[0140] 可選的，所述裝置可集成在桌面云服務端，也可以獨立部署，本實施例不作限制。
[0141] 所述裝置中各個單元的功能和作用的實現過程，詳見上述方法中對應步驟的實現過程，在此不再贅述。
[0142] 為了便于本領域技術人員的理解，下面以具體的實例來說明。
[0143] 還請參圖8,圖8為本發明實施例提供的一種桌面云架構的示意圖，在該實施例中，本發明實施例是在現有語音識別重定向的流程基礎上，增加了若干步驟來實現，所涉及的模塊主要包括桌面云客戶端的音頻采集設備（比如耳機麥克風)，音頻服務模塊（比如包括音頻采集模塊，編解碼模塊等)，通訊模塊，桌面云服務端的音頻服務模塊（比如包括音頻重定向驅動，編解碼模塊等)。桌面云客戶端和桌面云服務端之間通過桌面云重定向協議進行通信，具體如圖中斜字體所示，在此不再贅述。其中，該本發明實施例中涉及到模塊，將在下述實施例中說明。
[0144] 還請參閱圖9,圖9為本發明實施例提供的第一應用實例的流程圖，具體包括：
[0145] 步驟901 :音頻采集模塊采集PCM語音數據；
[0146] 在客戶端采集到的PCM語音數據；
[0147] 步驟902 :音頻采集模塊對采集的PCM語音數據進行識別；如果識別出具體命令，即所述PCM語音數據為命令語音數據；則執行步驟903 ;如果沒有識別出具體命令，即所述 PCM語音數據為普通語音，執行步驟911 ;
[0148] 步驟903 :音頻采集模塊查找本地數據庫中與所述命令語音數據對應的命令代碼；
[0149] 步驟904 :將該命令代碼發送桌面云客戶端的通信模塊；
[0150] 步驟905 :桌面云客戶端的通信模塊通過命令控制信道（比如RTP)將所述命令代碼發送給桌面云服務器的通信模塊，即協議通信；
[0151] 步驟906 :桌面云服務器上的通信模塊將所述命令代碼發送給桌面云服務器上的音頻采集模塊；
[0152] 步驟907 :桌面云服務器上的音頻采集模塊在本地查找所述命令代碼對應的標準 PCM語音片段；
[0153] 步驟908 :將標準PCM語音片段插入音頻重定向數據隊列中；
[0154] 步驟909 :音頻重定向驅動模塊將音頻重定向數據隊列的語音數據（比如標準PCM 語音片段）發送給語音識別應用軟件，
[0155] 步驟910 :語音識別應用軟件對語音數據進行識別，并調用API執行相關命令的操作，結束本次操作。
[0156] 步驟911 :音頻采集模塊將所述普通語音數據發送給音頻編碼模塊，對所述普通語音數據進行編碼；
[0157] 步驟912 :將編碼后的所述普通語音數據（即壓縮數據包）發送桌面云客戶端的通信模塊；
[0158] 步驟913 :桌面云客戶端的通信模塊通過數據信道（比如TCP)將所述編碼后的所述普通語音數據發送給桌面云服務器的通信模塊；
[0159] 步驟914:桌面云服務器的通信模塊將編碼后的所述普通語音數據（基于壓縮數據包）發送給桌面云服務端的語音解碼模塊；
[0160] 步驟915 :桌面云服務端的語音解碼模塊對所述普通語音數據進行解碼，得到對應的PCM音頻數據；
[0161] 步驟916 :將PCM音頻數據插入到插入所述音頻重定向數據隊列中；
[0162] 然后執行步驟909和步驟910所述的內容。
[0163] 也就是說，所述音頻重定向驅動模塊，還用于將音頻重定向數據隊列的語音數據 (比如PCM語音數據）發送給語音識別應用軟件，語音識別應用軟件調用API執行相關命令的操作，完成整個語音識別過程。
[0164] 其中，在該實施例中，無論是客戶端還是服務端的通信模塊均維護一個數據收發隊列，以確保命令語音數據和普通語音數據混合情況下數據順序的正確性。
[0165] 需要說明的是，在該實施例中，桌面云客戶端內置的語音識別模塊能識別的命令數量，與桌面云服務端預先存儲的標準PCM語音片段是一一對應的，在安裝桌面云系統的時候預先內置。
[0166] 在該實施例中，本實施例新增步驟的過程應有相應的模塊來實現，具體詳見表1 和表2.
[0167] 表 1

【權利要求】
1. 一種語音數據識別方法，其特征在于，包括：獲取語音數據；對所述語音數據進行識別，如果識別出所述語音數據為命令語音數據，則確定所述命令語音數據對應的命令代碼；將所述命令代碼通過命令控制信道發送給桌面云服務端，以便于所述桌面云服務端根據所述命令代碼確定對應的標準語音數據，并將所述標準語音數據插入到音頻重定向數據隊列中進行識別。
2. 根據權利要求1所述的方法，其特征在于，還包括：如果識別出所述語音數據為普通語音數據，則對所述普通語音數據進行音頻編碼，并將編碼后的語音數據通過數據通道發送給桌面云服務端，以便于所述桌面云服務端將所述普通語音數插入所述音頻重定向數據隊列中進行識別。
3. 根據權利要求2所述的方法，其特征在于，還包括：在獲取所述語音數據后，判斷所述語音數據的模式；如果所述語音數據的模式為語音識別模式，則執行所述對所述語音數據進行識別的步驟；如果所述語音數據的模式為普通語音模式，則執行所述對所述普通語音數據進行音頻編碼的步驟。
4. 根據權利要求1至3任一項所述的方法，其特征在于，還包括：預先存儲配置的所述命令語音數據，以及所述命令語音數據對應的命令代碼。
5. 根據權利要求4所述的方法，其特征在于，所述對所述語音數據進行識別，具體包括：將所述語音數據與存儲的所述命令語音數據進行匹配，如果匹配成功，則所述語音數據為可識別的命令語音數據。
6. 根據權利要求5所述的方法，其特征在于，還包括：接收管理系統下發的更新命令，所述更新命令包括：更新后的命令語音數據以及所述命令語音數據對應的命令代碼；根據所述更新命令更新存儲的所述命令語音數據，以及所述命令語音數據對應的命令代碼。
7. -種語音數據識別方法，其特征在于，包括：接收桌面云客戶端通過命令控制信道發送的命令代碼，所述命令代碼對應可識別的命令語音數據；根據所述命令代碼確定對應的標準語音數據；將所述標準語音數據插入到音頻重定向數據隊列中進行識別。
8. 根據權利要求7所述的方法，其特征在于，還包括：接收桌面云客戶端通過數據信道發送的普通語音數據；對所述普通語音數據進行音頻解碼，并將解碼后的普通語音數據插入所述音頻重定向數據隊列中進行識別。
9. 根據權利要求7或8所述的方法，其特征在于，還包括：預先存儲配置的所述命令代碼，以及所述命令代碼對應的標準語音數據。
10. 根據權利要求9所述的方法，其特征在于，還包括：接收管理系統下發的更新命令，所述更新命令包括：更新的命令代碼以及所述命令代碼對應的標準語音數據；根據所述更新命令更新所述命令代碼以及所述命令代碼對應的標準語音數據。
11. 一種語音數據識別方法，其特征在于，包括：接收桌面云客戶端通過命令控制信道發送的命令代碼，所述命令代碼對應命令語音數據；根據所述命令代碼調用對應的語音識別軟件開發接口識別出所述命令語音數據對應的語音數據。
12. -種語音數據識別裝置，其特征在于，包括：獲取單元，用于獲取語音數據；識別單元，用于對所述語音數據進行識別；確定單元，用于在所述識別單元識別出所述語音數據為命令語音數據時，確定所述命令語音數據對應的命令代碼；第一發送單元，用于將所述命令代碼通過命令控制信道發送給桌面云服務端，以便于所述桌面云服務端根據所述命令代碼確定對應的標準語音數據，并將所述標準語音數據插入到音頻重定向數據隊列中進行識別。
13. 根據權利要求12所述的裝置，其特征在于，還包括：編碼單元，用于在所述識別單元識別出所述語音數據為普通語音數據時，對所述普通語音數據進行音頻編碼；第二發送單元，用于將編碼后的語音數據通過數據通道發送給桌面云服務端，以便于所述桌面云服務端將所述普通語音數插入所述音頻重定向數據隊列中進行識別。
14. 根據權利要求13所述的裝置，其特征在于，還包括：判斷單元，用于在所述獲取單元獲取所述語音數據后，判斷所述語音數據的模式，并將所述語音數據的模式為語音識別模式的判斷結果發送給所述識別單元；將所述語音數據的模式為普通語音模式的判斷結果發送給所述編碼單元；所述識別單元，還用于在接收到所述判斷單元發送的所述語音數據的模式為語音識別模式的判斷結果時，對所述語音數據進行識別；所述編碼單元，還用于在接收到所述判斷單元發送的所述語音數據的模式為普通語音模式的判斷結果時，對所述普通語音數據進行音頻編碼。
15. 根據權利要求12至14任一項所述的裝置，其特征在于，還包括：存儲單元，用于預先存儲所述命令語音數據，以及所述命令語音數據對應的命令代碼。
16. 根據權利要求15所述的裝置，其特征在于，還包括：接收單元，用于接收管理系統下發的更新命令；所述更新命令包括：更新后的命令語音數據以及所述命令語音數據對應的命令代碼；更新單元，用于根據所述更新命令更新存儲的所述命令識別數據，以及所述命令語音數據對應的命令代碼。
17. -種語音數據識別裝置，其特征在于，包括：第一接收單元，用于接收桌面云客戶端通過命令控制信道發送的命令代碼，所述命令代碼對應可識別的命令語音數據；確定單元，用于根據所述命令代碼確定對應的標準語音數據；第一識別單元，用于將所述標準語音數據插入到音頻重定向數據隊列中進行識別。
18. 根據權利要求17所述的裝置，其特征在于，還包括：第二接收單元，用于接收桌面云客戶端通過數據信道發送的普通語音數據；解碼單元，用于對所述普通語音數據進行音頻解碼；第二識別單元，用于將解碼后的普通語音數據插入所述音頻重定向數據隊列中進行識別。
19. 根據權利要求17或18所述的裝置，其特征在于，還包括：存儲單元，用于預先存儲配置的所述命令代碼，以及所述命令代碼對應的標準語音數據。
20. 根據權利要求19所述的裝置，其特征在于，還包括：第三接收單元，用于接收管理系統下發的更新命令；所述更新命令包括：更新的命令代碼以及所述命令代碼對應的標準語音數據；更新單元，用于根據所述更新命令更新存儲的所述命令代碼對應的標準語音數據。
21. -種語音數據識別裝置，其特征在于，包括：接收單元，用于接收桌面云客戶端通過命令控制信道發送的命令代碼，所述命令代碼對應可識別的命令語音數據；識別單元，用于根據所述命令代碼調用對應的語音識別軟件開發接口識別出所述命令語音數據對應的語音數據。
【文檔編號】G10L15/34GK104424948SQ201310369541
【公開日】2015年3月18日申請日期:2013年8月22日優先權日:2013年8月22日
【發明者】杜川申請人:華為技術有限公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：杜川;
技術所有人：華為技術有限公司;
我是此專利的發明人

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種語音數據識別方法及裝置制造方法