專利名稱:語音識別方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音識別技術(shù)領(lǐng)域,更具體地說,涉及語音識別方法和系統(tǒng)。
背景技術(shù):
語音識別技術(shù)是一種對用戶錄入的語音信號進(jìn)行識別,最終轉(zhuǎn)化為文本/字符串(也即識別結(jié)果為文本)的技術(shù),其為自然人性的人機交互提供了便利。以采用語音識別技術(shù)的移動設(shè)備為例,在語音識別技術(shù)的支持下,用戶只要對著移動設(shè)備說話,經(jīng)過語音識別系統(tǒng)識別后就會自動形成文字,大大提高了用戶的輸入效率。但是,在大詞匯量隨意說的應(yīng)用環(huán)境下,語音識別技術(shù)依然不能達(dá)到百分百正確的識別率,需要人工對識別結(jié)果進(jìn)行修正編輯。移動設(shè)備(語音識別系統(tǒng))將語音識別結(jié)果顯示到屏幕的文本輸入?yún)^(qū)后,用戶如想對語音識別結(jié)果進(jìn)行修改編輯,則首先需要在語音識別結(jié)果中定位需要修正(也可稱為待修改)的字符。·而在移動設(shè)備上,特別是小屏幕的指觸屏設(shè)備上,由于屏幕尺寸受限,用戶在從連續(xù)大段文本中對某個確定的字符進(jìn)行定位時,特別是在相鄰兩字符間插入編輯光標(biāo)時,存在定位不便的問題。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例目的在于提供語音識別方法和系統(tǒng),以解決上述用戶人工進(jìn)行定位存在的定位不便的問題。為實現(xiàn)上述目的,本發(fā)明實施例提供如下技術(shù)方案根據(jù)本發(fā)明實施例的一個方面,提供一種語音識別方法,包括對用戶輸入的語音信號進(jìn)行語音識別,獲得第一最優(yōu)解碼路徑,所述第一最優(yōu)解碼路徑包括語音識別結(jié)果以及所述語音識別結(jié)果中各字符對應(yīng)的語音片段;接收用戶單獨輸入的糾錯信息并生成相應(yīng)的糾錯字符串,所述糾錯信息通過非語音方式或語音方式輸入;獲取所述糾錯字符串在所述用戶輸入的語音信號中對應(yīng)的至少一個語音段作為侯選語音段,并分別統(tǒng)計各侯選語音段在所述糾錯字符串模型上的似然度;根據(jù)所述語音識別結(jié)果中各字符對應(yīng)的語音片段,分別確定上述各侯選語音段在第一最優(yōu)解碼路徑的語音識別結(jié)果中所對應(yīng)的字符串作為侯選字符串;根據(jù)所述侯選語音段的似然度計算與之對應(yīng)的侯選字符串的糾錯置信度,并根據(jù)糾錯置信度確定出錯誤字符串;利用所述糾錯字符串替換所述錯誤字符串。根據(jù)本發(fā)明實施例的另一個方面,提供一種語音識別系統(tǒng),包括語音識別單元,用于對用戶輸入的語音信號進(jìn)行語音識別,獲得第一最優(yōu)解碼路徑,所述第一最優(yōu)解碼路徑包括語音識別結(jié)果以及所述語音識別結(jié)果中各字符對應(yīng)的語音片段;
糾錯字符串生成單元,用于接收用戶單獨輸入的糾錯信息并生成相應(yīng)的糾錯字符串,所述糾錯信息通過非語音方式或語音方式輸入;自動糾錯單元,用于根據(jù)所述糾錯字符串確定所述用戶輸入的語音信號中侯選語音段;統(tǒng)計所述侯選語音段在所述糾錯字符串模型上的似然度;根據(jù)所述語音識別結(jié)果中各字符對應(yīng)的語音片段,確定上述侯選語音段在第一最優(yōu)解碼路徑的語音識別結(jié)果中所對應(yīng)的字符串作為侯選字符串;根據(jù)所述侯選語音段對應(yīng)的似然度計算與之對應(yīng)的侯選字符串的糾錯置信度,并根據(jù)糾錯置信度確定出錯誤字符串;利用所述糾錯字符串替換所述錯誤字符串。從上述的技術(shù)方案可以看出,本發(fā)明實施例所公開的技術(shù)方案根據(jù)用戶單獨輸入的糾錯信息所生成的糾錯字符串來確定侯選語音段,再通過侯選語音段找到其在語音識別結(jié)果中所對應(yīng)的錯誤字符串,實現(xiàn)了用戶所輸入的糾錯字符串與錯誤字符串的對應(yīng),進(jìn)而實現(xiàn)了對語音識別結(jié)果中錯誤字符串的自動定位,解決了用戶人工進(jìn)行定位存在的定位不便的問題。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實施例提供的語音識別方法流程圖;圖2為本發(fā)明實施例提供的手寫輸入識別流程圖;圖3為本發(fā)明實施例提供字符覆蓋的最小區(qū)域示意圖;圖4為本發(fā)明實施例提供的自動糾錯過程流程圖;圖5為本發(fā)明實施例提供的糾錯字符串檢索網(wǎng)絡(luò)結(jié)構(gòu)示意圖;圖6為本發(fā)明實施例提供的自動糾錯過程流程圖;圖7為本發(fā)明實施例提供的確定出錯誤字符串流程圖;圖8為本發(fā)明實施例提供的糾錯置信度計算流程圖;圖9為本發(fā)明實施例提供的語音識別系統(tǒng)結(jié)構(gòu)示意圖。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。作為一種簡單方便而又高效的輸入方式,語音識別改變了傳統(tǒng)的基于復(fù)雜編碼或拼音輸入的鍵盤模式,為自然人性的人機交互提供了便利條件。特別是近年來隨著科技的發(fā)展和無線通訊網(wǎng)絡(luò)的創(chuàng)新普及,各種在線語音識別應(yīng)用,如發(fā)微博,寫短信,網(wǎng)絡(luò)即時通訊等受到了越來越多的關(guān)注。在語音識別技術(shù)的支持下,用戶只要對著移動設(shè)備說話,經(jīng)過系統(tǒng)識別后就會自動形成文字,大大提高了用戶的輸入效率。
但是,在大詞匯量隨意說的應(yīng)用環(huán)境下,語音識別技術(shù)依然不能達(dá)到百分百正確的識別率,需要人工對識別結(jié)果進(jìn)行修正編輯。移動設(shè)備(語音識別系統(tǒng))將語音識別結(jié)果顯示到屏幕的文本輸入?yún)^(qū)后,用戶如想對語音識別結(jié)果進(jìn)行修改編輯,則需要在識別結(jié)果中定位需要修正(也可稱為待修改)的字符。而在移動設(shè)備上,特別是小屏幕的指觸屏設(shè)備上,由于屏幕尺寸受限,用戶在從連續(xù)大段文本中對某個確定的字符進(jìn)行定位時,特別是在相鄰兩字符間插入編輯光標(biāo)時,存在定位不準(zhǔn)的問題。為便于理解,現(xiàn)對語音識別介紹如下如果將待識別的一段語音信號記作S,對S進(jìn)行一系列處理后得到與之相對應(yīng)的·語音特征序列O,記作O = (O1, O2,…,Oi, ···, 0T},其中Oi是第i個語音特征,T為語音特征總個數(shù)。語音信號S對應(yīng)的句子可看作是由許多詞組成的一個詞串,記作W= Iw1, W2,…,WnI。語音識別的任務(wù)就是根據(jù)已知的語音特征序列0,求出最可能的詞串r。在語音識別的具體過程中,一般首先提取語音信號對應(yīng)的語音特征參數(shù),隨后在由預(yù)置的聲學(xué)模型和語言模型構(gòu)成的網(wǎng)絡(luò)搜索空間中,根據(jù)預(yù)設(shè)的搜索算法(比如Viterbi算法),搜索相對于所提取得語音特征參數(shù)的最優(yōu)路徑(也即最優(yōu)解碼路徑)。在了解了語音識別的一些概念后,現(xiàn)對本發(fā)明實施例的技術(shù)方案介紹如下。為解決上述定位不便的問題,本發(fā)明實施例所提供的語音識別方法至少包括如下步驟語音識別過程對用戶輸入的語音信號進(jìn)行語音識別,獲得最優(yōu)解碼路徑,其中,最優(yōu)解碼路徑包括語音識別結(jié)果以及語音識別結(jié)果中各字符對應(yīng)的語音片段;糾錯字符串生成過程接收用戶單獨輸入的糾錯信息并生成相應(yīng)的糾錯字符串,上述糾錯信息允許通過非語音方式或語音方式輸入;自動糾錯過程根據(jù)糾錯字符串確述用戶輸入的語音信號中侯選語音段;根據(jù)語音識別結(jié)果中各字符對應(yīng)的語音片段,確定上述侯選語音段在第一最優(yōu)解碼路徑的語音識別結(jié)果中所對應(yīng)的字符串作為侯選字符串,從侯選字符串中確定出錯誤字符串;并利用糾錯字符串替換所述錯誤字符串。下面對各個過程進(jìn)行一一介紹。一,語音識別過程為了最大可能的滿足用戶日常交互需求,本發(fā)明實施例采用大詞匯量連續(xù)語音識別技術(shù),以實現(xiàn)對任意說語音的文本轉(zhuǎn)換。其中,參見圖1,上述語音識別過程具體包括S11、跟蹤采集用戶輸入的語音信號(也即上述待識別的一段語音信號);在本發(fā)明其他實施例中,可將上述語音信號存入數(shù)據(jù)緩存區(qū);S12、對上述語音信號進(jìn)行預(yù)處理,以得到經(jīng)過預(yù)處理后的語音數(shù)據(jù);上述預(yù)處理可包括語音信號采樣、反混疊帶通濾波、分幀處理、去除個體發(fā)音差異和設(shè)備、環(huán)境引起的噪聲影響,端點檢測。為了提高語音識別系統(tǒng)的魯棒性上述預(yù)處理具體還可包括前端降噪處理,以為后續(xù)語音處理提供較為純凈的語音。S13、對上述經(jīng)過預(yù)處理的語音數(shù)據(jù)中每幀語音數(shù)據(jù)分別進(jìn)行特征提取,以獲取特征矢量序列。在步驟S13中,對每幀語音數(shù)據(jù)進(jìn)行特征提取后可提取出有效語音特征(或者特征矢量)。這樣,經(jīng)特征提取后,每一幀語音數(shù)據(jù)形成一個特征矢量,相應(yīng)的,上述語音數(shù)據(jù)即可用一特征矢量序列表示;本領(lǐng)域技術(shù)人員可以理解的是,如果對經(jīng)過預(yù)處理后的語音數(shù)據(jù)包括30幀語音數(shù)據(jù)的話,那么這30幀語音數(shù)據(jù)就可提取出30個特征矢量,而這30個特征矢量按照時間先后順序即可組成上述特征矢量序列。在本發(fā)明其他實施例中,上述有效語音特征可為線性預(yù)測倒譜或MFCC (Mel倒譜)特征。具體的,以MFCC特征為例,可對窗長25ms幀移IOms的每幀語音數(shù)據(jù)通過短時分析得到MFCC參數(shù)和/或MFCC參數(shù)的一階/ 二階差分,共計39維。這樣,每幀語音數(shù)據(jù)經(jīng)過特征提取可得到一個39維的特征矢量。在本發(fā)明其他實施例中,可將上述語音特征/語音特征矢量序列存入特征緩存區(qū)內(nèi)。S14、在預(yù)先構(gòu)建的檢索網(wǎng)絡(luò)中對上述特征矢量序列進(jìn)行最優(yōu)路徑搜索(上述檢索網(wǎng)絡(luò)主要由系統(tǒng)預(yù)設(shè)的聲學(xué)模型,詞典,語言模型等構(gòu)成),以獲取與上述特征矢量序列具有最大模型似然概率的模型串作為語音識別結(jié)果輸出。在具體實施時,可采用業(yè)內(nèi)主流的基于動態(tài)規(guī)劃思想的Viterbi搜索算法,對每一特征矢量遍歷檢索網(wǎng)絡(luò)中滿足預(yù)設(shè)條件的活躍節(jié)點計算累計歷史路徑概率并保留滿足預(yù)設(shè)條件的歷史路徑作為后續(xù)搜索網(wǎng)絡(luò)的活躍節(jié)點,最后通過對具有最大歷史路徑概率的路徑(也即上述第一最優(yōu)解碼路徑)回溯實現(xiàn)對輸入語音的識別解碼。在解碼中第一最優(yōu)解碼路徑對每幀語音數(shù)據(jù)均保留其所對應(yīng)的識別單元模型,進(jìn)而對語音識別結(jié)果中每一字符都可獲取其所對應(yīng)的語音片段,當(dāng)然,也可獲取每一字符所對應(yīng)語音片段的起始位置信息和結(jié)束位置信息。需要說明的是,上述語音片段既可為語音信號中的語音片段,也可為經(jīng)過預(yù)處理后的語音數(shù)據(jù)中的至少一幀語音數(shù)據(jù),還可為特征矢量序列中的特征矢量子序列。為稱呼方便,本文后續(xù)將語音信號、經(jīng)過預(yù)處理后的語音數(shù)據(jù)以及特征矢量序列統(tǒng)稱為待識別語音信號。也即,本文下述提及的待識別語音信號具體可為用戶輸入的語音信號、經(jīng)過預(yù)處理后的語音數(shù)據(jù)或特征矢量序列。而本文下述提及的語音片段具體可為用戶輸入的語音信號中的語音片段、至少一幀語音數(shù)據(jù)或特征矢量子序列。也就是說,我們可將步驟Sll中的語音信號或者步驟S12中經(jīng)過預(yù)處理后的語音數(shù)據(jù)或者步驟S13中的特征矢量序列劃分成與語音識別結(jié)果中的字符相對應(yīng)的語音片段,從而令語音識別結(jié)果中的每個字符對應(yīng)一個確切的語音片段。舉例來講,如果語音識別結(jié)果為“我們?nèi)ヅ郎健边@一字符串,該字符串對應(yīng)的解碼路徑信息可保存為(0000000 2200000),(2200000 3600000),(3600000 4300000),(4300000 5000000), (5000000 7400000)。其中,(0000000 2200000)指示了 “我”這個字符所對應(yīng)的語音片斷的起始位置信
息和結(jié)束位置信息。其中,0000000是“我”所對應(yīng)的語音片斷在待識別語音信號中的起始位置(時刻),而2200000是“我”所對應(yīng)的語音片斷在待識別語音信號中的結(jié)束位置(時刻)。二、糾錯字符串生成過程本發(fā)明實施例支持用戶以非語音方式或語音方式輸入糾錯信息并生成糾錯字符
串O
在采用語音方式輸入糾錯信息時,所輸入的糾錯信息具體為語音信號,由于與語音識別過程一樣是以語音方式輸入,則系統(tǒng)可能無法確定當(dāng)前的語音輸入是為了繼續(xù)新文本的語音輸入,還是為了對原始文本進(jìn)行語音糾錯輸入。因此,可以設(shè)置單獨的糾錯信息輸入控制按鍵,控制從新文本的語音輸入切換至對原始文本的語音糾錯輸入。在語音方式輸入糾錯信息的模式下,由于糾錯信息為語音信號,在將其轉(zhuǎn)化成糾錯字符串時的處理過程同上述語音識別過程相同,在此不作贅述,并且,還可提供多個識別候選字符串供用戶選擇以提高生成糾錯字符串的準(zhǔn)確率。此外,本發(fā)明實施例還支持用戶以按鍵輸入(比如拼音輸入、筆劃輸入、區(qū)位碼輸入等等)、手寫輸入等非語音方式輸入糾錯信息,此時,如以按鍵輸入,所輸入的糾錯信息具體為按鍵序列,如以手寫輸入,所輸入的糾錯信息具體為書寫筆跡。現(xiàn)以拼音輸入和手寫輸入為例,對非語音方式輸入過程進(jìn)行介紹。其具體流程仍請參見圖1 :S21、判斷用戶的輸入方式,如是拼音按鍵輸入轉(zhuǎn)入步驟S22,如果是手寫輸入轉(zhuǎn)入步驟S23。S22、將用戶輸入的按鍵序列轉(zhuǎn)換成侯選糾錯字符串。其中,步驟S22具體可包括S221,跟蹤采集用戶的按鍵序列,將其對應(yīng)成字母串序列;S222,將采集到的字母串序列和預(yù)置的拼音辭典匹配以找到侯選糾錯字符串,并顯不O比如用戶在輸入qinghua后,系統(tǒng)可能顯示清華、青花、親華等多個侯選糾錯字符串供用戶選擇。S23、識別用戶輸入的書寫筆跡,將用戶輸入的書寫筆跡轉(zhuǎn)化為至少一個侯選糾錯
字符串;其中,參見圖2,步驟S23可具體包括S231,跟蹤用戶輸入的書寫筆跡,并將采集到的書寫筆跡保存在筆跡數(shù)據(jù)緩存區(qū)內(nèi);在聯(lián)機手寫識別系統(tǒng)中,用戶的書寫筆跡通常用一序列的二維(位置坐標(biāo))或三維點(位置坐標(biāo)和抬筆/落筆狀態(tài))坐標(biāo)表示,用以描述字符書寫的空間和時間信息。S232,對上述書寫筆跡進(jìn)行預(yù)處理。由于采集設(shè)備或用戶在書寫時抖動等原因,原始采集到的書寫筆跡中可能存在各種噪音干擾。為了提高系統(tǒng)的魯棒性,可對采集到的筆跡進(jìn)行預(yù)處理。具體的,可通過字符大小歸一化、野點去除、平滑,重采樣等處理方式加以組合,以盡可能減少噪音干擾帶來的識別率下降的問題。S233,對經(jīng)過預(yù)處理的書寫筆跡進(jìn)行筆跡特征提取。和語音識別相類似,在手寫識別中,也需要從原始的筆跡軌跡上提取反映字符特點的字符特征。具體的,本實施例提取手寫識別領(lǐng)域常用的八方向特征,并通過LDA等技術(shù)提高筆跡特征的區(qū)分性。S234,將提取的字符特征與預(yù)置模型進(jìn)行匹配,計算相似度。
S235、選取與上述字符特征具有最高相似度的至少一個預(yù)置模型作為侯選糾錯字符串,并顯示。考慮到拼音輸入以及手寫識別技術(shù)的準(zhǔn)確率往往很好,因而通常上述侯選糾錯字符串的個數(shù)可以選擇3到5。當(dāng)然,本領(lǐng)域技術(shù)人員可以理解的是,當(dāng)用戶的非語音輸入足夠長時,也可能只有一個侯選糾錯字符串。S25、從侯選糾錯字符串中確定糾錯字符串。步驟S25可具體包括接受用戶的選擇指定,從至少一個侯選糾錯字符串中確定唯一的糾錯字符串。S25可以單獨列出,作為對糾錯字符串的進(jìn)一步確認(rèn),以兼容語音輸入和非語音輸入方式。三,自動糾錯過程考慮到用戶輸入的糾錯字符串和語音識別結(jié)果中錯誤字符串所對應(yīng)的語音段往往具有一致性,本發(fā)明實施例自動糾錯的核心思想是將用戶單獨輸入的糾錯信息所生成的糾錯字符串映射到語音段上,再通過該語音段找到其在用戶輸入的語音信號對應(yīng)的語音識別結(jié)果中所對應(yīng)的字詞(也即錯誤字符串),從而實現(xiàn)了糾錯字符串與錯誤字符串的對應(yīng)。這樣,就實現(xiàn)了對語音識別結(jié)果中錯誤字符串的自動定位,解決了用戶人工進(jìn)行定位存在的定位不便的問題。具體來說,該方法首先在待識別語音信號中找到對應(yīng)于上述糾錯字符串的語音段。隨后在語音識別結(jié)果中定位與該語音段相對應(yīng)的字符串作為“錯誤字符串”。上述“錯誤字符串”是在步驟S14中得到的模型串中的子串,該子串在待識別語音信號中所對應(yīng)的語音段的起始時刻和結(jié)束時刻,與上述糾錯字符串在待識別語音信號中所對應(yīng)的語音段的起始時刻和結(jié)束時刻具有一致性。自動糾錯過程的流程請仍參見圖1,包括S31、根據(jù)糾錯字符串確定待識別語音信號中侯選語音段;S32、根據(jù)語音識別結(jié)果中各字符對應(yīng)的語音片段,確定上述侯選語音段在第一最優(yōu)解碼路徑的語音識別結(jié)果中所對應(yīng)的字符串作為侯選字符串,從侯選字符串中確定出錯誤字符串;S33、利用糾錯字符串替換上述錯誤字符串。在本發(fā)明其他實施例,步驟S33可包括如下步驟在錯誤字符串的數(shù)目丨等于I時,直接利用糾錯字符串替換該錯誤字符串;在錯誤字符串的數(shù)目丨大于I時,利用糾錯字符串替換用戶指定的錯誤字符串。本發(fā)明一些實施例可接受用戶主動參與選擇,因此,上述“利用糾錯字符串替換用戶指定的錯誤字符串”的具體流程可包括a,在語音識別結(jié)果中突出顯示所有錯誤字符串。在本發(fā)明其他實施例中,除突出顯示所有錯誤字符串外,還可以設(shè)置除錯誤字符串外的其它識別結(jié)果為非活躍狀態(tài),以提高定位精確度;b,接受用戶的選擇指定,利用上述糾錯字符串更新用戶所選定的錯誤字符串。此外,在本發(fā)明其他實施例中,還可支持用戶的模糊選擇指定一即并不要求用戶精準(zhǔn)定位錯誤字符串,而是通過近鄰方式進(jìn)行定位當(dāng)手寫筆的落筆點落入錯誤字符串近鄰區(qū)域時,自動將其定位到對應(yīng)的錯誤字符串上。具體來說,計算落筆點距每個錯誤字符串所覆蓋的最小區(qū)域的最短距離,選擇具有最小“最短距離”的錯誤字符串作為用戶選定的錯誤字符串。例如,參見圖3,可設(shè)定一個字符(我)所覆蓋的最小區(qū)域的高度H為該字符字高h(yuǎn)的A倍,而一個字符所覆蓋的最小區(qū)域的寬度W為該字符字寬w的B倍,A和B可為大于等于I的任意正數(shù)。那么,錯誤字符串所覆蓋的最小區(qū)域則為組成該錯誤字符串中所有字符所覆蓋的最小區(qū)域的總和。參見圖4,在本發(fā)明其他實施例中,上述步驟S31可具體包括如下步驟S311,根據(jù)上述糾錯字符串生成糾錯字符串檢索網(wǎng)絡(luò)。請參見圖5,上述糾錯字符串檢索網(wǎng)絡(luò)包括糾錯字符串模型以及預(yù)置的吸收模型。其中,糾錯字符串模型由糾錯字符串生成通過預(yù)置的詞典將糾錯字符串?dāng)U展為相應(yīng)的模型序列得到對應(yīng)的糾錯字符串模型。由于用戶每次輸入的糾錯信息并生成的糾錯字符串都不盡相同,因此,糾錯字符串網(wǎng)絡(luò)中的糾錯字符串模型需要實時更新。因此,上述步驟S31又可具體包括獲取糾錯字符串對應(yīng)的糾錯字符串模型;獲取預(yù)置的吸收模型;根據(jù)獲取的糾錯字符串模型以及吸收模型生成糾錯字符串檢索網(wǎng)絡(luò)。需要說明的是,如果語音識別結(jié)果中存在不相鄰且不相干的多處識別錯誤,比如語音識別結(jié)果中存在“清華”和“西站”兩處識別錯誤,則需要多次通過語音或非語音方式輸入糾錯信息生成糾錯字符串。而對每次輸入的糾錯字符串,不管其包含多少字詞,都將其看作一個獨立的糾錯字符串。比如,用戶在某次輸入糾錯字符串時,共輸入了 3個漢字,則糾錯字符串包括3個漢字,隨后通過字典將包括該3個漢字的糾錯字符串?dāng)U展成對應(yīng)的糾錯字符串模型。在將糾錯字符串?dāng)U展成糾錯字符串模型時,根據(jù)預(yù)置的聲學(xué)模型的不同可采用不同的擴展方式。比如,可基于音節(jié)模型單元的聲學(xué)模型(如基于音節(jié)模型單元的聲學(xué)模型,單個漢字由I個音節(jié)構(gòu)成),也可基于音素模型單元的聲學(xué)模型(如基于音素模型單元的聲學(xué)模型,單個漢字由2個音素構(gòu)成),具體由在進(jìn)行語音識別時所采用的模型單元所決定。因此,如對上述包括3個漢字的糾錯字符串進(jìn)行擴展,可擴展得到由3個音節(jié)模型單元相串聯(lián)的糾錯字符串模型或者由6個音素模型單元相串聯(lián)的糾錯字符串模型。至于吸收模型則是由系統(tǒng)預(yù)先在海量語音數(shù)據(jù)訓(xùn)練得到的背景模型,也可采用多個吸收模型以提高復(fù)雜語音匹配的準(zhǔn)確性。需要注意的是,多個單獨吸收模型是并聯(lián)的。S312,在糾錯字符串檢索網(wǎng)絡(luò)中對待識別語音信號重新解碼獲取第二最優(yōu)解碼路徑。其中,第二最優(yōu)解碼路徑包括糾錯字符串模型對應(yīng)的語音段,糾錯字符串模型對應(yīng)的語音段即為侯選語音段。具體的,上述糾錯字符串模型所對應(yīng)的語音段可為用戶輸入的語音信號中的語音段,也可為經(jīng)過預(yù)處理后的語音數(shù)據(jù)中的語音段,還可為特征矢量序列中的特征矢量子序列。為簡單化起見,可選用糾錯字符串模型所對應(yīng)的特征矢量子序列作為侯選語音段。則步驟S312可具體包括
在糾錯字符串檢索網(wǎng)絡(luò)中搜索相應(yīng)于特征矢量序列的最優(yōu)路徑(即第二最優(yōu)路徑),得到上述糾錯字符串模型所對應(yīng)的特征矢量子序列在整個特征矢量序列中的起始位置和結(jié)束位置。步驟S312中的解碼,與上述步驟S14相類似,二者的不同在于,步驟S312所利用的網(wǎng)絡(luò)是根據(jù)糾錯字符串生成的糾錯字符串檢索網(wǎng)絡(luò),而步驟S14所利用的檢索網(wǎng)絡(luò)的范圍要大于上述糾錯字符串檢索網(wǎng)絡(luò)。因此,步驟S312的解碼,仍可采用業(yè)內(nèi)主流的基于動態(tài)規(guī)劃思想的Viterbi搜索算法,對每幀特征矢量遍歷糾錯字符串檢索網(wǎng)絡(luò)中滿足預(yù)設(shè)條件的活躍節(jié)點并保留滿足預(yù)設(shè)條件的歷史路徑作為后續(xù)搜索網(wǎng)絡(luò)的活躍節(jié)點,最后通過對具有最大歷史路徑概率的路徑(即第二最優(yōu)解碼路徑)獲得糾錯字符串模型對應(yīng)的語音段,從而確定了侯選語音段。考慮到,糾錯字符串模型可能對應(yīng)多個語音段,而由于種種原因,實際上,這多個語音段中可能有一些并未發(fā)生識別錯誤,因此,需要對這多個語音段對應(yīng)的字符串進(jìn)行甄 選,也即,需要對上述侯選字符串進(jìn)行甄選。基于此,參見圖6,步驟S32可具體包括S321、將糾錯字符串模型M對應(yīng)的侯選語音段的集合,記為(X11X2,...,xi;...,χκ}或{XJ,并分別統(tǒng)計各侯選語音段在糾錯字符串模型M上的似然度,記為P(XiIM)。其中(i=l, 2,......k), k表示侯選語音段的總數(shù)量。所述糾錯字符串模型M可以通過拼接系統(tǒng)預(yù)設(shè)的基本語音單元,如音節(jié)單元得到,在獲取了侯選語音段Xi后,直接就可以計算Xi相應(yīng)于糾錯字符串模型的似然度。S322、根據(jù)語音識別結(jié)果中各字符對應(yīng)的語音片段,確定上述侯選語音段在第一最優(yōu)解碼路徑的語音識別結(jié)果中所對應(yīng)的字符串作為侯選字符串。將侯選語音段對應(yīng)的侯選字符串的集合,記為{H” H2,…,Hi, · · ·,Ηκ}或{HJ,則可知,Xi與Hi對應(yīng)。由于在步驟S312中,已經(jīng)獲取了侯選語音段的起始位置(時刻)和結(jié)束位置(時刻),因此,可根據(jù)語音識別結(jié)果中各字符對應(yīng)的語音片段,確定侯選語音段的起始位置在語音識別結(jié)果中所對應(yīng)的起始字符。同理,可確定侯選語音段的結(jié)束位置在語音識別結(jié)果中所對應(yīng)的結(jié)束字符,在確定了起始字符和結(jié)束字符后,就可確定出侯選語音段在語音識別結(jié)果中所對應(yīng)的字符串了。更具體的,可通過如下方式來確定起始字符將起始位置對應(yīng)的字符作為第一字符,并將該第一字符所對應(yīng)的語音片斷作為第一語音片斷;若上述起始位置位于第一語音片斷的前部,則將該第一字符作為起始字符,否則選擇語音識別結(jié)果中的下一字符作為起始字符。而在確定結(jié)束字符時,可通過如下方式將結(jié)束位置對應(yīng)的字符作為第二字符,將第二字符所對應(yīng)的語音片斷作為第二語首片斷;若結(jié)束位置位于第二語音片斷的前部時,選擇語音識別結(jié)果中的上一字符作為結(jié)束字符,否則,將第二字符作為結(jié)束字符。仍以前述的“我們?nèi)ヅ郎健边@一語音識別結(jié)果為例,前已述及,該語音識別結(jié)果中各個字符所對應(yīng)的語音片段的起始位置和結(jié)束位置分別為(0000000 2200000),(2200000 3600000),(3600000 4300000), (4300000 5000000), (5000000 7400000)。假設(shè),侯選語音段Xi的起始和終點位置為(0000050 3600000),由于起始位置0000050在(0000000 2200000)的前部,可確定“我”作為起始字符,而結(jié)束位置3600000在(2200000 3600000)的后部,可確定“們”為結(jié)束字符,由此可確定,Xi與“我們”這個字符串相對應(yīng)。因此,將“我們”作為與侯選語音段Xi對應(yīng)的侯選字符串氏。S323、根據(jù)各個侯選語音段的似然度計算各侯選字符串的糾錯置信度,分別記為ICM1, CM2,…,CMi, ...,CMJ或{CMJ,并根據(jù)糾錯置信度確定出錯誤字符串。更具體的,參見圖7,步驟S323包括S3231,初始化,設(shè)置當(dāng)前統(tǒng)計錯誤字符串總數(shù)是=0;(也可不設(shè)置步驟S3231)S3232,按照似然度從大到小的順序依次將侯選字符串設(shè)為當(dāng)前考察對象;換句話說,在多個尚未考察的侯選語音段中選擇具有最大似然度的侯選語音段所對應(yīng)的字符串作為當(dāng)前考察對象。S3233,判斷糾錯字符串和當(dāng)前考察對象是否相同,若相同則轉(zhuǎn)入S3238,否則轉(zhuǎn)入
53234;S3234,判斷當(dāng)前考察對象是否為第一個侯選字符串,若是轉(zhuǎn)入S3239,否則轉(zhuǎn)入
53235;S3235,計算當(dāng)前考察對象的糾錯置信度;S3236,判斷是否滿足預(yù)設(shè)條件,若是轉(zhuǎn)入S3232,否則轉(zhuǎn)入S3237 ;上述預(yù)設(shè)條件包括存在尚未考察的侯選字符串,并且已考察的侯選字符串總數(shù)不 大于預(yù)設(shè)的最大候選總數(shù);S3237,將所有糾錯置信度等于第二預(yù)設(shè)值的侯選字符串作為錯誤字符串,并將錯誤字符串的數(shù)量賦值給丨。S3238,將糾錯置信度設(shè)為第一預(yù)設(shè)值轉(zhuǎn)步驟S3236 ;S3239,將糾錯置信度設(shè)為第二預(yù)設(shè)值轉(zhuǎn)步驟S3236。在本發(fā)明其他實施例中,參見圖8,步驟S3235還可包括如下步驟A,判斷當(dāng)前考察對象所對應(yīng)侯選語音段的似然度是否大于第一預(yù)設(shè)閾值T,若是(則說明當(dāng)前考察對象和糾錯字符串的匹配程度較高),轉(zhuǎn)入步驟B,否則轉(zhuǎn)入步驟E ;需要說明的是,T由系統(tǒng)在開發(fā)集上得到,在取log域的似然度計算時,T往往被設(shè)置成是一個負(fù)數(shù),如-50。B,計算當(dāng)前考察對象所對應(yīng)侯選語音段的似然度與語音段集合中似然度最大值之間的差值A(chǔ) S ;C,判斷是否滿足Λ S〉A(chǔ)T,如果是,轉(zhuǎn)步驟D,否則轉(zhuǎn)步驟E ;其中Λ T是第二預(yù)設(shè)閾值。△ T用于衡量可能的候選和不可能的候選的差異;同樣在取log域的似然度計算時,Λ T也可設(shè)置為一個負(fù)值,如-200等。D,設(shè)置當(dāng)前考察對象的糾錯置信度為第二預(yù)設(shè)值,比如可將第二預(yù)設(shè)值設(shè)定為
丄 ,Ε,設(shè)置當(dāng)前考察對象的糾錯置信度為第一預(yù)設(shè)值,比如可將第一預(yù)設(shè)值設(shè)定為O。
與上述方法相對應(yīng),本發(fā)明實施例還提供語音識別系統(tǒng)。圖9示出了上述系統(tǒng)的一種結(jié)構(gòu),包括語音識別單元1,用于對用戶輸入的語音信號進(jìn)行語音識別,獲得第一最優(yōu)解碼路徑,其中,第一最優(yōu)解碼路徑包括語音識別結(jié)果以及所述語音識別結(jié)果中各字符對應(yīng)的語音片段;更具體的,語音識別單元可包括處理器,由處理器對用戶輸入的語音信號進(jìn)行語音識別。糾錯字符串生成單元2,用于接收用戶單獨輸入的糾錯信息并生成相應(yīng)的糾錯字符串;更具體的,如以語音方式輸入糾錯信息,則糾錯字符串生成單元仍可包括上述處理器,由處理器對糾錯信息進(jìn)行語音識別生成糾錯字符串;如以按鍵輸入方式輸入糾錯信息,則糾錯字符串生成單元至少可包括鍵盤和處理器,由處理器對將用戶輸入的按鍵序列轉(zhuǎn)換成侯選糾錯字符串,并接受用戶的選擇指定,從至少一個侯選糾錯字符串中確定唯一的糾錯字符串。當(dāng)然也可由另一獨立的芯片或處理器來將用戶輸入的按鍵序列轉(zhuǎn)換成侯選糾錯字符串,并接受用戶的選擇指定,從至少一個侯選糾錯字符串中確定唯一的糾錯字符串。如以手寫輸入方式輸入糾錯信息,則糾錯字符串生成單元至少可包括手寫筆、觸摸屏和處理器,由處理器對將用戶輸入的書寫筆跡轉(zhuǎn)換成侯選糾錯字符串,并接受用戶的選擇指定,從至少一個侯選糾錯字符串中確定唯一的糾錯字符串。當(dāng)然也可由另一獨立的芯片或處理器來將用戶輸入的書寫筆跡轉(zhuǎn)換成侯選糾錯字符串,并接受用戶的選擇指定,從至少一個侯選糾錯字符串中確定唯一的糾錯字符串。當(dāng)然,為了保證用戶可采用多種方式輸入糾錯信息,糾錯字符串生成單元也可同時包括上述多種器件。自動糾錯單元3,用于獲取糾錯字符串在用戶輸入的語音信號(或待識別語音信號)中的侯選語音段;統(tǒng)計侯選語音段在糾錯字符串模型上的似然度;根據(jù)語音識別結(jié)果中各字符對應(yīng)的語音片段,確定上述侯選語音段在第一最優(yōu)解碼路徑的語音識別結(jié)果中所對應(yīng)的字符串作為侯選字符串;根據(jù)侯選語音段對應(yīng)的似然度計算與之對應(yīng)的侯選字符串的糾錯置信度,并根據(jù)糾錯置信度確定出錯誤字符串;利用糾錯字符串替換錯誤字符串。更具體的,自動糾錯單元3的功能也可通過上述處理器或其他獨立的芯片或處理器實現(xiàn)。上述各單元的更詳盡的功能可參見前述方法記載,在此不作贅述。本領(lǐng)域普通技術(shù)人員可以意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、計算機軟件或者二者的結(jié)合來實現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。
在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個單元上。可以根據(jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括U盤、移動硬盤、只讀存儲器(ROM,Read-OnlyMemory)、隨機存取存儲器(RAM, Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。對所公開的實施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對這些實施例的多種修改對本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的范圍。
權(quán)利要求
1.一種語音識別方法,其特征在于,包括對用戶輸入的語音信號進(jìn)行語音識別,獲得第一最優(yōu)解碼路徑,所述第一最優(yōu)解碼路徑包括語音識別結(jié)果以及所述語音識別結(jié)果中各字符對應(yīng)的語音片段;接收用戶單獨輸入的糾錯信息并生成相應(yīng)的糾錯字符串,所述糾錯信息通過非語音方式或語音方式輸入;獲取所述糾錯字符串在所述用戶輸入的語音信號中對應(yīng)的至少一個語音段作為侯選語音段,并分別統(tǒng)計各侯選語音段在所述糾錯字符串模型上的似然度;根據(jù)所述語音識別結(jié)果中各字符對應(yīng)的語音片段,分別確定上述各侯選語音段在第一最優(yōu)解碼路徑的語音識別結(jié)果中所對應(yīng)的字符串作為侯選字符串;根據(jù)所述侯選語音段的似然度計算與之對應(yīng)的侯選字符串的糾錯置信度,并根據(jù)糾錯置信度確定出錯誤字符串;利用所述糾錯字符串替換所述錯誤字符串。
2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述侯選語音段對應(yīng)的似然度計算與之對應(yīng)的侯選字符串的糾錯置信度包括在滿足預(yù)設(shè)條件時,按照侯選字符串所對應(yīng)侯選語音段的似然度從大到小的順序,依次將侯選字符串設(shè)為當(dāng)前考察對象;在所述糾錯字符串和當(dāng)前考察對象相同時,將所述當(dāng)前考察對象的糾錯置信度設(shè)為第一預(yù)設(shè)值;在所述糾錯字符串和當(dāng)前考察對象不相同,并且,當(dāng)前考察對象為第一個侯選字符串時,將所述當(dāng)前考察對象的糾錯置信度設(shè)為第二預(yù)設(shè)值;在所述糾錯字符串和當(dāng)前考察對象不相同,并且,當(dāng)前考察對象不為第一個侯選字符串時,按照預(yù)設(shè)算法計算所述當(dāng)前考察對象對應(yīng)的糾錯置信度。
3.如權(quán)利要求2所述的方法,其特征在于,所述預(yù)設(shè)條件包括存在尚未考察的侯選字符串,并且已考察的侯選字符串總數(shù)不大于預(yù)設(shè)的最大候選總數(shù)。
4.如權(quán)利要求3所述的方法,其特征在于,所述按照預(yù)設(shè)算法計算所述當(dāng)前考察對象對應(yīng)的糾錯置信度具體包括當(dāng)所述當(dāng)前考察對象所對應(yīng)語音段的似然度不大于第一預(yù)設(shè)閾值T時,將所述當(dāng)前考察對象的糾錯置信度設(shè)為所述第一預(yù)設(shè)值;當(dāng)所述當(dāng)前考察對象所對應(yīng)語音段的似然度大于所述T并且差值△S大于第二預(yù)設(shè)閾值時,將所述當(dāng)前考察對象的糾錯置信度設(shè)為所述第二預(yù)設(shè)值;當(dāng)所述當(dāng)前考察對象所對應(yīng)語音段的似然度大于所述T并且差值△S小于第二預(yù)設(shè)閾值時,將所述當(dāng)前考察對象的糾錯置信度設(shè)為所述第一預(yù)設(shè)值;所述差值A(chǔ)S為當(dāng)前考察對象所對應(yīng)語音段的似然度與最大似然度之間的差值,所述最大似然度為所有侯選語音段所對應(yīng)的似然度中的最大值。
5.如權(quán)利要求6所述的方法,其特征在于,所述根據(jù)糾錯置信度確定出錯誤字符串具體包括將所有糾錯置信度等于所述第二預(yù)設(shè)值的侯選字符串作為錯誤字符串。
6.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述糾錯字符串確定所述用戶輸入的語音信號中侯選語音段,包括根據(jù)所述糾錯字符串生成糾錯字符串檢索網(wǎng)絡(luò),所述糾錯字符串檢索網(wǎng)絡(luò)包括所述糾錯字符串對應(yīng)的糾錯字符串模型以及預(yù)置的吸收模型;在所述糾錯字符串檢索網(wǎng)絡(luò)內(nèi)搜索相應(yīng)于所述用戶輸入的語音信號的第二最優(yōu)解碼路徑,所述第二最優(yōu)解碼路徑包括所述糾錯字符串模型對應(yīng)的語音段作為所述侯選語音段;確定所述侯選語音段在所述用戶輸入的語音信號中對應(yīng)的起始位置和結(jié)束位置。
7.如權(quán)利要求6所述的方法,其特征在于,所述根據(jù)所述糾錯字符串生成糾錯字符串檢索網(wǎng)絡(luò),包括獲取所述糾錯字符串對應(yīng)的糾錯字符串模型;獲取預(yù)置的吸收模型;根據(jù)獲取的糾錯字符串模型以及吸收模型生成所述糾錯字符串檢索網(wǎng)絡(luò)。
8.如權(quán)利要求1至7任一項所述的方法,其特征在于,所述利用所述糾錯字符串替換所述錯誤字符串具體包括在所述錯誤字符串的數(shù)目等于I時,直接利用所述糾錯字符串替換所述錯誤字符串;在所述錯誤字符串的數(shù)目大于I時,利用所述糾錯字符串替換用戶指定的錯誤字符串O
9.如權(quán)利要求8所述的方法,其特征在于,所述利用所述糾錯字符串替換用戶指定的錯誤字符串具體包括在所述語音識別結(jié)果中突出顯示所有錯誤字符串;接受用戶選擇,利用所述糾錯字符串更新用戶選定的錯誤字符串。
10.一種語音識別系統(tǒng),其特征在于,包括語音識別單元,用于對用戶輸入的語音信號進(jìn)行語音識別,獲得第一最優(yōu)解碼路徑, 所述第一最優(yōu)解碼路徑包括語音識別結(jié)果以及所述語音識別結(jié)果中各字符對應(yīng)的語音片段;糾錯字符串生成單元,用于接收用戶單獨輸入的糾錯信息并生成相應(yīng)的糾錯字符串, 所述糾錯信息通過非語音方式或語音方式輸入;自動糾錯單元,用于根據(jù)所述糾錯字符串確定所述用戶輸入的語音信號中侯選語音段;統(tǒng)計所述侯選語音段在所述糾錯字符串模型上的似然度;根據(jù)所述語音識別結(jié)果中各字符對應(yīng)的語音片段,確定上述侯選語音段在第一最優(yōu)解碼路徑的語音識別結(jié)果中所對應(yīng)的字符串作為侯選字符串;根據(jù)所述侯選語音段對應(yīng)的似然度計算與之對應(yīng)的侯選字符串的糾錯置信度,并根據(jù)糾錯置信度確定出錯誤字符串;利用所述糾錯字符串替換所述錯誤字符串。
全文摘要
本發(fā)明實施例公開了語音識別方法和系統(tǒng),以解決上述用戶人工進(jìn)行定位存在的定位不便的問題。該語音識別方法包括對用戶輸入的語音信號進(jìn)行語音識別,獲得語音識別結(jié)果以及語音識別結(jié)果中各字符對應(yīng)的語音片段;接收用戶單獨輸入的糾錯信息并生成相應(yīng)的糾錯字符串;獲取糾錯字符串對應(yīng)的至少一個語音段作為侯選語音段,并分別統(tǒng)計各侯選語音段在糾錯字符串模型上的似然度;根據(jù)語音識別結(jié)果中各字符對應(yīng)的語音片段,分別確定上述各侯選語音段在第一最優(yōu)解碼路徑的語音識別結(jié)果中所對應(yīng)的字符串作為侯選字符串;根據(jù)侯選語音段的似然度計算與之對應(yīng)的侯選字符串的糾錯置信度,并根據(jù)糾錯置信度確定出錯誤字符串;利用糾錯字符串替換錯誤字符串。
文檔編號G10L15/26GK103000176SQ20121058543
公開日2013年3月27日 申請日期2012年12月28日 優(yōu)先權(quán)日2012年12月28日
發(fā)明者何婷婷, 胡郁, 胡國平, 劉慶峰 申請人:安徽科大訊飛信息科技股份有限公司