
【
技術(shù)領(lǐng)域:
】本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù),特別涉及基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)方法、裝置及存儲(chǔ)介質(zhì)。
背景技術(shù):
:人工智能(artificialintelligence),英文縮寫為ai。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理和專家系統(tǒng)等。隨著語(yǔ)音及自然語(yǔ)言處理相關(guān)技術(shù)的發(fā)展,越來越多的應(yīng)用場(chǎng)景提供語(yǔ)音方式同用戶進(jìn)行交互。但是,在用戶輸入語(yǔ)音query后,對(duì)用戶的語(yǔ)音query進(jìn)行識(shí)別時(shí),得到的語(yǔ)音識(shí)別結(jié)果中很可能會(huì)出現(xiàn)錯(cuò)誤。比如,對(duì)于長(zhǎng)度較大的語(yǔ)音query,語(yǔ)音識(shí)別結(jié)果中很容易出現(xiàn)錯(cuò)誤片段,當(dāng)語(yǔ)音query中涉及實(shí)體名稱時(shí),對(duì)實(shí)體名稱的識(shí)別會(huì)很容易出現(xiàn)錯(cuò)誤,又或者,用戶在輸入時(shí)帶有口音、口誤或比較特殊的表述習(xí)慣等,均可能造成識(shí)別錯(cuò)誤。現(xiàn)有技術(shù)中,針對(duì)用戶輸入的語(yǔ)音query的語(yǔ)音識(shí)別結(jié)果,可利用背景知識(shí)及統(tǒng)計(jì)方法等進(jìn)行計(jì)算,從而找出可能錯(cuò)誤的地方并進(jìn)行替換,但這種糾錯(cuò)方式的糾錯(cuò)效果很差,且很多場(chǎng)景下均無法識(shí)別出錯(cuò)誤。比如,用戶通過語(yǔ)音query輸入搜索對(duì)象“陳育娟”,語(yǔ)音識(shí)別結(jié)果出現(xiàn)錯(cuò)誤,將“陳育娟”識(shí)別為“陳玉娟”,那么利用現(xiàn)有的糾錯(cuò)方式則無法對(duì)這種錯(cuò)誤進(jìn)行糾正,只能通過用戶的手動(dòng)輸入進(jìn)行修改,從而為用戶帶來了很大的不便,尤其是在一些體積較小的穿戴、車載等設(shè)備使用中,文字輸入非常不便,從而增大了糾錯(cuò)難度。可見,采用現(xiàn)有的糾錯(cuò)方式,會(huì)導(dǎo)致糾錯(cuò)結(jié)果的準(zhǔn)確性較低,并增大了糾錯(cuò)難度。技術(shù)實(shí)現(xiàn)要素:有鑒于此,本發(fā)明提供了基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)方法、裝置及存儲(chǔ)介質(zhì),能夠提高糾錯(cuò)結(jié)果的準(zhǔn)確性并降低糾錯(cuò)難度。具體技術(shù)方案如下:一種基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)方法包括:獲取用戶輸入的第二語(yǔ)音query的第二語(yǔ)音識(shí)別結(jié)果;根據(jù)所述第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別;若確定用戶具有糾錯(cuò)意圖,則從所述第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息;根據(jù)所述糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),所述第一語(yǔ)音識(shí)別結(jié)果為在所述第二語(yǔ)音query之前輸入的第一語(yǔ)音query的語(yǔ)音識(shí)別結(jié)果。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述根據(jù)所述第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別包括:確定所述第二語(yǔ)音識(shí)別結(jié)果是否與預(yù)先設(shè)定的m個(gè)糾錯(cuò)意圖模板中的至少一個(gè)相匹配,m為正整數(shù);若是,則確定用戶具有糾錯(cuò)意圖;若否,則利用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)所述第二語(yǔ)音識(shí)別結(jié)果進(jìn)行意圖分類,分類結(jié)果包括具有糾錯(cuò)意圖以及不具有糾錯(cuò)意圖。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述從所述第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息包括:若利用所述糾錯(cuò)意圖模板確定出用戶具有糾錯(cuò)意圖,則通過所述糾錯(cuò)意圖模板的槽位信息確定出所述糾錯(cuò)信息;若利用所述深度神經(jīng)網(wǎng)絡(luò)模型確定出用戶具有糾錯(cuò)意圖,則通過序列標(biāo)注模型,分別對(duì)所述第二語(yǔ)音識(shí)別結(jié)果中的每個(gè)字進(jìn)行標(biāo)注,利用標(biāo)注為屬于糾錯(cuò)信息的字組成所述糾錯(cuò)信息。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,當(dāng)糾錯(cuò)資源的種類為拆字資源時(shí),該方法進(jìn)一步包括:針對(duì)每個(gè)糾錯(cuò)資源,分別將所述糾錯(cuò)資源中的每個(gè)字轉(zhuǎn)為對(duì)應(yīng)的拼音,并根據(jù)所述糾錯(cuò)資源中的各個(gè)字及拼音,生成所述糾錯(cuò)資源的key;建立key與對(duì)應(yīng)的糾錯(cuò)資源之間的倒排索引;所述根據(jù)所述糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選包括:將所述糾錯(cuò)信息中的每個(gè)字分別轉(zhuǎn)為對(duì)應(yīng)的拼音;確定所述糾錯(cuò)信息中的各個(gè)字是否組成一個(gè)key,如果是,則將所述key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源;確定所述糾錯(cuò)信息中的各個(gè)字對(duì)應(yīng)的拼音是否組成一個(gè)key,如果是,則將所述key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述生成所述糾錯(cuò)資源的key包括:針對(duì)所述糾錯(cuò)資源中的各個(gè)字,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,并針對(duì)所述糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,i為正整數(shù),且2≤i≤n,n為所述糾錯(cuò)資源中包括的字?jǐn)?shù);針對(duì)所述糾錯(cuò)資源中的各個(gè)字,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,并針對(duì)所述糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,j為正整數(shù),且2≤j≤n-1。將所述連續(xù)kgram集合以及所述跳躍kgram集合中的元素分別作為所述糾錯(cuò)資源的key。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)包括:針對(duì)篩選出的每個(gè)糾錯(cuò)資源,分別計(jì)算所述糾錯(cuò)資源中的各個(gè)字的拼音所組成的字符串與所述糾錯(cuò)信息中的各個(gè)字的拼音所組成的字符串之間的帶權(quán)編輯距離;將計(jì)算出的帶權(quán)編輯距離最小的糾錯(cuò)資源作為所述最為匹配的糾錯(cuò)資源,利用所述最為匹配的糾錯(cuò)資源對(duì)所述第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述計(jì)算帶權(quán)編輯距離包括:在計(jì)算編輯距離時(shí),對(duì)于增加和刪除兩種操作,編輯距離均為1,對(duì)于替換操作,計(jì)算兩個(gè)音節(jié)之間的發(fā)音距離,發(fā)音距離越近,產(chǎn)生的編輯距離增加量越小。一種基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)裝置,包括:糾錯(cuò)意圖識(shí)別單元、糾錯(cuò)信息提取單元以及糾錯(cuò)資源匹配單元;所述糾錯(cuò)意圖識(shí)別單元,用于獲取用戶輸入的第二語(yǔ)音query的第二語(yǔ)音識(shí)別結(jié)果,并根據(jù)所述第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別;所述糾錯(cuò)信息提取單元,用于當(dāng)所述糾錯(cuò)意圖識(shí)別單元識(shí)別出用戶具有糾錯(cuò)意圖時(shí),從所述第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息;所述糾錯(cuò)資源匹配單元,用于根據(jù)所述糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),所述第一語(yǔ)音識(shí)別結(jié)果為在所述第二語(yǔ)音query之前輸入的第一語(yǔ)音query的語(yǔ)音識(shí)別結(jié)果。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述糾錯(cuò)意圖識(shí)別單元確定所述第二語(yǔ)音識(shí)別結(jié)果是否與預(yù)先設(shè)定的m個(gè)糾錯(cuò)意圖模板中的至少一個(gè)相匹配,m為正整數(shù);若是,則確定用戶具有糾錯(cuò)意圖;若否,則利用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)所述第二語(yǔ)音識(shí)別結(jié)果進(jìn)行意圖分類,分類結(jié)果包括具有糾錯(cuò)意圖以及不具有糾錯(cuò)意圖。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,若所述糾錯(cuò)意圖識(shí)別單元利用所述糾錯(cuò)意圖模板確定出用戶具有糾錯(cuò)意圖,則所述糾錯(cuò)信息提取單元通過所述糾錯(cuò)意圖模板的槽位信息確定出所述糾錯(cuò)信息;若所述糾錯(cuò)意圖識(shí)別單元利用所述深度神經(jīng)網(wǎng)絡(luò)模型確定出用戶具有糾錯(cuò)意圖,則所述糾錯(cuò)信息提取單元通過序列標(biāo)注模型,分別對(duì)所述第二語(yǔ)音識(shí)別結(jié)果中的每個(gè)字進(jìn)行標(biāo)注,利用標(biāo)注為屬于糾錯(cuò)信息的字組成所述糾錯(cuò)信息。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述裝置中進(jìn)一步包括:預(yù)處理單元;所述預(yù)處理單元,用于當(dāng)糾錯(cuò)資源的種類為拆字資源時(shí),針對(duì)每個(gè)糾錯(cuò)資源,分別將所述糾錯(cuò)資源中的每個(gè)字轉(zhuǎn)為對(duì)應(yīng)的拼音,并根據(jù)所述糾錯(cuò)資源中的各個(gè)字及拼音,生成所述糾錯(cuò)資源的key;建立key與對(duì)應(yīng)的糾錯(cuò)資源之間的倒排索引;所述糾錯(cuò)資源匹配單元將所述糾錯(cuò)信息中的每個(gè)字分別轉(zhuǎn)為對(duì)應(yīng)的拼音;確定所述糾錯(cuò)信息中的各個(gè)字是否組成一個(gè)key,如果是,則將所述key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源;確定所述糾錯(cuò)信息中的各個(gè)字對(duì)應(yīng)的拼音是否組成一個(gè)key,如果是,則將所述key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述預(yù)處理單元針對(duì)所述糾錯(cuò)資源中的各個(gè)字,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,并針對(duì)所述糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,i為正整數(shù),且2≤i≤n,n為所述糾錯(cuò)資源中包括的字?jǐn)?shù);針對(duì)所述糾錯(cuò)資源中的各個(gè)字,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,并針對(duì)所述糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,j為正整數(shù),且2≤j≤n-1。將所述連續(xù)kgram集合以及所述跳躍kgram集合中的元素分別作為所述糾錯(cuò)資源的key。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述糾錯(cuò)資源匹配單元針對(duì)篩選出的每個(gè)糾錯(cuò)資源,分別計(jì)算所述糾錯(cuò)資源中的各個(gè)字的拼音所組成的字符串與所述糾錯(cuò)信息中的各個(gè)字的拼音所組成的字符串之間的帶權(quán)編輯距離;將計(jì)算出的帶權(quán)編輯距離最小的糾錯(cuò)資源作為所述最為匹配的糾錯(cuò)資源,利用所述最為匹配的糾錯(cuò)資源對(duì)所述第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述糾錯(cuò)資源匹配單元在計(jì)算編輯距離時(shí),對(duì)于增加和刪除兩種操作,編輯距離均為1,對(duì)于替換操作,計(jì)算兩個(gè)音節(jié)之間的發(fā)音距離,發(fā)音距離越近,產(chǎn)生的編輯距離增加量越小。一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如以上所述的方法。一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如以上所述的方法。基于上述介紹可以看出,采用本發(fā)明所述方案,獲取用戶輸入的第二語(yǔ)音識(shí)別結(jié)果,并根據(jù)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別,如果確定用戶具有糾錯(cuò)意圖,則可從第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息,并根據(jù)糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,從而利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),對(duì)于用戶來說,可以像人與人之間對(duì)話時(shí)一樣,描述錯(cuò)誤或強(qiáng)調(diào)正解,相應(yīng)地,可根據(jù)用戶的描述對(duì)語(yǔ)音識(shí)別結(jié)果進(jìn)行修正,從而實(shí)現(xiàn)了對(duì)于語(yǔ)音識(shí)別結(jié)果的準(zhǔn)確糾錯(cuò),即提高了糾錯(cuò)結(jié)果的準(zhǔn)確性,并且,用戶只需要通過語(yǔ)音的方式發(fā)出糾錯(cuò)指令即可,無需進(jìn)行手動(dòng)輸入操作,從而對(duì)于用戶來說降低了糾錯(cuò)難度。【附圖說明】圖1為本發(fā)明所述基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)方法實(shí)施例的流程圖。圖2為本發(fā)明所述第一語(yǔ)音識(shí)別結(jié)果“陳玉娟”的輸入界面示意圖。圖3為本發(fā)明所述第一語(yǔ)音識(shí)別結(jié)果“陳玉娟”對(duì)應(yīng)的搜索結(jié)果的界面示意圖。圖4為本發(fā)明所述第二語(yǔ)音識(shí)別結(jié)果“下面是一個(gè)月的育”的輸入界面示意圖。圖5為本發(fā)明所述糾錯(cuò)后的第一語(yǔ)音識(shí)別結(jié)果“陳育娟”對(duì)應(yīng)的搜索結(jié)果的界面示意圖。圖6為本發(fā)明所述深度神經(jīng)網(wǎng)絡(luò)模型的框架示意圖。圖7為本發(fā)明所述序列標(biāo)注模型的框架示意圖。圖8為本發(fā)明所述基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)裝置實(shí)施例的組成結(jié)構(gòu)示意圖。圖9示出了適于用來實(shí)現(xiàn)本發(fā)明實(shí)施方式的示例性計(jì)算機(jī)系統(tǒng)/服務(wù)器12的框圖。【具體實(shí)施方式】為了使本發(fā)明的技術(shù)方案更加清楚、明白,以下參照附圖并舉實(shí)施例,對(duì)本發(fā)明所述方案進(jìn)行進(jìn)一步說明。顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。圖1為本發(fā)明所述基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)方法實(shí)施例的流程圖,如圖1所示,包括以下具體實(shí)現(xiàn)方式。在101中,獲取用戶輸入的第二語(yǔ)音query的第二語(yǔ)音識(shí)別結(jié)果。在102中,根據(jù)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別。在103中,若確定用戶具有糾錯(cuò)意圖,則從第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息。在104中,根據(jù)獲取到的糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。其中,第一語(yǔ)音識(shí)別結(jié)果為在第二語(yǔ)音query之前輸入的第一語(yǔ)音query的語(yǔ)音識(shí)別結(jié)果。比如,在進(jìn)行搜索時(shí),用戶通過第一語(yǔ)音query輸入搜索對(duì)象“陳育娟”,第一語(yǔ)音識(shí)別結(jié)果出現(xiàn)錯(cuò)誤,將“陳育娟”識(shí)別為“陳玉娟”,相應(yīng)地,則會(huì)為用戶展示“陳玉娟”的搜索結(jié)果,這種情況下,用戶則可輸入第二語(yǔ)音query,如“下面是一個(gè)月的育”,從而對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),進(jìn)而可按照糾錯(cuò)后的第一語(yǔ)音識(shí)別結(jié)果為用戶展示搜索結(jié)果,如圖2~5所示。圖2為本發(fā)明所述第一語(yǔ)音識(shí)別結(jié)果“陳玉娟”的輸入界面示意圖,圖3為本發(fā)明所述第一語(yǔ)音識(shí)別結(jié)果“陳玉娟”對(duì)應(yīng)的搜索結(jié)果的界面示意圖,圖4為本發(fā)明所述第二語(yǔ)音識(shí)別結(jié)果“下面是一個(gè)月的育”的輸入界面示意圖,圖5為本發(fā)明所述糾錯(cuò)后的第一語(yǔ)音識(shí)別結(jié)果“陳育娟”對(duì)應(yīng)的搜索結(jié)果的界面示意圖。可以看出,圖1所示實(shí)施例中提出了一種基于多輪對(duì)話的交互式語(yǔ)音識(shí)別糾錯(cuò)方式,整個(gè)糾錯(cuò)流程可主要分為三個(gè)階段,分別為:糾錯(cuò)意圖識(shí)別、糾錯(cuò)信息提取以及糾錯(cuò)資源匹配,通過這三個(gè)階段,對(duì)用戶在語(yǔ)音query中提供的信息進(jìn)行遞進(jìn)式的判別、挖掘和利用,從而幫助用戶實(shí)現(xiàn)糾錯(cuò)意圖。以下分別對(duì)上述各階段的具體實(shí)現(xiàn)進(jìn)行詳細(xì)說明。1)糾錯(cuò)意圖識(shí)別在接收到用戶輸入的第二語(yǔ)音query之后,可首先按照現(xiàn)有技術(shù)對(duì)其進(jìn)行語(yǔ)音識(shí)別,從而得到第二語(yǔ)音識(shí)別結(jié)果。之后,可根據(jù)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別,即確定用戶是否具有糾錯(cuò)意圖,確定用戶具有糾錯(cuò)意圖之后,才會(huì)進(jìn)行后續(xù)的糾錯(cuò)流程。考慮到不同的用戶可能會(huì)采用不同的表達(dá)方式,有的表達(dá)方式比較明確,可以比較容易地識(shí)別出用戶的糾錯(cuò)意圖,而有的表達(dá)方式則比較復(fù)雜,識(shí)別起來比較困難,因此,本實(shí)施例中提供了兩種識(shí)別方式,即基于規(guī)則的糾錯(cuò)意圖識(shí)別方式以及基于統(tǒng)計(jì)的糾錯(cuò)意圖識(shí)別方式,兩種方式可結(jié)合使用。其中,基于規(guī)則的糾錯(cuò)意圖識(shí)別方式可以是指預(yù)先生成m個(gè)糾錯(cuò)意圖模板,m為正整數(shù),具體取值可根據(jù)實(shí)際需要而定,通常大于一,這樣,當(dāng)獲取到第二語(yǔ)音識(shí)別結(jié)果之后,可確定其是否與m個(gè)糾錯(cuò)意圖模板中的至少一個(gè)相匹配,如果是,則可確定用戶具有糾錯(cuò)意圖。第二語(yǔ)音識(shí)別結(jié)果與糾錯(cuò)意圖模板可如表一所示:模板示例第二語(yǔ)音識(shí)別結(jié)果是[偏旁]的[字]我要的是單人旁的倒是[聲調(diào)]的那個(gè)[字]是三聲的那個(gè)倒表一第二語(yǔ)音識(shí)別結(jié)果與糾錯(cuò)意圖模板如果第二語(yǔ)音識(shí)別結(jié)果與任一糾錯(cuò)意圖模板均不匹配,那么可進(jìn)一步采用基于統(tǒng)計(jì)的糾錯(cuò)意圖識(shí)別方式對(duì)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行識(shí)別。比如,可利用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行意圖分類,分類結(jié)果包括具有糾錯(cuò)意圖以及不具有糾錯(cuò)意圖。圖6為本發(fā)明所述深度神經(jīng)網(wǎng)絡(luò)模型的框架示意圖,如圖6所示,可采用詞向量特征與統(tǒng)計(jì)特征相結(jié)合的方式,利用embedding及長(zhǎng)短時(shí)間記憶網(wǎng)絡(luò)(lstm,longshorttermmemorynetworks)分別得到第二語(yǔ)音識(shí)別結(jié)果中的每個(gè)字的詞向量,并針對(duì)第二語(yǔ)音識(shí)別結(jié)果中的每個(gè)字,開發(fā)特征工程用以提取統(tǒng)計(jì)特征,二者相結(jié)合確定意圖分類結(jié)果,分類結(jié)果包括具有糾錯(cuò)意圖以及不具有糾錯(cuò)意圖。具體提取哪些統(tǒng)計(jì)特征可根據(jù)實(shí)際需要而定,比如可包括拼音特征、發(fā)音距離特征以及規(guī)則特征等。2)糾錯(cuò)信息提取在確定用戶具有糾錯(cuò)意圖之后,并不能直接利用第二語(yǔ)音識(shí)別結(jié)果來對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),因?yàn)榈诙Z(yǔ)音識(shí)別結(jié)果中不但包含糾錯(cuò)信息,還包含其它噪聲信息,因此需要對(duì)有用的糾錯(cuò)信息進(jìn)行提取,去除無關(guān)信息,才能完成后續(xù)的糾錯(cuò)處理。根據(jù)在對(duì)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別時(shí)所采用的識(shí)別方式的不同,從第二語(yǔ)音識(shí)別結(jié)果中提取糾錯(cuò)信息的方式也會(huì)不同。其中,若利用糾錯(cuò)意圖模板確定出用戶具有糾錯(cuò)意圖,那么可直接通過糾錯(cuò)意圖模板的槽位信息來提取出糾錯(cuò)信息。比如,第二語(yǔ)音識(shí)別結(jié)果為“我要的是單人旁的倒”,相匹配的糾錯(cuò)意圖模板為“是[偏旁]的[字]”,那么提取出糾錯(cuò)信息則為[偏旁:?jiǎn)稳伺註、[字:倒]。若利用深度神經(jīng)網(wǎng)絡(luò)模型確定出用戶具有糾錯(cuò)意圖,那么則可通過序列標(biāo)注模型,分別對(duì)第二語(yǔ)音識(shí)別結(jié)果中的每個(gè)字進(jìn)行標(biāo)注,利用標(biāo)注為屬于糾錯(cuò)信息的字組成糾錯(cuò)信息。即利用序列標(biāo)注模型,對(duì)第二語(yǔ)音識(shí)別結(jié)果中的不同類別信息進(jìn)行標(biāo)注,從而確定有用信息。不同于傳統(tǒng)的命名實(shí)體識(shí)別(ner,namedentityrecognition)序列標(biāo)注,對(duì)第二語(yǔ)音識(shí)別結(jié)果的標(biāo)注需要以字粒度進(jìn)行,因此難度更大、精度要求更高。圖7為本發(fā)明所述序列標(biāo)注模型的框架示意圖,如圖7所示,可采用詞向量特征與統(tǒng)計(jì)特征相結(jié)合的方式來對(duì)第二語(yǔ)音識(shí)別結(jié)果中的每個(gè)字進(jìn)行標(biāo)注,詞向量方面,實(shí)驗(yàn)顯示,采用廣義回歸神經(jīng)網(wǎng)絡(luò)(grnn,generalregressionneuralnetwork)的效果更優(yōu),特征工程對(duì)每個(gè)字生成統(tǒng)計(jì)特征,每個(gè)字的統(tǒng)計(jì)特征與詞向量合并得到字特征,再通過全連接的神經(jīng)網(wǎng)絡(luò)進(jìn)行標(biāo)注,對(duì)于每個(gè)字來說,其能夠體現(xiàn)糾錯(cuò)信息或不能夠體現(xiàn)糾錯(cuò)信息,即屬于糾錯(cuò)信息或不屬于糾錯(cuò)信息,利用能夠體現(xiàn)糾錯(cuò)信息的各個(gè)字即可組成所需的糾錯(cuò)信息。比如,“我要的是單人旁的倒”中的“單”字,其用于描述字的偏旁,因此能夠體現(xiàn)糾錯(cuò)信息。3)糾錯(cuò)資源匹配在獲取到糾錯(cuò)信息之后,即可利用糾錯(cuò)信息來與各糾錯(cuò)資源進(jìn)行匹配,以確定糾錯(cuò)信息所描述的對(duì)象,即用戶通過描述想要找到的是哪個(gè)字。糾錯(cuò)資源的種類很多,比如使用偏旁部首資源和拆字資源等,偏方部首資源即指(偏旁:字)的kv對(duì),如(單人旁:倒),拆字資源即描述字的拆解信息及原字,如(人到:倒)。以下以拆字資源為例,說明如何根據(jù)糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。由于針對(duì)的是語(yǔ)音query,所以不能直接通過文字信息來索引資源,因?yàn)榈诙Z(yǔ)音識(shí)別結(jié)果中也可能會(huì)出現(xiàn)錯(cuò)誤,如將“人到:倒”識(shí)別為“人道:倒”或“人到:到”等,需要轉(zhuǎn)為對(duì)應(yīng)的拼音,以解決第二語(yǔ)音識(shí)別結(jié)果中的識(shí)別錯(cuò)誤問題。另外,還會(huì)存在其它問題,比如,糾錯(cuò)資源(日四又:曼),第二語(yǔ)音識(shí)別結(jié)果可能為“上面是四字下面又的那個(gè)曼”,提取到的糾錯(cuò)信息為[四又:曼],因此需要計(jì)算糾錯(cuò)信息與糾錯(cuò)資源的相似度,獲取相似度最高的糾錯(cuò)資源作為最終的匹配結(jié)果,但線性的相似度計(jì)算耗時(shí)太大,無法接受,因此本實(shí)施例中提出,可按照key的kgram集合來對(duì)糾錯(cuò)資源進(jìn)行倒排拉鏈,從而減少相似度計(jì)算量。為此,針對(duì)每個(gè)糾錯(cuò)資源,可分別將該糾錯(cuò)資源中的每個(gè)字轉(zhuǎn)為對(duì)應(yīng)的拼音,并根據(jù)該糾錯(cuò)資源中的各個(gè)字及拼音,生成該糾錯(cuò)資源的key,所述key可為kgramkey,進(jìn)而可建立key與對(duì)應(yīng)的糾錯(cuò)資源之間的倒排索引。這樣,在根據(jù)糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選時(shí),可首先將糾錯(cuò)信息中的每個(gè)字分別轉(zhuǎn)為對(duì)應(yīng)的拼音,之后,確定糾錯(cuò)信息中的各個(gè)字是否組成一個(gè)key,如果是,則將這個(gè)key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源,并確定糾錯(cuò)信息中的各個(gè)字對(duì)應(yīng)的拼音是否組成一個(gè)key,如果是,則將這個(gè)key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源。具體地,對(duì)于每個(gè)糾錯(cuò)資源,可分別按照以下方式確定出該糾錯(cuò)資源的key:針對(duì)該糾錯(cuò)資源中的各個(gè)字,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,并針對(duì)該糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,i為正整數(shù),且2≤i≤n,n為該糾錯(cuò)資源中包括的字?jǐn)?shù);針對(duì)該糾錯(cuò)資源中的各個(gè)字,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,并針對(duì)該糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,j為正整數(shù),且2≤j≤n-1。將各連續(xù)kgram集合以及各跳躍kgram集合中的元素分別作為該糾錯(cuò)資源的key。舉例說明:假設(shè)糾錯(cuò)資源為(日四又:曼);以連續(xù)2個(gè)term為最小粒度得到的連續(xù)kgram集合為{日四,四又,又曼};以連續(xù)3個(gè)term為最小粒度得到的連續(xù)kgram集合為{日四又,四又曼};以連續(xù)4個(gè)term為最小粒度得到的連續(xù)kgram集合為{日四又曼};以2個(gè)term為最小粒度得到的不連續(xù)的跳躍kgram集合為{日又,日曼,四曼};以3個(gè)term為最小粒度得到的不連續(xù)的跳躍kgram集合為{日又曼,日四曼};相應(yīng)地,對(duì)于糾錯(cuò)資源的拼音(ri’si’you:man);以連續(xù)2個(gè)term為最小粒度得到的連續(xù)kgram集合為{ri,si,si’you,you’man};以連續(xù)3個(gè)term為最小粒度得到的連續(xù)kgram集合為{ri’si’you,si’you’man};以連續(xù)4個(gè)term為最小粒度得到的連續(xù)kgram集合為{ri’si’you’man};以2個(gè)term為最小粒度得到的不連續(xù)的跳躍kgram集合為{ri’you,ri’man,si’man};以3個(gè)term為最小粒度得到的不連續(xù)的跳躍kgram集合為{ri’you’man,ri’si’man};上述各連續(xù)kgram集合以及各跳躍kgram集合中的元素均為糾錯(cuò)資源(日四又:曼)的key,通過任一key拉取的list中均將包含糾錯(cuò)資源(日四又:曼),比如,“日四”是一個(gè)key,“四又曼”也是一個(gè)key,通過“日四”拉取的list中將包含糾錯(cuò)資源(日四又:曼),同樣,通過“四又曼”拉取的list中也將包含糾錯(cuò)資源(日四又:曼)。假設(shè)第二語(yǔ)音識(shí)別結(jié)果為“上面是四字下面又的那個(gè)曼”,提取到的糾錯(cuò)信息為[四又:曼],那么根據(jù)該糾錯(cuò)信息可組成兩個(gè)key,分別為“四又曼”和“si’you’man”,將“四又曼”和“si’you’man”這兩個(gè)key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源,其中包含了糾錯(cuò)資源(日四又:曼),也可能包含了其它糾錯(cuò)資源。之后,可從篩選出的各糾錯(cuò)資源中進(jìn)一步選出與糾錯(cuò)信息最為匹配的糾錯(cuò)資源,并利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。具體地,針對(duì)篩選出的每個(gè)糾錯(cuò)資源,可分別計(jì)算該糾錯(cuò)資源中的各個(gè)字的拼音所組成的字符串與糾錯(cuò)信息中的各個(gè)字的拼音所組成的字符串之間的帶權(quán)編輯距離,進(jìn)而將計(jì)算出的帶權(quán)編輯距離最小的糾錯(cuò)資源作為最為匹配的糾錯(cuò)資源,利用最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。編輯距離,是指兩個(gè)字符串之間,由一個(gè)轉(zhuǎn)成另一個(gè)所需的最少編輯操作次數(shù),許可的編輯操作包括將一個(gè)字符替換成另一個(gè)字符,增加(插入)一個(gè)字符,刪除一個(gè)字符。一般來說,編輯距離越小,兩個(gè)字符串的相似度越大。本實(shí)施例中,在計(jì)算編輯距離時(shí),對(duì)于增加和刪除兩種操作,編輯距離均可與傳統(tǒng)的編輯距離度量方式相同,為1,而對(duì)于替換操作,可計(jì)算兩個(gè)音節(jié)之間的發(fā)音距離,發(fā)音距離越近,產(chǎn)生的編輯距離增加量越小。以上是以糾錯(cuò)資源的種類為拆字資源為例,對(duì)如何根據(jù)糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)進(jìn)行說明,對(duì)于其它種類,本發(fā)明所述方案同樣適用,只是具體實(shí)現(xiàn)上可能會(huì)有所不同。比如,對(duì)于偏旁部首資源,針對(duì)每個(gè)糾錯(cuò)資源,可分別將其中的每個(gè)字轉(zhuǎn)為對(duì)應(yīng)的拼音,假設(shè)糾錯(cuò)信息為(單人旁:倒),同樣地,可將糾錯(cuò)信息中的每個(gè)字分別轉(zhuǎn)為對(duì)應(yīng)的拼音,并根據(jù)拼音,查找與糾錯(cuò)信息完全匹配的糾錯(cuò)資源,如果只有一個(gè),該糾錯(cuò)資源即為最為匹配的糾錯(cuò)資源,如果有多個(gè),可按照預(yù)定方式,比如使用頻率、上下文信息等進(jìn)一步從中選出最為匹配的糾錯(cuò)資源。另外,還可通過詞語(yǔ)或聲調(diào)等來進(jìn)行糾錯(cuò)。比如,用戶輸入的第一語(yǔ)音query為“李爍”,第一語(yǔ)音識(shí)別結(jié)果出現(xiàn)錯(cuò)誤,識(shí)別為“李樹”,那么用戶可進(jìn)一步輸入第二語(yǔ)音query“第二個(gè)字是閃爍的爍”,從而來對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。總之,采用上述實(shí)施例所述方案,可獲取用戶輸入的第二語(yǔ)音識(shí)別結(jié)果,并根據(jù)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別,如果確定用戶具有糾錯(cuò)意圖,則可從第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息,并根據(jù)糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,從而利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),對(duì)于用戶來說,可以像人與人之間對(duì)話時(shí)一樣,描述錯(cuò)誤或強(qiáng)調(diào)正解,相應(yīng)地,可根據(jù)用戶的描述對(duì)語(yǔ)音識(shí)別結(jié)果進(jìn)行修正,從而實(shí)現(xiàn)了對(duì)于語(yǔ)音識(shí)別結(jié)果的準(zhǔn)確糾錯(cuò),即提高了糾錯(cuò)結(jié)果的準(zhǔn)確性,并且,用戶只需要通過語(yǔ)音的方式發(fā)出糾錯(cuò)指令即可,無需進(jìn)行手動(dòng)輸入操作,從而對(duì)于用戶來說降低了糾錯(cuò)難度。另外,采用上述實(shí)施例所述方案,可通過將糾錯(cuò)信息等轉(zhuǎn)為拼音來進(jìn)行糾錯(cuò)資源的篩選,從而盡可能地確保了在第二語(yǔ)音識(shí)別結(jié)果出現(xiàn)錯(cuò)誤時(shí),仍能準(zhǔn)確地對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。再有,采用上述實(shí)施例所述方案,可為糾錯(cuò)資源通過kgram集合建立倒排索引,從而減少了相似度計(jì)算量,進(jìn)而節(jié)省了計(jì)算資源。以上是關(guān)于方法實(shí)施例的介紹,以下通過裝置實(shí)施例,對(duì)本發(fā)明所述方案進(jìn)行進(jìn)一步說明。圖8為本發(fā)明所述基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)裝置實(shí)施例的組成結(jié)構(gòu)示意圖,如圖8所示,包括:糾錯(cuò)意圖識(shí)別單元801、糾錯(cuò)信息提取單元802以及糾錯(cuò)資源匹配單元803。糾錯(cuò)意圖識(shí)別單元801,用于獲取用戶輸入的第二語(yǔ)音query的第二語(yǔ)音識(shí)別結(jié)果,并根據(jù)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別。糾錯(cuò)信息提取單元802,用于當(dāng)糾錯(cuò)意圖識(shí)別單元801識(shí)別出用戶具有糾錯(cuò)意圖時(shí),從第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息。糾錯(cuò)資源匹配單元803,用于根據(jù)糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),第一語(yǔ)音識(shí)別結(jié)果為在第二語(yǔ)音query之前輸入的第一語(yǔ)音query的語(yǔ)音識(shí)別結(jié)果。糾錯(cuò)意圖識(shí)別單元801在接收到用戶輸入的第二語(yǔ)音query之后,可首先按照現(xiàn)有技術(shù)對(duì)其進(jìn)行語(yǔ)音識(shí)別,從而得到第二語(yǔ)音識(shí)別結(jié)果。之后,糾錯(cuò)意圖識(shí)別單元801可根據(jù)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別,即確定用戶是否具有糾錯(cuò)意圖,確定用戶具有糾錯(cuò)意圖之后,才會(huì)進(jìn)行后續(xù)的糾錯(cuò)流程。考慮到不同的用戶可能會(huì)采用不同的表達(dá)方式,有的表達(dá)方式比較明確,可以比較容易地識(shí)別出用戶的糾錯(cuò)意圖,而有的表達(dá)方式則比較復(fù)雜,識(shí)別起來比較困難,因此,本實(shí)施例中提供了兩種識(shí)別方式,即基于規(guī)則的糾錯(cuò)意圖識(shí)別方式以及基于統(tǒng)計(jì)的糾錯(cuò)意圖識(shí)別方式,兩種方式可結(jié)合使用。其中,基于規(guī)則的糾錯(cuò)意圖識(shí)別方式可以是指預(yù)先生成m個(gè)糾錯(cuò)意圖模板,m為正整數(shù),具體取值可根據(jù)實(shí)際需要而定,通常大于一,這樣,糾錯(cuò)意圖識(shí)別單元801在獲取到第二語(yǔ)音識(shí)別結(jié)果之后,可確定其是否與m個(gè)糾錯(cuò)意圖模板中的至少一個(gè)相匹配,如果是,則可確定用戶具有糾錯(cuò)意圖。如果第二語(yǔ)音識(shí)別結(jié)果與任一糾錯(cuò)意圖模板均不匹配,那么可進(jìn)一步采用基于統(tǒng)計(jì)的糾錯(cuò)意圖識(shí)別方式對(duì)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行識(shí)別。比如,糾錯(cuò)意圖識(shí)別單元801可利用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行意圖分類,分類結(jié)果包括具有糾錯(cuò)意圖以及不具有糾錯(cuò)意圖。深度神經(jīng)網(wǎng)絡(luò)模型的框架可如圖6所示。在確定用戶具有糾錯(cuò)意圖之后,并不能直接利用第二語(yǔ)音識(shí)別結(jié)果來對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),因?yàn)榈诙Z(yǔ)音識(shí)別結(jié)果中不但包含糾錯(cuò)信息,還包含其它噪聲信息,因此需要對(duì)有用的糾錯(cuò)信息進(jìn)行提取,去除無關(guān)信息,才能完成后續(xù)的糾錯(cuò)處理。根據(jù)在對(duì)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別時(shí)所采用的識(shí)別方式的不同,從第二語(yǔ)音識(shí)別結(jié)果中提取糾錯(cuò)信息的方式也會(huì)不同。其中,若糾錯(cuò)意圖識(shí)別單元801利用糾錯(cuò)意圖模板確定出用戶具有糾錯(cuò)意圖,那么糾錯(cuò)信息提取單元802可通過糾錯(cuò)意圖模板的槽位信息確定出糾錯(cuò)信息。若糾錯(cuò)意圖識(shí)別單元801利用深度神經(jīng)網(wǎng)絡(luò)模型確定出用戶具有糾錯(cuò)意圖,那么糾錯(cuò)信息提取單元802可通過序列標(biāo)注模型,分別對(duì)第二語(yǔ)音識(shí)別結(jié)果中的每個(gè)字進(jìn)行標(biāo)注,利用標(biāo)注為屬于糾錯(cuò)信息的字組成糾錯(cuò)信息。序列標(biāo)注模型的框架可如圖7所示。在獲取到糾錯(cuò)信息之后,即可利用糾錯(cuò)信息來與各糾錯(cuò)資源進(jìn)行匹配,以確定糾錯(cuò)信息所描述的對(duì)象,即用戶通過描述想要找到的是哪個(gè)字。糾錯(cuò)資源的種類很多,比如使用偏旁部首資源和拆字資源等,偏方部首資源即指(偏旁:字)的kv對(duì),如(單人旁:倒),拆字資源即描述字的拆解信息及原字,如(人到:倒)。以下以拆字資源為例,對(duì)糾錯(cuò)資源匹配單元803的具體工作方式進(jìn)行說明。相應(yīng)地,如圖8所示,本實(shí)施例所述裝置中還可進(jìn)一步包括:預(yù)處理單元800。預(yù)處理單元800,用于當(dāng)糾錯(cuò)資源的種類為拆字資源時(shí),針對(duì)每個(gè)糾錯(cuò)資源,分別將糾錯(cuò)資源中的每個(gè)字轉(zhuǎn)為對(duì)應(yīng)的拼音,并根據(jù)糾錯(cuò)資源中的各個(gè)字及拼音,生成糾錯(cuò)資源的key;建立key與對(duì)應(yīng)的糾錯(cuò)資源之間的倒排索引。糾錯(cuò)資源匹配單元803可將糾錯(cuò)信息中的每個(gè)字分別轉(zhuǎn)為對(duì)應(yīng)的拼音;確定糾錯(cuò)信息中的各個(gè)字是否組成一個(gè)key,如果是,則將key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源;確定糾錯(cuò)信息中的各個(gè)字對(duì)應(yīng)的拼音是否組成一個(gè)key,如果是,則將key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源。具體地,對(duì)于每個(gè)糾錯(cuò)資源,預(yù)處理單元800可分別按照以下方式確定出該糾錯(cuò)資源的key:針對(duì)糾錯(cuò)資源中的各個(gè)字,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,并針對(duì)糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,i為正整數(shù),且2≤i≤n,n為糾錯(cuò)資源中包括的字?jǐn)?shù);針對(duì)糾錯(cuò)資源中的各個(gè)字,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,并針對(duì)糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,j為正整數(shù),且2≤j≤n-1。將連續(xù)kgram集合以及跳躍kgram集合中的元素分別作為糾錯(cuò)資源的key。之后,糾錯(cuò)資源匹配單元803可從篩選出的各糾錯(cuò)資源中進(jìn)一步選出與糾錯(cuò)信息最為匹配的糾錯(cuò)資源,并利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。具體地,糾錯(cuò)資源匹配單元803可針對(duì)篩選出的每個(gè)糾錯(cuò)資源,分別計(jì)算糾錯(cuò)資源中的各個(gè)字的拼音所組成的字符串與糾錯(cuò)信息中的各個(gè)字的拼音所組成的字符串之間的帶權(quán)編輯距離;將計(jì)算出的帶權(quán)編輯距離最小的糾錯(cuò)資源作為最為匹配的糾錯(cuò)資源,利用最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。其中,在計(jì)算編輯距離時(shí),對(duì)于增加和刪除兩種操作,編輯距離均為1,對(duì)于替換操作,可計(jì)算兩個(gè)音節(jié)之間的發(fā)音距離,發(fā)音距離越近,產(chǎn)生的編輯距離增加量越小。圖8所示裝置實(shí)施例的具體工作流程請(qǐng)參照前述方法實(shí)施例中的相應(yīng)說明,不再贅述。圖9示出了適于用來實(shí)現(xiàn)本發(fā)明實(shí)施方式的示例性計(jì)算機(jī)系統(tǒng)/服務(wù)器12的框圖。圖9顯示的計(jì)算機(jī)系統(tǒng)/服務(wù)器12僅僅是一個(gè)示例,不應(yīng)對(duì)本發(fā)明實(shí)施例的功能和使用范圍帶來任何限制。如圖9所示,計(jì)算機(jī)系統(tǒng)/服務(wù)器12以通用計(jì)算設(shè)備的形式表現(xiàn)。計(jì)算機(jī)系統(tǒng)/服務(wù)器12的組件可以包括但不限于:一個(gè)或者多個(gè)處理器(處理單元)16,存儲(chǔ)器28,連接不同系統(tǒng)組件(包括存儲(chǔ)器28和處理器16)的總線18。總線18表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲(chǔ)器總線或者存儲(chǔ)器控制器,外圍總線,圖形加速端口,處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。舉例來說,這些體系結(jié)構(gòu)包括但不限于工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(isa)總線,微通道體系結(jié)構(gòu)(mac)總線,增強(qiáng)型isa總線、視頻電子標(biāo)準(zhǔn)協(xié)會(huì)(vesa)局域總線以及外圍組件互連(pci)總線。計(jì)算機(jī)系統(tǒng)/服務(wù)器12典型地包括多種計(jì)算機(jī)系統(tǒng)可讀介質(zhì)。這些介質(zhì)可以是任何能夠被計(jì)算機(jī)系統(tǒng)/服務(wù)器12訪問的可用介質(zhì),包括易失性和非易失性介質(zhì),可移動(dòng)的和不可移動(dòng)的介質(zhì)。存儲(chǔ)器28可以包括易失性存儲(chǔ)器形式的計(jì)算機(jī)系統(tǒng)可讀介質(zhì),例如隨機(jī)存取存儲(chǔ)器(ram)30和/或高速緩存存儲(chǔ)器32。計(jì)算機(jī)系統(tǒng)/服務(wù)器12可以進(jìn)一步包括其它可移動(dòng)/不可移動(dòng)的、易失性/非易失性計(jì)算機(jī)系統(tǒng)存儲(chǔ)介質(zhì)。僅作為舉例,存儲(chǔ)系統(tǒng)34可以用于讀寫不可移動(dòng)的、非易失性磁介質(zhì)(圖9未顯示,通常稱為“硬盤驅(qū)動(dòng)器”)。盡管圖9中未示出,可以提供用于對(duì)可移動(dòng)非易失性磁盤(例如“軟盤”)讀寫的磁盤驅(qū)動(dòng)器,以及對(duì)可移動(dòng)非易失性光盤(例如cd-rom,dvd-rom或者其它光介質(zhì))讀寫的光盤驅(qū)動(dòng)器。在這些情況下,每個(gè)驅(qū)動(dòng)器可以通過一個(gè)或者多個(gè)數(shù)據(jù)介質(zhì)接口與總線18相連。存儲(chǔ)器28可以包括至少一個(gè)程序產(chǎn)品,該程序產(chǎn)品具有一組(例如至少一個(gè))程序模塊,這些程序模塊被配置以執(zhí)行本發(fā)明各實(shí)施例的功能。具有一組(至少一個(gè))程序模塊42的程序/實(shí)用工具40,可以存儲(chǔ)在例如存儲(chǔ)器28中,這樣的程序模塊42包括——但不限于——操作系統(tǒng)、一個(gè)或者多個(gè)應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個(gè)或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實(shí)現(xiàn)。程序模塊42通常執(zhí)行本發(fā)明所描述的實(shí)施例中的功能和/或方法。計(jì)算機(jī)系統(tǒng)/服務(wù)器12也可以與一個(gè)或多個(gè)外部設(shè)備14(例如鍵盤、指向設(shè)備、顯示器24等)通信,還可與一個(gè)或者多個(gè)使得用戶能與該計(jì)算機(jī)系統(tǒng)/服務(wù)器12交互的設(shè)備通信,和/或與使得該計(jì)算機(jī)系統(tǒng)/服務(wù)器12能與一個(gè)或多個(gè)其它計(jì)算設(shè)備進(jìn)行通信的任何設(shè)備(例如網(wǎng)卡,調(diào)制解調(diào)器等等)通信。這種通信可以通過輸入/輸出(i/o)接口22進(jìn)行。并且,計(jì)算機(jī)系統(tǒng)/服務(wù)器12還可以通過網(wǎng)絡(luò)適配器20與一個(gè)或者多個(gè)網(wǎng)絡(luò)(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖9所示,網(wǎng)絡(luò)適配器20通過總線18與計(jì)算機(jī)系統(tǒng)/服務(wù)器12的其它模塊通信。應(yīng)當(dāng)明白,盡管圖中未示出,可以結(jié)合計(jì)算機(jī)系統(tǒng)/服務(wù)器12使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設(shè)備驅(qū)動(dòng)器、冗余處理單元、外部磁盤驅(qū)動(dòng)陣列、raid系統(tǒng)、磁帶驅(qū)動(dòng)器以及數(shù)據(jù)備份存儲(chǔ)系統(tǒng)等。處理器16通過運(yùn)行存儲(chǔ)在存儲(chǔ)器28中的程序,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,例如實(shí)現(xiàn)圖1所示實(shí)施例中的方法,即獲取用戶輸入的第二語(yǔ)音query的第二語(yǔ)音識(shí)別結(jié)果,根據(jù)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別,若確定用戶具有糾錯(cuò)意圖,則從第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息,根據(jù)糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),第一語(yǔ)音識(shí)別結(jié)果為在第二語(yǔ)音query之前輸入的第一語(yǔ)音query的語(yǔ)音識(shí)別結(jié)果。具體實(shí)現(xiàn)請(qǐng)參照前述各實(shí)施例中的相關(guān)說明,不再贅述。本發(fā)明同時(shí)公開了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)將實(shí)現(xiàn)如圖1所示實(shí)施例中的方法。可以采用一個(gè)或多個(gè)計(jì)算機(jī)可讀的介質(zhì)的任意組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或者計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤、硬盤、隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、可擦式可編程只讀存儲(chǔ)器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲(chǔ)器(cd-rom)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。在本文件中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何包含或存儲(chǔ)程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。計(jì)算機(jī)可讀的信號(hào)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào),其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式,包括——但不限于——電磁信號(hào)、光信號(hào)或上述的任意合適的組合。計(jì)算機(jī)可讀的信號(hào)介質(zhì)還可以是計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括——但不限于——無線、電線、光纜、rf等等,或者上述的任意合適的組合。可以以一種或多種程序設(shè)計(jì)語(yǔ)言或其組合來編寫用于執(zhí)行本發(fā)明操作的計(jì)算機(jī)程序代碼,所述程序設(shè)計(jì)語(yǔ)言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言—諸如java、smalltalk、c++,還包括常規(guī)的過程式程序設(shè)計(jì)語(yǔ)言—諸如”c”語(yǔ)言或類似的程序設(shè)計(jì)語(yǔ)言。程序代碼可以完全地在用戶計(jì)算機(jī)上執(zhí)行、部分地在用戶計(jì)算機(jī)上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算機(jī)上部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算機(jī)的情形中,遠(yuǎn)程計(jì)算機(jī)可以通過任意種類的網(wǎng)絡(luò)——包括局域網(wǎng)(lan)或廣域網(wǎng)(wan)—連接到用戶計(jì)算機(jī),或者,可以連接到外部計(jì)算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。在本發(fā)明所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的裝置和方法等,可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式。所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)或處理器(processor)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:u盤、移動(dòng)硬盤、只讀存儲(chǔ)器(rom,read-onlymemory)、隨機(jī)存取存儲(chǔ)器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。當(dāng)前第1頁(yè)12