麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

電子裝置及其透過語(yǔ)音辨識(shí)喚醒的方法與流程

文檔序號(hào):11097746閱讀:939來源:國(guó)知局
電子裝置及其透過語(yǔ)音辨識(shí)喚醒的方法與制造工藝

本發(fā)明是有關(guān)于一種電子裝置及其喚醒的方法,且特別是有關(guān)于一種電子裝置及其透過語(yǔ)音辨識(shí)喚醒的方法。



背景技術(shù):

近年來,由于科技的進(jìn)步,使用者可透過語(yǔ)音進(jìn)行電子裝置的控制,例如使用者可透過語(yǔ)音喚醒電子裝置。但是,由于各項(xiàng)因素的影響,往往會(huì)造成誤接收(False Acceptance)的情況(也就是電子裝置在非預(yù)期的情況下被喚醒),或者造成誤拒絕(False Rejection)的情況(也就是使用者欲透過語(yǔ)音喚醒電子裝置,但卻無(wú)法成功喚醒電子裝置)。舉例來說,吵雜的環(huán)境聲音有可能在非預(yù)期的情況下喚醒電子裝置。或者,使用者在與別人交談,但是講話的聲音卻在非預(yù)期的情況下喚醒電子裝置。或者,由于使用者的口音問題而造成無(wú)法成功喚醒電子裝置。一般來說,欲改善上述問題必須線上調(diào)整(On-line adaptation)關(guān)鍵詞組語(yǔ)音模型或預(yù)先訓(xùn)練特定使用者的關(guān)鍵詞組語(yǔ)音模型,但是線上調(diào)整或是預(yù)先訓(xùn)練關(guān)鍵詞組語(yǔ)音模型的復(fù)雜度高,不符合成本考量。且若在調(diào)整或是預(yù)先訓(xùn)練關(guān)鍵詞組語(yǔ)音模型時(shí)發(fā)生錯(cuò)誤,則可能造成關(guān)鍵詞組語(yǔ)音模型無(wú)法使用。因此,如何有效改善誤接收及誤拒絕的情況來增加成功喚醒電子裝置的機(jī)率,乃業(yè)界所努力的方向之一。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明有關(guān)于一種電子裝置及其透過語(yǔ)音辨識(shí)喚醒的方法,可調(diào)整透過語(yǔ)音辨識(shí)喚醒電子裝置的準(zhǔn)確率。

根據(jù)本發(fā)明的一方面,提出一種透過語(yǔ)音辨識(shí)喚醒一電子裝置的方法。方法包括以下步驟。接收一目前聲音信號(hào)。擷取目前聲音信號(hào)的一目前聲音特征。判斷是否有儲(chǔ)存一前一聲音信號(hào)的一前一聲音特征。當(dāng)儲(chǔ)存有前一聲音特征時(shí),則根據(jù)前一聲音特征對(duì)應(yīng)一誤接受的情況或一誤拒絕的情況以及目前聲音 特征與前一聲音特征之間的一相似度,至少調(diào)整一信心門檻值與決定是否喚醒電子裝置之一。

根據(jù)本發(fā)明的另一方面,提出一種電子裝置。電子裝置包括儲(chǔ)存裝置、聲音接收裝置及處理器。聲音接收裝置用以接收一目前聲音信號(hào)。處理器用以擷取目前聲音信號(hào)的一目前聲音特征,并判斷儲(chǔ)存裝置中是否有儲(chǔ)存一前一聲音信號(hào)的一前一聲音特征。當(dāng)儲(chǔ)存裝置儲(chǔ)存有前一聲音特征時(shí),則處理器根據(jù)前一聲音特征對(duì)應(yīng)一誤接受的情況或一誤拒絕的情況以及該聲音特征與前一聲音特征之間的一相似度,至少調(diào)整一信心門檻值與決定是否喚醒該電子裝置之一。

為了對(duì)本發(fā)明的上述及其他方面有更佳的了解,下文特舉較佳實(shí)施例,并配合附圖,作詳細(xì)說明如下:

附圖說明

圖1繪示根據(jù)本發(fā)明一實(shí)施例的電子裝置的方塊圖。

圖2繪示根據(jù)本發(fā)明另一實(shí)施例的電子裝置的方塊圖。

圖3繪示根據(jù)本發(fā)明一實(shí)施例的透過語(yǔ)音辨識(shí)喚醒電子裝置的方法的流程圖。

圖4繪示關(guān)鍵詞組語(yǔ)音模型的一例的示意圖。

圖5繪示維特比演算法的示意圖。

圖6A及6B繪示根據(jù)本發(fā)明另一實(shí)施例的透過語(yǔ)音辨識(shí)喚醒電子裝置的方法的流程圖。

圖7繪示動(dòng)態(tài)時(shí)間扭曲演算法的示意圖。

圖8A及8B繪示根據(jù)本發(fā)明另一實(shí)施例的透過語(yǔ)音辨識(shí)喚醒電子裝置的方法的流程圖。

圖9繪示根據(jù)本發(fā)明另一實(shí)施例的透過語(yǔ)音辨識(shí)喚醒電子裝置的方法的流程圖。

圖10A及10B繪示根據(jù)本發(fā)明另一實(shí)施例的透過語(yǔ)音辨識(shí)啟動(dòng)電子裝置的特定功能的方法的流程圖。

其中,附圖標(biāo)記:

S101~S110、S201~S214、S301~S314、S401~S411、S501~S515:流程步驟

100:電子裝置

101:儲(chǔ)存裝置

102:聲音接收裝置

103:處理器

104:使用者界面

1021:麥克風(fēng)

1022:語(yǔ)音活動(dòng)檢測(cè)電路

1023:模擬數(shù)字轉(zhuǎn)換器

具體實(shí)施方式

請(qǐng)參考圖1,圖1繪示根據(jù)本發(fā)明一實(shí)施例的電子裝置100的方塊圖。電子裝置100包括一儲(chǔ)存裝置101、一聲音接收裝置102、一處理器103以及選擇性的包括一使用者界面104。儲(chǔ)存裝置101用以儲(chǔ)存數(shù)據(jù),儲(chǔ)存裝置101例如為記憶體。聲音接收裝置102用以接收聲音,并將模擬聲音信號(hào)轉(zhuǎn)換成數(shù)字聲音信號(hào)。儲(chǔ)存裝置101及聲音接收裝置102耦接至處理器103,處理器103用以接收聲音接收裝置102所輸出的數(shù)字聲音信號(hào),并擷取數(shù)字聲音信號(hào)的聲音特征,以及存取儲(chǔ)存裝置101并管理儲(chǔ)存于儲(chǔ)存裝置101的數(shù)據(jù)。使用者界面104用以接收使用者的輸入,以及提供輸出信息,使用者界面104例如為觸控面板。

請(qǐng)參考圖2,圖2繪示根據(jù)本發(fā)明另一實(shí)施例的電子裝置100的方塊圖。在此實(shí)施例中,聲音接收裝置102例如可以一麥克風(fēng)1021、一語(yǔ)音活動(dòng)檢測(cè)(Voice Activity Detection,VAD)電路1022及一模擬/數(shù)字轉(zhuǎn)換器(Analog to Digital Converter)1023來實(shí)施。麥克風(fēng)1021用以接收聲音。模擬/數(shù)字轉(zhuǎn)換器1023用以將模擬聲音信號(hào)轉(zhuǎn)換成數(shù)字聲音信號(hào)。語(yǔ)音活動(dòng)檢測(cè)電路1022用以檢測(cè)聲音,并當(dāng)檢測(cè)到聲音時(shí),發(fā)出一信號(hào)至處理器103。例如當(dāng)語(yǔ)音活動(dòng)檢測(cè)電路1022檢測(cè)到聲音時(shí),發(fā)出信號(hào)(例如是中斷信號(hào)(interrupt))至處理器103以喚醒處理器103或通知處理器103,使處理器103處理模擬/數(shù)字轉(zhuǎn)換器1023輸出的數(shù)字聲音信號(hào)。

請(qǐng)參考圖1及3,圖3繪示根據(jù)本發(fā)明一實(shí)施例的透過語(yǔ)音辨識(shí)喚醒電子裝置100的方法的流程圖。在此實(shí)施例中,處理器103可判斷目前聲音信號(hào)的 目前聲音特征是否為誤接收或誤拒絕的情況,當(dāng)目前聲音特征為誤接收或誤拒絕的情況時(shí),儲(chǔ)存目前聲音特征做后續(xù)使用。

在步驟S101,聲音接收裝置102接收一目前聲音信號(hào)。目前聲音信號(hào)例如根據(jù)使用者目前正在說話的聲音所得到。在步驟S102,處理器103擷取目前聲音信號(hào)的目前聲音特征。

在步驟S103,處理器103透過一匹配演算法比較目前聲音特征與一關(guān)鍵詞組語(yǔ)音模型以得到一信心分?jǐn)?shù)。也就是說,處理器103比較目前聲音特征與關(guān)鍵詞組語(yǔ)音模型的關(guān)鍵詞組的相似程度得到信心分?jǐn)?shù),以根據(jù)信心分?jǐn)?shù)決定目前聲音特征是否可以喚醒電子裝置100。當(dāng)目前聲音特征與關(guān)鍵詞組語(yǔ)音模型的關(guān)鍵詞組的相似程度高,則信心分?jǐn)?shù)高,代表使用者講話的內(nèi)容與關(guān)鍵詞組語(yǔ)音模型的關(guān)鍵詞組一樣或非常類似,因此使用者可能欲透過語(yǔ)音喚醒電子裝置100。當(dāng)目前聲音特征與關(guān)鍵詞組語(yǔ)音模型的關(guān)鍵詞組的相似程度低,則信心分?jǐn)?shù)低,代表使用者講話的內(nèi)容與關(guān)鍵詞組語(yǔ)音模型的關(guān)鍵詞組差異大,因此使用者并非要透過語(yǔ)音來喚醒電子裝置100。

在一實(shí)施例中,匹配演算法可為維特比(Viterbi)演算法。請(qǐng)參考圖4及5,圖4繪示關(guān)鍵詞組語(yǔ)音模型的示意圖,圖5繪示維特比演算法之一例的示意圖。假設(shè)關(guān)鍵詞組語(yǔ)音模型包括六個(gè)狀態(tài),依序?yàn)閟il、State 0、State 1、State 2、State 3及sil,其中各個(gè)狀態(tài)上的箭頭代表狀態(tài)的轉(zhuǎn)移,每個(gè)狀態(tài)的轉(zhuǎn)移包含一轉(zhuǎn)移機(jī)率(未標(biāo)示)。在圖5中,橫軸為目前聲音的音框fr0~fr12,縱軸為狀態(tài)s0~s5,狀態(tài)s0~s5分別對(duì)應(yīng)至關(guān)鍵詞組語(yǔ)音模型的六個(gè)狀態(tài)sil、State 0、State 1、State 2、State 3及sil。處理器103可根據(jù)維特比演算法找出一最佳路徑使得整段路徑的分?jǐn)?shù)為最大,其中最短路徑上的每一格的分?jǐn)?shù)的總和即為信心分?jǐn)?shù)。在另一實(shí)施例中,匹配演算法可為任意一種演算法,只要可計(jì)算目前聲音特征與關(guān)鍵詞組語(yǔ)音模型中的關(guān)鍵詞組的相似程度即可。

在得到信心分?jǐn)?shù)之后,接著進(jìn)入步驟S104,處理器103判斷信心分?jǐn)?shù)是否大于或等于信心門檻值。信心門檻值代表目前聲音特征可以喚醒電子裝置100的難易度。當(dāng)信心門檻值越低,則表示目前聲音特征與關(guān)鍵詞組語(yǔ)音模型中的關(guān)鍵詞組的相似程度不需太高即可喚醒電子裝置100,因此電子裝置100較容易被目前聲音特征喚醒。當(dāng)信心門檻值越高,則表示目前聲音特征與關(guān)鍵詞組語(yǔ)音模型中的關(guān)鍵詞組的相似程度高才可喚醒電子裝置100,因此電子裝 置100較不易被目前聲音特征喚醒。

當(dāng)信心分?jǐn)?shù)大于或等于信心門檻值,則進(jìn)入步驟S105;當(dāng)信心分?jǐn)?shù)小于信心門檻值,則進(jìn)入步驟S106。在步驟S105,處理器103喚醒電子裝置100。當(dāng)電子裝置100被喚醒之后,使用者可以各種操作方式操作電子裝置100。舉例來說,使用者可透過語(yǔ)音操作電子裝置100。在另一實(shí)施例中,使用者透過按鍵操作電子裝置100、或者透過電子裝置100提供的使用者界面104操作電子裝置100,例如透過觸碰觸控?zé)善敛僮麟娮友b置100。在步驟S106,處理器103不喚醒電子裝置100。

當(dāng)處理器103判斷信心分?jǐn)?shù)大于或等于信心門檻值而喚醒電子裝置100之后(也就是步驟S104及S105之后)。接著進(jìn)入步驟S107,處理器103判斷目前聲音特征是否對(duì)應(yīng)誤接受的情況。誤接受的情況為電子裝置100在非預(yù)期的情況下被喚醒。其判斷方式可包括在目前聲音特征喚醒電子裝置100后,使用者是否于一特定時(shí)間內(nèi)關(guān)掉喚醒的電子裝置100。假設(shè)在目前聲音特征喚醒電子裝置100時(shí),使用者于特定時(shí)間內(nèi)關(guān)掉喚醒的電子裝置100。在這種情況中,代表使用者并不想喚醒電子裝置100,但是電子裝置100卻被目前聲音特征喚醒,故可判斷為誤接受的情況。接著,進(jìn)入步驟S108,處理器103儲(chǔ)存目前聲音特征至儲(chǔ)存裝置101并記錄目前聲音特征為對(duì)應(yīng)到誤接受的情況。

當(dāng)處理器103判斷信心分?jǐn)?shù)小于信心門檻值而不喚醒電子裝置100之后(也就是步驟S104及S106之后)。接著進(jìn)入步驟S109,處理器103判斷目前聲音特征是否對(duì)應(yīng)誤拒絕的情況。誤拒絕的情況為使用者欲透過語(yǔ)音喚醒電子裝置100,但卻無(wú)法成功喚醒電子裝置100。其判斷方式可包括在目前聲音特征未喚醒電子裝置100,且目前聲音特征與關(guān)鍵詞組語(yǔ)音模型比較而得到的信心分?jǐn)?shù)小于信心門檻值且其差值在一預(yù)定范圍內(nèi)。在這種情況中,由于信心分?jǐn)?shù)小于信心門檻值且其差值在預(yù)定范圍內(nèi)(也就是信心分?jǐn)?shù)很接近信心門檻值),代表使用者想要喚醒電子裝置100,但是電子裝置100卻沒有被目前聲音特征所喚醒,故可判斷為誤拒絕的情況。接著,進(jìn)入步驟S110,處理器103儲(chǔ)存目前聲音特征至儲(chǔ)存裝置101并記錄目前聲音特征為對(duì)應(yīng)到誤拒絕的情況。

請(qǐng)參考圖1、3、6A及6B,圖6A及6B繪示根據(jù)本發(fā)明另一實(shí)施例的透過語(yǔ)音辨識(shí)喚醒電子裝置100的方法的流程圖。在此實(shí)施例中,處理器103更判 斷儲(chǔ)存裝置101中是否有儲(chǔ)存一前一聲音信號(hào)的一前一聲音特征,并當(dāng)儲(chǔ)存裝置101儲(chǔ)存有前一聲音特征時(shí),決定是否根據(jù)前一聲音特征及目前聲音特征喚醒電子裝置100。

在聲音接收裝置102接收一目前聲音信號(hào),以及處理器103擷取目前聲音信號(hào)的一目前聲音特征之后(也就是步驟S201及S202之后),進(jìn)入步驟S211。

在步驟S211,處理器103判斷儲(chǔ)存裝置101中是否有儲(chǔ)存一前一聲音信號(hào)的一前一聲音特征。當(dāng)儲(chǔ)存裝置101儲(chǔ)存有前一聲音特征時(shí),則進(jìn)入步驟S212;當(dāng)儲(chǔ)存裝置101未儲(chǔ)存有前一聲音特征時(shí),則進(jìn)入步驟S203。

在步驟S212,處理器103計(jì)算目前聲音特征與前一聲音特征之間的一相似度。也就是說,由于儲(chǔ)存裝置101儲(chǔ)存有前一聲音特征,因此處理器103根據(jù)前一聲音特征及目前聲音特征來決定是否喚醒電子裝置100。在一實(shí)施例中,處理器103可透過動(dòng)態(tài)時(shí)間扭曲(Dynamic Time Warping,DTW)演算法計(jì)算前一聲音特征與目前聲音特征之間的相似度。請(qǐng)參考圖7,圖7繪示動(dòng)態(tài)時(shí)間扭曲演算法的示意圖。在圖7中,P=P1,…,Ps,…,Pk,Ps=(is,js),其中P為翹曲函數(shù)(Warping function)。處理器103可透過動(dòng)態(tài)時(shí)間扭曲演算法計(jì)算目前聲音特征向量與前一聲音特征向量的最短距離,該最短距離即為相似度。在另一實(shí)施例中,處理器103可透過任意一種演算法計(jì)算前一聲音特征與目前聲音特征之間的相似度,只要可計(jì)算兩個(gè)聲音特征之間的相似度即可,在此并不限制。

在計(jì)算出相似度之后,接著進(jìn)入步驟S213,處理器103判斷目前聲音特征與前一聲音特征之間的相似度是否大于或等于一相似度門檻值。當(dāng)相似度大于或等于相似度門檻值,則表示目前聲音特征與前一聲音特征之間的相似度高。也就是,使用者目前說話的內(nèi)容與前一次說話的內(nèi)容相似度高;當(dāng)相似度小于相似度門檻值,則表示目前聲音特征與前一聲音特征之間的相似度低。也就是,使用者目前說話的內(nèi)容與前一次說話的內(nèi)容相似度低。當(dāng)相似度大于或等于相似度門檻值,則進(jìn)入步驟S214;當(dāng)相似度小于相似度門檻值,則進(jìn)入步驟S203。

在步驟S214,處理器103根據(jù)前一聲音特征對(duì)應(yīng)誤接受的情況或誤拒絕的情況,決定是否喚醒電子裝置100。也就是說,由于目前聲音特征與前一聲音特征之間的相似度高,故處理器103根據(jù)前一聲音特征來決定是否喚醒電子 裝置100。

當(dāng)前一聲音特征為對(duì)應(yīng)到誤接受的情況,且目前聲音特征與前一聲音特征之間的大于或等于相似度門檻值(也就是目前聲音特征與前一聲音特征之間的相似度高)時(shí),則處理器103不喚醒電子裝置100。由于前一聲音特征系對(duì)應(yīng)到誤接受的情況,表示使用者前一次說話的內(nèi)容并非要喚醒電子裝置100,但是卻喚醒電子裝置100。因此,當(dāng)前一聲音特征為對(duì)應(yīng)到誤接受的情況且使用者目前說話的內(nèi)容與前一次說話的內(nèi)容類似,則處理器103可判斷使用者目前并非想要喚醒電子裝置100,故不喚醒電子裝置100。

當(dāng)前一聲音特征為對(duì)應(yīng)到誤拒絕的情況,且目前聲音特征與前一聲音特征之間的大于或等于相似度門檻值(也就是目前聲音特征與前一聲音特征之間的相似度高)時(shí),則處理器103喚醒電子裝置100。由于前一聲音特征系對(duì)應(yīng)到誤拒絕的情況,表示使用者前一次說話的內(nèi)容事實(shí)上想要喚醒電子裝置100,但是卻未成功喚醒電子裝置100。因此,當(dāng)前一聲音特征為對(duì)應(yīng)到誤拒絕的情況且使用者目前說話的內(nèi)容與前一次說話的內(nèi)容類似,則處理器103可判斷使用者目前想喚醒電子裝置100,故喚醒電子裝置100。

在步驟S203,由于儲(chǔ)存裝置101未儲(chǔ)存有前一聲音特征或是目前聲音特征與前一聲音特征之間的相似度小于相似度門檻值,因此處理器103不用根據(jù)前一聲音特征及目前聲音特征來決定是否喚醒電子裝置100,而是根據(jù)目前聲音特征與關(guān)鍵詞組語(yǔ)音模型決定是否喚醒電子裝置100。處理器103根據(jù)目前聲音特征與關(guān)鍵詞組語(yǔ)音模型決定是否喚醒電子裝置100的流程如下所述,于步驟S203,處理器103透過匹配演算法比較目前聲音特征與關(guān)鍵詞組語(yǔ)音模型以得到信心分?jǐn)?shù)。接著,進(jìn)入步驟S204,處理器103判斷信心分?jǐn)?shù)是否大于或等于信心門檻值,來決定喚醒電子裝置100(步驟S205)或不喚醒電子裝置100(步驟S206),并判斷目前聲音特征為誤接受的情況(步驟S207)或誤拒絕的情況(步驟S210)。當(dāng)目前聲音特征為誤接受的情況或誤拒絕的情況時(shí),儲(chǔ)存目前聲音特征(步驟S208或步驟S210)。

如此一來,當(dāng)儲(chǔ)存裝置101儲(chǔ)存有前一聲音特征時(shí),處理器103透過目前聲音特征與前一聲音特征之間的相似度以及前一聲音特征所對(duì)應(yīng)的情況,即可判斷是否要喚醒電子裝置100(如步驟S211至S214),而不用將目前聲音特征與關(guān)鍵詞組語(yǔ)音模型比較(如步驟S203),故可降低運(yùn)算量,提升語(yǔ)音喚醒電 子裝置100的效率及正確率。

請(qǐng)參考圖1、6A、6B、8A及8B,圖8A及8B繪示根據(jù)本發(fā)明另一實(shí)施例的透過語(yǔ)音辨識(shí)喚醒電子裝置100的方法的流程圖。在此實(shí)施例中,處理器103可根據(jù)前一聲音特征對(duì)應(yīng)誤接受的情況或誤拒絕的情況,調(diào)整信心門檻值。

步驟S301、S302、S311、S312及S313類似于圖6A的步驟S201、S202、S211、S212及S213。不同的是,在步驟S313,處理器103判斷目前聲音特征與前一聲音特征之間的相似度大于或等于相似度門檻值之后,進(jìn)入步驟S314,處理器103根據(jù)前一聲音特征對(duì)應(yīng)誤接受的情況或誤拒絕的情況,調(diào)整信心門檻值。

詳細(xì)來說,在步驟S314,當(dāng)前一聲音特征為對(duì)應(yīng)到誤接受的情況,且目前聲音特征與前一聲音特征之間的大于或等于相似度門檻值(也就是目前聲音特征與前一聲音特征之間的相似度高)時(shí),處理器103將調(diào)高信心門檻值。原因在于由于前一聲音特征系對(duì)應(yīng)到誤接受的情況,表示使用者前一次說話的內(nèi)容并非要喚醒電子裝置100,但是卻喚醒電子裝置100。在這種情況下,很有可能是因?yàn)樾判拈T檻值太低而導(dǎo)致聲音特征容易喚醒電子裝置100,故調(diào)高信心門檻值,以降低發(fā)生誤接收的情況。

當(dāng)前一聲音特征為對(duì)應(yīng)到誤拒絕的情況,且目前聲音特征與前一聲音特征之間的大于或等于相似度門檻值(也就是目前聲音特征與前一聲音特征之間的相似度高)時(shí),處理器103將調(diào)低信心門檻值。原因在于由于前一聲音特征系對(duì)應(yīng)到誤拒絕的情況,表示使用者前一次說話的內(nèi)容事實(shí)上想要喚醒電子裝置100,但是卻未成功喚醒電子裝置100。在這種情況下,很有可能是因?yàn)樾判拈T檻值太高而導(dǎo)致聲音特征不容易喚醒電子裝置100,故調(diào)低信心門檻值,以降低發(fā)生誤拒絕的情況。

于執(zhí)行完步驟S314之后,接著進(jìn)入步驟S303。處理器103根據(jù)目前聲音特征與關(guān)鍵詞組語(yǔ)音模型決定是否喚醒電子裝置100,流程如下所述,于步驟S303,處理器103透過匹配演算法比較目前聲音特征與關(guān)鍵詞組語(yǔ)音模型以得到信心分?jǐn)?shù)。接著,進(jìn)入步驟S304,處理器103判斷信心分?jǐn)?shù)是否大于或等于信心門檻值,來決定喚醒電子裝置100(步驟S305)或不喚醒電子裝置100(步驟S306),并判斷目前聲音特征為誤接受的情況(步驟S307)或誤拒絕的情況 (步驟S310)。當(dāng)目前聲音特征為誤接受的情況或誤拒絕的情況時(shí),儲(chǔ)存目前聲音特征(步驟S308或步驟S310)。

在本實(shí)施例中,當(dāng)儲(chǔ)存裝置101儲(chǔ)存有前一聲音特征時(shí),處理器103可透過目前聲音特征與前一聲音特征之間的相似度以及前一聲音特征所對(duì)應(yīng)的情況來調(diào)整信心門檻值。當(dāng)調(diào)高信心門檻值,則可減少誤接收的情況;當(dāng)調(diào)低信心門檻值,則可減少誤拒絕的情況。如此一來,透過調(diào)整信心門檻值可有效地改善誤接收及誤拒絕的情況以增加在預(yù)期的情況下成功喚醒電子裝置100的機(jī)率及正確率。

請(qǐng)參考圖1、3及9,圖9繪示根據(jù)本發(fā)明另一實(shí)施例的透過語(yǔ)音辨識(shí)喚醒電子裝置100的方法的流程圖。在此實(shí)施例中,處理器103可根據(jù)使用者互動(dòng)的情況調(diào)整信心門檻值。步驟S401至S410類似于圖3的步驟S101至S110。不同的是,在處理器103判斷出目前聲音特征對(duì)應(yīng)誤接受的情況,并儲(chǔ)存目前聲音特征至儲(chǔ)存裝置101(步驟S407及S408),或是處理器103判斷出目前聲音特征對(duì)應(yīng)誤拒絕的情況,并儲(chǔ)存目前聲音特征至儲(chǔ)存裝置101(步驟S409及S410)之后,進(jìn)入步驟S411。在步驟S411中,處理器103可根據(jù)使用者互動(dòng)的情況調(diào)整信心門檻值。例如,處理器103可判斷電子裝置100每次被喚醒之后是否又馬上被使用者關(guān)掉(也就是誤接受的情況),或者可判斷使用者是否每次都透過一相同的聲音內(nèi)容欲喚醒電子裝置100,但都未成功(也就是誤拒絕的情況)。若上述情況連續(xù)發(fā)生,很有可能是因?yàn)樾判拈T檻值太高或太低所造成,因此,處理器103可依據(jù)上述情況連續(xù)發(fā)生的次數(shù)是否過多來決定是否調(diào)整信心門檻值。

具體來說,處理器103判斷連續(xù)發(fā)生誤接受情況的次數(shù)或連續(xù)發(fā)生誤拒絕情況的次數(shù)是否大于一次數(shù)門檻值,來決定是否需要調(diào)整信心門檻值。次數(shù)門檻值可由設(shè)計(jì)者自行定義。當(dāng)連續(xù)誤接受的次數(shù)大于次數(shù)門檻值,表示很有可能是因?yàn)樾判拈T檻值太低而導(dǎo)致聲音特征容易喚醒電子裝置100,則處理器103調(diào)高信心門檻值,以降低發(fā)生誤接收的情況。當(dāng)連續(xù)誤拒絕的次數(shù)大于次數(shù)門檻值,表示很有可能是因?yàn)樾判拈T檻值太高而導(dǎo)致聲音特征不容易喚醒電子裝置100,則處理器103調(diào)低信心門檻值,以降低發(fā)生誤拒絕的情況。

如此一來,處理器103可依據(jù)使用者互動(dòng)的情況調(diào)整信心門檻值,以減少發(fā)生誤接受或誤拒絕的情況。

請(qǐng)參考圖1及10A及10B,圖10A及10B繪示根據(jù)本發(fā)明另一實(shí)施例的透過語(yǔ)音辨識(shí)啟動(dòng)電子裝置100的特定功能的方法的流程圖。在此實(shí)施例中,在電子裝置100被喚醒后,處理器103更可透過語(yǔ)音辨識(shí)啟動(dòng)電子裝置100的特定功能。也就是說,在電子裝置100被喚醒后,聲音接收裝置102更接收一目前聲音信號(hào)。接著,處理器103更判斷儲(chǔ)存裝置101中是否有儲(chǔ)存一前一聲音信號(hào)的一前一聲音特征。當(dāng)儲(chǔ)存裝置101中儲(chǔ)存有前一聲音信號(hào)的前一聲音特征時(shí),處理器103決定是否根據(jù)前一聲音特征啟動(dòng)電子裝置100的特定功能。當(dāng)儲(chǔ)存裝置101中未儲(chǔ)存有前一聲音信號(hào)的前一聲音特征時(shí),處理器103決定是否根據(jù)目前聲音特征啟動(dòng)電子裝置100的特定功能。

在步驟S501,喚醒電子裝置100。在一實(shí)施例中,使用者透過按下按鍵喚醒電子裝置100、或者透過觸碰觸控?zé)善羻拘央娮友b置100。在另一實(shí)施例中,使用者透過語(yǔ)音喚醒電子裝置100,透過語(yǔ)音喚醒電子裝置100的方法如前所述,在此不多贅述。

在步驟S502,聲音接收裝置102接收一目前聲音信號(hào)。使用者可說出特定的語(yǔ)音指令以啟動(dòng)電子裝置100的特定功能。舉例來說,特定的語(yǔ)音指令至少可包括“配對(duì)(Pairing)”、“檢查電池(Check battery)”及“是否連線(Am I connected)”其中之一。目前聲音信號(hào)即為使用者所說的特定語(yǔ)音指令所對(duì)應(yīng)的聲音信號(hào)。于步驟S503,處理器103擷取目前聲音信號(hào)的一目前聲音特征。

接著進(jìn)入步驟S504,處理器103判斷儲(chǔ)存裝置101中是否有儲(chǔ)存一前一聲音信號(hào)的一前一聲音特征。當(dāng)儲(chǔ)存裝置101儲(chǔ)存有前一聲音特征時(shí),則進(jìn)入步驟S505;當(dāng)儲(chǔ)存裝置101未儲(chǔ)存有前一聲音特征時(shí),則進(jìn)入步驟S508。

在步驟S505,處理器103計(jì)算目前聲音特征與前一聲音特征之間的一相似度。在計(jì)算出相似度之后,接著進(jìn)入步驟S506,處理器103判斷目前聲音特征與前一聲音特征之間的相似度是否大于或等于一相似度門檻值。當(dāng)相似度大于或等于相似度門檻值,則進(jìn)入步驟S507;當(dāng)相似度小于相似度門檻值,則進(jìn)入步驟S508。

在步驟S507,處理器103根據(jù)前一聲音特征對(duì)應(yīng)誤接受的情況或誤拒絕的情況,決定是否啟動(dòng)電子裝置100的特定功能。當(dāng)前一聲音特征為對(duì)應(yīng)到誤接受的情況,且目前聲音特征與前一聲音特征之間的大于或等于相似度門檻值 時(shí),則處理器103不啟動(dòng)電子裝置100的特定功能。由于前一聲音特征系對(duì)應(yīng)到誤接受的情況,表示使用者前一次說話的內(nèi)容并非要啟動(dòng)電子裝置100的特定功能,但是卻啟動(dòng)電子裝置100的特定功能。因此,當(dāng)前一聲音特征為對(duì)應(yīng)到誤接受的情況且使用者目前說話的內(nèi)容與前一次說話的內(nèi)容類似,則處理器103可判斷使用者目前并非想要啟動(dòng)電子裝置100的特定功能,故不啟動(dòng)電子裝置100的特定功能。當(dāng)前一聲音特征為對(duì)應(yīng)到誤拒絕的情況,且目前聲音特征與前一聲音特征之間的大于或等于相似度門檻值時(shí),則處理器103啟動(dòng)電子裝置100的特定功能。由于前一聲音特征系對(duì)應(yīng)到誤拒絕的情況,表示使用者前一次說話的內(nèi)容事實(shí)上想要啟動(dòng)電子裝置100的特定功能,但是卻未成功啟動(dòng)電子裝置100的特定功能。因此,當(dāng)前一聲音特征為對(duì)應(yīng)到誤拒絕的情況且使用者目前說話的內(nèi)容與前一次說話的內(nèi)容類似,則處理器103可判斷使用者目前想啟動(dòng)電子裝置100的特定功能,故啟動(dòng)電子裝置100的特定功能。舉例來說,當(dāng)目前聲音特征所對(duì)應(yīng)的特定的語(yǔ)音指令為“配對(duì)(Pairing)”,前一聲音特征為對(duì)應(yīng)到誤拒絕的情況,且目前聲音特征與前一聲音特征之間的大于或等于相似度門檻值時(shí),則處理器103根據(jù)目前聲音特征啟動(dòng)確認(rèn)電子裝置100與其他電子裝置的無(wú)線通訊配對(duì)是否成功的功能。

在步驟S508,處理器103透過匹配演算法比較目前聲音特征與關(guān)鍵詞組語(yǔ)音模型以得到信心分?jǐn)?shù)。也就是說,當(dāng)儲(chǔ)存裝置101未儲(chǔ)存有前一聲音特征或是目前聲音特征與前一聲音特征之間的相似度低,處理器103不需根據(jù)前一聲音特征來決定是否啟動(dòng)電子裝置100的特定功能。處理器103系將目前聲音特征與關(guān)鍵詞組語(yǔ)音模型比較,決定是否根據(jù)目前聲音特征啟動(dòng)電子裝置100的特定功能。

在步驟S508得到信心分?jǐn)?shù)之后,接著進(jìn)入步驟S509,處理器103判斷信心分?jǐn)?shù)是否大于或等于信心門檻值。當(dāng)信心分?jǐn)?shù)大于或等于信心門檻值,則進(jìn)入步驟S513;當(dāng)信心分?jǐn)?shù)小于信心門檻值,則進(jìn)入步驟S510。

在步驟S513,處理器103根據(jù)目前聲音特征啟動(dòng)電子裝置100的特定功能。舉例來說,處理器103根據(jù)目前聲音特征至少啟動(dòng)確認(rèn)電子裝置100與其他電子裝置的無(wú)線通訊配對(duì)是否成功的功能、啟動(dòng)檢查電子裝置100的電池電量的功能,或啟動(dòng)檢查電子裝置100的網(wǎng)路是否連線的功能之一。更清楚來說,假設(shè)聲音接收裝置102接收到的目前聲音特征所對(duì)應(yīng)的特定的語(yǔ)音指令為“配 對(duì)(Pairing)”,則處理器103根據(jù)目前聲音特征啟動(dòng)確認(rèn)電子裝置100與其他電子裝置的無(wú)線通訊配對(duì)是否成功的功能。假設(shè)聲音接收裝置102接收到的目前聲音特征所對(duì)應(yīng)的特定的語(yǔ)音指令為“檢查電池(Check battery)”,則處理器103根據(jù)目前聲音特征啟動(dòng)檢查電子裝置100的電池電量的功能。假設(shè)聲音接收裝置102接收到的目前聲音特征所對(duì)應(yīng)的特定的語(yǔ)音指令為“是否連線(Am I connected)”,則處理器103根據(jù)目前聲音特征啟動(dòng)檢查電子裝置100的網(wǎng)路是否連線的功能。

接著進(jìn)入步驟S514,處理器103判斷目前聲音特征是否對(duì)應(yīng)誤接受的情況。誤接受的情況為處理器103在非預(yù)期的情況下啟動(dòng)電子裝置100的特定功能。其判斷方式可包括在處理器103透過目前聲音特征啟動(dòng)電子裝置100的特定功能后,使用者是否于特定時(shí)間內(nèi)關(guān)掉該特定功能。若使用者于特定時(shí)間內(nèi)關(guān)掉該特定功能,表示使用者并不想啟動(dòng)該特定功能,但是該特定功能卻被目前聲音特征所啟動(dòng),故可判斷為誤接受的情況。接著,進(jìn)入步驟S515,處理器103儲(chǔ)存目前聲音特征至儲(chǔ)存裝置101并記錄目前聲音特征為對(duì)應(yīng)到誤接受的情況。

在步驟S510,處理器103不根據(jù)目前聲音特征啟動(dòng)電子裝置100的特定功能。接著進(jìn)入步驟S511,處理器103判斷目前聲音特征是否對(duì)應(yīng)誤拒絕的情況。誤拒絕的情況為使用者欲透過目前聲音啟動(dòng)電子裝置100的特定功能,但卻無(wú)法成功啟動(dòng)該特定功能。其判斷方式可包括在目前聲音特征未啟動(dòng)電子裝置100的特定功能,且目前聲音特征與關(guān)鍵詞組語(yǔ)音模型比較而得到的信心分?jǐn)?shù)小于信心門檻值且其差值在預(yù)定范圍內(nèi)。在這種情況中,由于信心分?jǐn)?shù)小于信心門檻值且其差值在預(yù)定范圍內(nèi)(也就是信心分?jǐn)?shù)很接近信心門檻值),代表使用者想要透過目前聲音啟動(dòng)電子裝置100的特定功能,但是電子裝置100的特定功能卻沒有被目前聲音特征所啟動(dòng),故可判斷為誤拒絕的情況。接著,進(jìn)入步驟S512,處理器103儲(chǔ)存目前聲音特征至儲(chǔ)存裝置101并記錄目前聲音特征為對(duì)應(yīng)到誤拒絕的情況。

在此實(shí)施例中,語(yǔ)音辨識(shí)可被應(yīng)用在啟動(dòng)電子裝置100的特定功能。在電子裝置100被喚醒之后,使用者可透過語(yǔ)音辨識(shí)啟動(dòng)電子裝置100的特定功能,處理器103可根據(jù)目前聲音特征啟動(dòng)電子裝置100的特定功能,并可記錄該目前聲音特征是因誤接受的情況而啟動(dòng)該特定功能,或是誤拒絕的情況而未啟動(dòng) 該特定功能。因此,當(dāng)電子裝置100接收到使用者下一次聲音時(shí),若先前的聲音特征已被儲(chǔ)存,則處理器103可依據(jù)下一次聲音的聲音特征與儲(chǔ)存的聲音特征的相似程度,以及儲(chǔ)存的聲音特征所對(duì)應(yīng)的情況,來決定是否啟動(dòng)電子裝置100的特定功能,不需透過比較關(guān)鍵詞組語(yǔ)音模型,故可提升透過語(yǔ)音啟動(dòng)電子裝置100的特定功能的效率。

本發(fā)明上述實(shí)施例所公開的透過語(yǔ)音辨識(shí)喚醒電子裝置的方法,當(dāng)儲(chǔ)存裝置儲(chǔ)存有前一聲音特征時(shí),可根據(jù)前一聲音特征對(duì)應(yīng)誤接受的情況或誤拒絕的情況,以及目前聲音特征與前一聲音特征之間的相似度決定是否喚醒電子裝置,因此可提高喚醒電子裝置的效率。另外,本發(fā)明亦可根據(jù)前一聲音特征對(duì)應(yīng)誤接受的情況或誤拒絕的情況,以及目前聲音特征與前一聲音特征之間的相似度來調(diào)整信心門檻值,以減少誤接受的情況或誤拒絕的情況發(fā)生的機(jī)率,不需要線上調(diào)整關(guān)鍵詞組語(yǔ)音模型或預(yù)先訓(xùn)練關(guān)鍵詞組語(yǔ)音模型即可改善誤接受的情況或誤拒絕的情況,因此調(diào)整的復(fù)雜度低,且可有效降低誤接受或誤拒絕的情況以提高成功喚醒電子裝置的機(jī)率及正確率。

綜上所述,雖然本發(fā)明已以較佳實(shí)施例公開如上,但其并非用以限定本發(fā)明。本發(fā)明所屬技術(shù)領(lǐng)域的技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可作各種的更動(dòng)與修改。因此,本發(fā)明的保護(hù)范圍當(dāng)視后附的權(quán)利要求書保護(hù)范圍所界定者為準(zhǔn)。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
主站蜘蛛池模板: 寿光市| 桃园市| 博野县| 汉阴县| 阿勒泰市| 霍林郭勒市| 肃宁县| 习水县| 中方县| 衡山县| 晋州市| 惠来县| 陇川县| 本溪市| 远安县| 都昌县| 揭西县| 怀远县| 繁昌县| 顺义区| 屏山县| 周宁县| 中方县| 永川市| 新蔡县| 五常市| 轮台县| 共和县| 镇雄县| 墨竹工卡县| 微山县| 比如县| 宁波市| 定安县| 昭苏县| 永城市| 井陉县| 屏南县| 芷江| 新巴尔虎右旗| 马关县|