麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

基于語音交互的搜索方法和裝置與流程

文檔序號:11097729閱讀:356來源:國知局
基于語音交互的搜索方法和裝置與制造工藝

本發(fā)明涉及互聯(lián)網(wǎng)技術領域,尤其涉及一種基于語音交互的搜索方法和裝置。



背景技術:

隨著互聯(lián)網(wǎng)技術的不斷發(fā)展,鍵盤的輸入成本也隨之不斷提升。語音搜索,基于強大的語音識別能力,支持通過語音命令快速發(fā)起搜索,讓搜索更快捷、更直接、更智能。相關技術中,傳統(tǒng)的語音搜索以接收指令、反饋指令模式,在每次搜索時,該次搜索與上一次搜索和下一次搜索均獨立,即,在同一檢索序列中,搜索間均無關聯(lián)。

這種方式下,若用戶在對當前的檢索詞進行相關的追問或者補充搜索時,需重述需求主體并給出完整的檢索需求表達,不能夠結合語音搜索的上下文信息進行搜索,在語音搜索表達式簡化的情況下搜索精準度不高。



技術實現(xiàn)要素:

本發(fā)明旨在至少在一定程度上解決相關技術中的技術問題之一。

為此,本發(fā)明的一個目的在于提出一種基于語音交互的搜索方法,能夠結合語音搜索的上下文信息進行搜索,提升搜索精準度,提升用戶搜索體驗度。

本發(fā)明的另一個目的在于提出一種基于語音交互的搜索裝置。

本發(fā)明的又一個目的在于提出一種基于語音交互的搜索裝置。

本發(fā)明的另一個目的在于提出一種非臨時性計算機可讀存儲介質。

本發(fā)明的另一個目的在于提出一種計算機程序產(chǎn)品。

為達到上述目的,本發(fā)明第一方面實施例提出的基于語音交互的搜索方法,包括:根據(jù)用戶提供的用于搜索的語音數(shù)據(jù)獲取第一檢索詞,并獲取為所述第一檢索詞的上文信息的多個第二檢索詞;根據(jù)所述第一檢索詞的第一分詞結果和每個第二檢索詞的第二分詞結果生成多種分詞組合;根據(jù)每種分詞組合的相關性評分,從所述多種分詞組合中選擇目標分詞組合并作為第三檢索詞;根據(jù)所述第三檢索詞進行搜索。

本發(fā)明第一方面實施例提出的基于語音交互的搜索方法,通過根據(jù)第一檢索詞的第一分詞結果和每個第二檢索詞的第二分詞結果生成多種分詞組合;根據(jù)每種分詞組合的相關性評分,從多種分詞組合中選擇目標分詞組合并作為第三檢索詞;根據(jù)第三檢索詞進行搜索,能夠結合語音搜索的上下文信息進行搜索,提升搜索精準度,提升用戶搜索體驗度。

為達到上述目的,本發(fā)明第二方面實施例提出的基于語音交互的搜索裝置,包括:第一獲取模塊,用于根據(jù)用戶提供的用于搜索的語音數(shù)據(jù)獲取第一檢索詞;第二獲取模塊,用于獲取為所述第一檢索詞的上文信息的多個第二檢索詞;生成模塊,用于根據(jù)所述第一檢索詞的第一分詞結果和每個第二檢索詞的第二分詞結果生成多種分詞組合;選擇模塊,用于根據(jù)每種分詞組合的相關性評分,從所述多種分詞組合中選擇目標分詞組合并作為第三檢索詞;搜索模塊,用于根據(jù)所述第三檢索詞進行搜索。

本發(fā)明第二方面實施例提出的基于語音交互的搜索裝置,通過根據(jù)第一檢索詞的第一分詞結果和每個第二檢索詞的第二分詞結果生成多種分詞組合;根據(jù)每種分詞組合的相關性評分,從多種分詞組合中選擇目標分詞組合并作為第三檢索詞;根據(jù)第三檢索詞進行搜索,能夠結合語音搜索的上下文信息進行搜索,提升搜索精準度,提升用戶搜索體驗度。

為達到上述目的,本發(fā)明第三方面實施例提出的基于語音交互的搜索裝置,其特征在于,包括:

處理器;

用于存儲處理器可執(zhí)行指令的存儲器;

其中,所述處理器被配置為:

根據(jù)用戶提供的用于搜索的語音數(shù)據(jù)獲取第一檢索詞,并獲取為所述第一檢索詞的上文信息的多個第二檢索詞;

根據(jù)所述第一檢索詞的第一分詞結果和每個第二檢索詞的第二分詞結果生成多種分詞組合;

根據(jù)每種分詞組合的相關性評分,從所述多種分詞組合中選擇目標分詞組合并作為第三檢索詞;

根據(jù)所述第三檢索詞進行搜索。

本發(fā)明第三方面實施例提出的基于語音交互的搜索裝置,通過根據(jù)第一檢索詞的第一分詞結果和每個第二檢索詞的第二分詞結果生成多種分詞組合;根據(jù)每種分詞組合的相關性評分,從多種分詞組合中選擇目標分詞組合并作為第三檢索詞;根據(jù)第三檢索詞進行搜索,能夠結合語音搜索的上下文信息進行搜索,提升搜索精準度,提升用戶搜索體驗度。

為達到上述目的,本發(fā)明第四方面實施例提出的非臨時性計算機可讀存儲介質,當所述存儲介質中的指令由移動終端的處理器被執(zhí)行時,使得移動終端能夠執(zhí)行一種基于語音交互的搜索方法,所述方法包括:

根據(jù)用戶提供的用于搜索的語音數(shù)據(jù)獲取第一檢索詞,并獲取為所述第一檢索詞的上文信息的多個第二檢索詞;

根據(jù)所述第一檢索詞的第一分詞結果和每個第二檢索詞的第二分詞結果生成多種分詞組合;

根據(jù)每種分詞組合的相關性評分,從所述多種分詞組合中選擇目標分詞組合并作為第三檢索詞;

根據(jù)所述第三檢索詞進行搜索。

本發(fā)明第四方面實施例提出的非臨時性計算機可讀存儲介質,通過根據(jù)第一檢索詞的第一分詞結果和每個第二檢索詞的第二分詞結果生成多種分詞組合;根據(jù)每種分詞組合的相關性評分,從多種分詞組合中選擇目標分詞組合并作為第三檢索詞;根據(jù)第三檢索詞進行搜索,能夠結合語音搜索的上下文信息進行搜索,提升搜索精準度,提升用戶搜索體驗度。

為達到上述目的,本發(fā)明第五方面實施例提出的計算機程序產(chǎn)品,當所述計算機程序產(chǎn)品中的指令處理器執(zhí)行時,執(zhí)行一種基于語音交互的搜索方法,所述方法包括:

根據(jù)用戶提供的用于搜索的語音數(shù)據(jù)獲取第一檢索詞,并獲取為所述第一檢索詞的上文信息的多個第二檢索詞;

根據(jù)所述第一檢索詞的第一分詞結果和每個第二檢索詞的第二分詞結果生成多種分詞組合;

根據(jù)每種分詞組合的相關性評分,從所述多種分詞組合中選擇目標分詞組合并作為第三檢索詞;

根據(jù)所述第三檢索詞進行搜索。

本發(fā)明第五方面實施例提出的計算機程序產(chǎn)品,通過根據(jù)第一檢索詞的第一分詞結果和每個第二檢索詞的第二分詞結果生成多種分詞組合;根據(jù)每種分詞組合的相關性評分,從多種分詞組合中選擇目標分詞組合并作為第三檢索詞;根據(jù)第三檢索詞進行搜索,能夠結合語音搜索的上下文信息進行搜索,提升搜索精準度,提升用戶搜索體驗度。

本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。

附圖說明

本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結合附圖對實施例的描述中將變得明顯和容易理解,其中:

圖1是本發(fā)明一實施例提出的基于語音交互的搜索方法的流程示意圖;

圖2是本發(fā)明另一實施例提出的基于語音交互的搜索方法的流程示意圖;

圖3是本發(fā)明另一實施例提出的基于語音交互的搜索方法的流程示意圖;

圖4是本發(fā)明實施例中語音搜索界面示意圖;

圖5是本發(fā)明一實施例提出的基于語音交互的搜索裝置的結構示意圖;

圖6是本發(fā)明另一實施例提出的基于語音交互的搜索裝置的結構示意圖。

具體實施方式

下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。相反,本發(fā)明的實施例包括落入所附加權利要求書的精神和內涵范圍內的所有變化、修改和等同物。

圖1是本發(fā)明一實施例提出的基于語音交互的搜索方法的流程示意圖。該基于語音交互的搜索方法被配置為基于語音交互的搜索裝置中來舉例說明。該基于語音交互的搜索方法可以應用在電子設備的搜索引擎中,搜索引擎是指能夠接收用戶輸入的搜索信息,并從互聯(lián)網(wǎng)上搜集與搜索信息相關信息,在對信息進行組織和處理后,為用戶提供檢索服務,將與搜索信息相關信息展示給用戶的系統(tǒng)。

其中,電子設備例如為個人電腦(Personal Computer,PC),云端設備或者移動設備,移動設備例如智能手機,或者平板電腦等。

參見圖1,該基于語音交互的搜索方法包括:

S11:根據(jù)用戶提供的用于搜索的語音數(shù)據(jù)獲取第一檢索詞,并獲取為第一檢索詞的上文信息的多個第二檢索詞。

傳統(tǒng)的語音搜索以接收指令、反饋指令模式,在每次搜索時,該次搜索與上一次搜索和下一次搜索均獨立,即,在同一檢索序列中,搜索間均無關聯(lián),若用戶在對當前的檢索詞進行相關的追問或者補充搜索時,需重述需求主體并給出完整的檢索需求表達,不能夠結合語音搜索的上下文信息進行搜索,在語音搜索表達式簡化的情況下搜索精準度不高。

而本發(fā)明的實施例中,通過搜索上文和當前搜索的深層需求理解,若歷史搜索詞中包含第一檢索詞的第一分詞結果和第二檢索詞的第二分詞結果的初始分詞組合時,則根據(jù)初始分詞組合進行搜索,能夠有效提升搜索效率;若歷史搜索詞中無初始分詞組合,則根據(jù)第一檢索詞的類型信息將第一分詞和第二分詞進行組合處理,得到多種分詞組合,根據(jù)相關算法計算上述每種分詞組合的相關性評分,將評分值最大的分詞組合作為最終的檢索詞進行搜索,能夠結合語音搜索的上下文信息進行搜索,提升搜索精準度,提升用戶搜索體驗度。

在本發(fā)明的實施例中,可以接收用戶提供的用于搜索的語音數(shù)據(jù),獲取與語音數(shù)據(jù)對應的第一文本,并將對應的第一文本作為第一檢索詞。

可選地,用戶可以點擊搜索引擎搜索框中的麥克風按鈕,輸入語音數(shù)據(jù),搜索引擎中的語音采集模塊采集到該語音數(shù)據(jù),獲取與語音數(shù)據(jù)對應的第一文本,并將對應的第一文本作為第一檢索詞。

可以理解的是,用戶可以對當前搜索結果進行相關地追問搜索或者補充搜索,當前第一檢索詞的上文信息可以為多個。

例如,用戶在搜索引擎中輸入的語音數(shù)據(jù)為“美國”,搜索結果展示頁面提供美國相關信息,當用戶想查詢美國的人口數(shù)據(jù)時,輸入語音數(shù)據(jù)“人口多少”,結合上文信息,可知,第一檢索詞為“人口多少”,第二檢索詞為“美國”,或者,用戶可以繼續(xù)追問“首都是哪里”,結合上文信息可知,第一檢索詞為“首都是哪里”,第二檢索詞為:“美國”和“人口多少”。

S12:根據(jù)第一檢索詞的第一分詞結果和每個第二檢索詞的第二分詞結果生成多種分詞組合。

在本發(fā)明的實施例中,可以采用相關技術對第一檢索詞和第二檢索詞進行切詞處理,獲得第一檢索詞和第二檢索詞的詞法信息,即,得到第一分詞結果和第二分詞結果。

需要說明的是,對于歷史未出現(xiàn)過的第一檢索詞,根據(jù)上下文特征,通過切詞處理,可以過濾掉首位相同的分詞,且可以過濾掉拼音相同的模糊音。

在本發(fā)明的實施例中,可以判斷歷史搜索詞中是否存在包含第一分詞結果和第二分詞結果的初始分詞組合;若存在包含第一分詞結果和第二分詞結果的初始分詞組合,則將初始分詞組合作為生成的分詞組合;若不存在包含第一分詞結果和第二分詞結果的初始分詞組合,則提取第一分詞結果中每個第一分詞的第一特征信息,并提取第二分詞結果中每個第二分詞的第二特征信息;根據(jù)第一特征信息和第二特征信息,確定第一檢索詞的類型信息;根據(jù)第一檢索詞的類型信息將第一分詞和第二分詞進行組合處理,得到多種分詞組合。

一些實施例中,參見圖2,步驟S12具體包括:

S21:判斷歷史搜索詞中是否存在包含第一分詞結果和第二分詞結果的初始分詞組合,若是,執(zhí)行S22,否則,執(zhí)行S23。

可選地,判斷歷史搜索詞中是否存在包含第一分詞結果和第二分詞結果的初始分詞組合,在歷史搜索詞中存在包含第一分詞結果和第二分詞結果的初始分詞組合時,直接將初始分詞組合作為生成的分詞組合,根據(jù)生成的分詞組合進行搜索,能夠有效提升搜索效率;在歷史搜索詞中不存在包含第一分詞結果和第二分詞結果的初始分詞組合時,執(zhí)行S23。

S22:將初始分詞組合作為生成的分詞組合。

可選地,在歷史搜索詞中存在包含第一分詞結果和第二分詞結果的初始分詞組合時,直接將初始分詞組合作為生成的分詞組合,根據(jù)生成的分詞組合進行搜索,能夠有效提升搜索效率。

S23:提取第一分詞結果中每個第一分詞的第一特征信息,并提取第二分詞結果中每個第二分詞的第二特征信息。

在本發(fā)明的實施例中,第一特征信息/第二特征信息包括以下至少之一:第一分詞/第二分詞的實體類型、權重、用戶歷史搜索頻次、用戶歷史搜索后的點擊頻次、泛口語化的懲罰權重,以及編輯距離。

其中,第一分詞/第二分詞的實體類型為第一分詞/第二分詞的實體信息,例如人名、地名等。

第一分詞/第二分詞的權重的權值大小描述其在第一檢索詞/第二檢索詞中的重要性。

用戶歷史搜索頻次用于確定后續(xù)步驟中的每種分詞組合的相關性評分。

泛口語化的懲罰權重表示對第一分詞/第二分詞進行口語化泛化的歸一處理。由于語音數(shù)據(jù)中存在大量口語化表述,例如“我想搜……”“查一下……是啥意思”,因此需要進行口語化泛化的歸一處理。具體地,根據(jù)人工構建的口語化詞表對第一分詞/第二分詞進行口語化泛化的歸一處理,口語化詞表中每個分詞對應一個懲罰權重,懲罰權重越大,表明分詞的口語話程度越高。

編輯距離為一種常見的相似度計算方法。

可選地,可以提取第一分詞結果中每個第一分詞的第一特征信息,并提取第二分詞結果中每個第二分詞的第二特征信息,以根據(jù)第一特征信息和第二特征信息確定第一檢索詞的類型信息。

S24:根據(jù)第一特征信息和第二特征信息,確定第一檢索詞的類型信息。

其中,類型信息包括:第一檢索詞為第二檢索詞的補充搜索的第一類型信息、第一檢索詞為第二檢索詞的追問搜索的第二類型信息。

在本發(fā)明的實施例中,第一類型信息為:主體語義不變,需求強相關,例如,“天天酷跑下載”,“天天酷跑”為主體詞,“下載”為需求詞;第二類型信息為:主體語義變化,需求語義不變。

可選地,可以借助實體屬性知識庫識別第一檢索詞和第二檢索詞的實體屬性成分。需要說明的是,自然語言中同種意思可以用不同的表述方式,實體屬性描述中亦是如此,即同一個屬性需求有不同的表述方式,例如,“人口有多少”、“有多少人口”、“人口是多少”都是“人口”屬性需求的不同表述,因此需要通過主干抽取技術從不同的表述方式中抽取相同的需求主干。

具體地,通過判斷當前第一檢索詞的實體屬性信息和上文信息的多個第二檢索詞的實體屬性的相關性,即根據(jù)第一特征信息和第二特征信息,進而判斷第一檢索詞是屬性變更還是實體變更。

例如,當?shù)谝粰z索詞為:“那體重呢?”,第二檢索詞為:“劉德華的身高”時,通過實體屬性匹配,獲得實體為“劉德華”,而“身高”“體重”均為“劉德華”的屬性,因此,可知第一檢索詞的類型信息為:屬性變更,主體語義不變,即第一類型信息。

或者,當?shù)谝粰z索詞為:“那姚明呢?”,第二檢索詞為:“劉德華的身高”時,通過實體屬性匹配,獲得實體為“劉德華”“姚明”,而他們共同的屬性為“身高”,因此,可知第一檢索詞的類型信息為:主體語義變化,需求語義不變,即第二類型信息。

S25:根據(jù)第一檢索詞的類型信息將第一分詞和第二分詞進行組合處理,得到多種分詞組合。

作為一種示例,當?shù)谝粰z索詞為第二檢索詞的追問搜索的第二類型信息時,例如,當?shù)谝粰z索詞為:“那法國的呢?”,第二檢索詞為:“美國的首都是哪里”時,得到的多種分詞組合可以如表1所示。

表1

本實施例中,通過在歷史搜索詞中存在包含第一分詞結果和第二分詞結果的初始分詞組合時,將初始分詞組合作為生成的分詞組合,能夠有效提升搜索效率,通過在歷史搜索詞中不存在包含第一分詞結果和第二分詞結果的初始分詞組合時,根據(jù)第一特征信息和第二特征信息,確定第一檢索詞的類型信息,根據(jù)第一檢索詞的類型信息將第一分詞和第二分詞進行組合處理,得到多種分詞組合,以便于后續(xù)對相關性評分最大的分詞組合進行搜索,能夠使用戶自如地表達檢索需求,使得語音搜索交互體驗更具智能化,提升搜索精準度,提升用戶搜索體驗度。

一些實施例中,在步驟S12后,還包括:

S31:確定多種分詞組合中,每種分詞組合在用戶搜索歷史中的出現(xiàn)頻次,以及與分詞組合對應的第一分詞的第一用戶歷史搜索頻次和對應的第二分詞的第二用戶歷史搜索頻次。

可選地,可以假設分詞組合在用戶搜索歷史中的出現(xiàn)頻次為Nxyi,與分詞組合對應的第一分詞的第一用戶歷史搜索頻次為Nxi,與分詞組合對應的第二分詞的第二用戶歷史搜索頻次為Nyi,其中,i=1,2,…,M,M為分詞組合的個數(shù),用戶歷史總的搜索頻次為N。

S32:根據(jù)出現(xiàn)頻次、第一用戶歷史搜索頻次,以及第二用戶歷史搜索頻次確定相關性評分。

在本發(fā)明的實施例中,可以根據(jù)出現(xiàn)頻次Nxyi、第一用戶歷史搜索頻次Nxi、第二用戶歷史搜索頻次Nyi,以及預設公式確定相關性評分Corr(i),其中,預設公式為:

Corr(i)=Math.log10(N/Nxi)*Math.log10(N/Nyi)*Nxyi/(Nxi+Nyi-Nxyi);

通過根據(jù)出現(xiàn)頻次、第一用戶歷史搜索頻次,以及第二用戶歷史搜索頻次確定相關性評分,以便于后續(xù)對相關性評分最大的分詞組合進行搜索,能夠使用戶自如地表達檢索需求,使得語音搜索交互體驗更具智能化,提升搜索精準度,提升用戶搜索體驗度。

S13:根據(jù)每種分詞組合的相關性評分,從多種分詞組合中選擇目標分詞組合并作為第三檢索詞。

在本發(fā)明的實施例中,可以從多種分詞組合中選擇相關性評分最高的分詞組合作為目標分詞組合,并將目標分詞組合作為第三檢索詞。

例如,當?shù)谝粰z索詞為第二檢索詞的追問搜索的第二類型信息,且第一檢索詞為:“那法國的呢?”,第二檢索詞為:“美國的首都是哪里”時,根據(jù)預設公式得到表1中每種分詞組合的相關性評分如表2所示(第一檢索詞為第二檢索詞的補充搜索的第一類型信息的處理過程類似,此處不再贅述)。

表2

可以從多種分詞組合中選擇相關性評分最高的分詞組合:法國的首都是哪里,作為目標分詞組合,并將目標分詞組合作為第三檢索詞,以根據(jù)第三檢索詞進行搜索。

S14:根據(jù)第三檢索詞進行搜索。

作為一種示例,參見圖4,圖4為本發(fā)明實施例中語音搜索界面示意圖,當用戶輸入的語音數(shù)據(jù)為“美國”(第二檢索詞)時,搜索結果展示頁面提供美國相關信息,當用戶想查詢美國的人口數(shù)據(jù)時,只需直接輸入語音數(shù)據(jù)“人口多少”(第一檢索詞),結合上文信息,本實施例能夠自動識別第一檢索詞為第二檢索詞的補充搜索的第一類型信息,得到第三檢索詞為“美國人口多少”,并觸發(fā)搜索結果,滿足用戶需求。

同理,用戶可以繼續(xù)追問“首都是哪里”(第一檢索詞),結合上文信息可知,第二檢索詞為:“美國”和“人口多少”,本實施例能夠自動識別第一檢索詞為第二檢索詞的補充搜索的第一類型信息,得到第三檢索詞為“美國首都是哪里”,展示搜索結果。

進一步地,為了滿足用戶的口語化語音表述,用戶還可以自然地追問“那法國的呢”,結合上文信息,本實施例能夠自動識別出第一檢索詞為第二檢索詞的追問搜索的第二類型信息,得到第三檢索詞為“法國的首都是哪里”,展示搜索結果。

本實施例中,通過根據(jù)第一檢索詞的第一分詞結果和每個第二檢索詞的第二分詞結果生成多種分詞組合;根據(jù)每種分詞組合的相關性評分,從多種分詞組合中選擇目標分詞組合并作為第三檢索詞;根據(jù)第三檢索詞進行搜索,能夠結合語音搜索的上下文信息進行搜索,提升搜索精準度,提升用戶搜索體驗度。

圖5是本發(fā)明一實施例提出的基于語音交互的搜索裝置的結構示意圖。該基于語音交互的搜索裝置500可以通過軟件、硬件或者兩者的結合來實現(xiàn)。

參見圖5,該基于語音交互的搜索裝置500可以包括:第一獲取模塊510、第二獲取模塊520、生成模塊530、選擇模塊540,以及搜索模塊550。其中,

第一獲取模塊510,用于根據(jù)用戶提供的用于搜索的語音數(shù)據(jù)獲取第一檢索詞。

可選地,第一獲取模塊510具體用于:接收用戶提供的用于搜索的語音數(shù)據(jù),獲取與語音數(shù)據(jù)對應的第一文本,并將對應的第一文本作為第一檢索詞。

第二獲取模塊520,用于獲取為第一檢索詞的上文信息的多個第二檢索詞。

生成模塊530,用于根據(jù)第一檢索詞的第一分詞結果和每個第二檢索詞的第二分詞結果生成多種分詞組合。

選擇模塊540,用于根據(jù)每種分詞組合的相關性評分,從多種分詞組合中選擇目標分詞組合并作為第三檢索詞。

可選地,選擇模塊540具體用于:從多種分詞組合中選擇相關性評分最高的分詞組合作為目標分詞組合,并將目標分詞組合作為第三檢索詞。

搜索模塊550,用于根據(jù)第三檢索詞進行搜索。

一些實施例中,參見圖6,該基于語音交互的搜索裝置500還可以包括:

可選地,生成模塊530包括:

判斷子模塊531,用于判斷歷史搜索詞中是否存在包含第一分詞結果和第二分詞結果的初始分詞組合。

第一處理子模塊532,用于在存在包含第一分詞結果和第二分詞結果的初始分詞組合時,將初始分詞組合作為生成的分詞組合。

提取子模塊533,用于在不存在包含第一分詞結果和第二分詞結果的初始分詞組合時,提取第一分詞結果中每個第一分詞的第一特征信息,并提取第二分詞結果中每個第二分詞的第二特征信息。

可選地,第一特征信息/第二特征信息包括以下至少之一:

第一分詞/第二分詞的實體類型、權重、用戶歷史搜索頻次、用戶歷史搜索后的點擊頻次、泛口語化的懲罰權重,以及編輯距離。

確定子模塊534,用于根據(jù)第一特征信息和第二特征信息,確定第一檢索詞的類型信息,其中,類型信息包括:第一檢索詞為第二檢索詞的補充搜索的第一類型信息、第一檢索詞為第二檢索詞的追問搜索的第二類型信息。

第二處理子模塊535,用于根據(jù)第一檢索詞的類型信息將第一分詞和第二分詞進行組合處理,得到多種分詞組合。

第一確定模塊560,用于確定多種分詞組合中,每種分詞組合在用戶搜索歷史中的出現(xiàn)頻次,以及與分詞組合對應的第一分詞的第一用戶歷史搜索頻次和對應的第二分詞的第二用戶歷史搜索頻次。

第二確定模塊570,用于根據(jù)出現(xiàn)頻次、第一用戶歷史搜索頻次,以及第二用戶歷史搜索頻次確定相關性評分。

需要說明的是,前述圖1-圖4實施例中對基于語音交互的搜索方法實施例的解釋說明也適用于該實施例的基于語音交互的搜索裝置500,其實現(xiàn)原理類似,此處不再贅述。

本實施例中,通過根據(jù)第一檢索詞的第一分詞結果和每個第二檢索詞的第二分詞結果生成多種分詞組合;根據(jù)每種分詞組合的相關性評分,從多種分詞組合中選擇目標分詞組合并作為第三檢索詞;根據(jù)第三檢索詞進行搜索,能夠結合語音搜索的上下文信息進行搜索,提升搜索精準度,提升用戶搜索體驗度。

需要說明的是,在本發(fā)明的描述中,術語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對重要性。此外,在本發(fā)明的描述中,除非另有說明,“多個”的含義是兩個或兩個以上。

流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用于實現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實施方式的范圍包括另外的實現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,這應被本發(fā)明的實施例所屬技術領域的技術人員所理解。

應當理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實現(xiàn)。在上述實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實現(xiàn)。例如,如果用硬件來實現(xiàn),和在另一實施方式中一樣,可用本領域公知的下列技術中的任一項或他們的組合來實現(xiàn):具有用于對數(shù)據(jù)信號實現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場可編程門陣列(FPGA)等。

本技術領域的普通技術人員可以理解實現(xiàn)上述實施例方法攜帶的全部或部分步驟是可以通過程序來指令相關的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質中,該程序在執(zhí)行時,包括方法實施例的步驟之一或其組合。

此外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理模塊中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現(xiàn),也可以采用軟件功能模塊的形式實現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質中。

上述提到的存儲介質可以是只讀存儲器,磁盤或光盤等。

在本說明書的描述中,參考術語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結合該實施例或示例描述的具體特征、結構、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結構、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結合。

盡管上面已經(jīng)示出和描述了本發(fā)明的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本發(fā)明的限制,本領域的普通技術人員在本發(fā)明的范圍內可以對上述實施例進行變化、修改、替換和變型。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 江津市| 乌拉特后旗| 澎湖县| 乌什县| 璧山县| 临湘市| 剑河县| 买车| 双柏县| 灌云县| 阿拉善右旗| 横峰县| 北宁市| 牙克石市| 呈贡县| 塔河县| 宜兴市| 石渠县| 武乡县| 万年县| 南召县| 石景山区| 巴林左旗| 峡江县| 德昌县| 西乌| 大渡口区| 田阳县| 天祝| 桦南县| 台东市| 定日县| 双江| 图们市| 成都市| 富蕴县| 古交市| 柘荣县| 万宁市| 潼关县| 温宿县|