汽車乘員的對話模型的制作方法
【專利摘要】本發明涉及汽車乘員的對話模型。一種用于在統計對話建模系統中生成和管理多對話模型的方法和裝置,該系統能夠基于所選的模型,學習并進行人機對話。根據特征向量選出對話模型,該特征向量描述了對話參與者和他們當前場景的特征。乘員無論為駕駛員還是乘客,機動車輛中的移動裝置都能夠根據車輛的位置和路線,以及該乘員的個性特征,向該機動車輛的乘員提供優化的對話服務。當通過遠程對話服務器被網絡化后,對話乘員的大池子可用于對話模型的自動建立,該對話模型適合于處理許多場景和參與者。
【專利說明】汽車乘員的對話模型
[0001]相關申請的交叉引用
[0002]本申請要求標題為“汽車乘員的對話模型”,申請日為2012年5月29日,系列號為61/652,569的美國臨時專利申請的權益。該臨時專利申請公開的內容被引用結合到本申請中,并根據37CFR1.78(a) (4)和(5) (i)的規定要求了其優先權。
【背景技術】
[0003]可以通過部署統計學對話建模,來提高由自動語音識別和語音生成促進的人機對話中的機器響應的質量。統計學對話建模利用包含“部分可觀測馬爾可夫決策過程”(POMDP)和貝葉斯網絡的技術。有限狀態機器“呼叫流”方法上的統計學方式的優勢在于,通過從該對話系統與用戶的樣本交互中學習,以賦予該自動化系統對對話性能進行優化的能力。
[0004]圖1是用于統計學語音對話建模的現有技術系統的概念性框圖。步驟101接收音頻輸入,并將該輸入送入到包括對話模型105的對話控制單元103中。對話控制單元103發送對話行為到語音生成單元109,以產生該對話的音頻輸出。對話日志111保存用于離線分析的對話。在一個獨立的,典型的線下學習進程中,對話控制單元103也可發送數據日志到對話模塊生成器107,來更新模型105或用另一個模型替換模型105。
【發明內容】
[0005]本發明的實施例提供了根據與汽車有關的因素,為不同群組的人類對話參與者設計對話模型的方法,其中該人類對話參與者為汽車的乘員。因而,人類對話參與者在本公開中有時被稱為“乘員”。本發明的其它實施例提供了用于將參與者分組成為簇的方法,其中的每個簇都與一個對話模型相對應。根據本發明的實施例,對話是人類參與者與機器之間的雙向交互,或是其任何交互部分。
[0006]與為所有對話參與者使用單一對話模型的現有技術系統相比,本發明的實施例為對話參與者群的不同分段使用了不同的對話模型。這方面增強了口頭和多模型對話的性能;允許改變人機接口以區分特殊對話;通過提供更好的從語音識別錯誤的恢復,提高了魯棒性;并且根據品牌來改變對話風格,從而支持汽車品牌。
[0007]根據簇設計對話模型
[0008]根據本發明的實施例,配置對話模型的設計者為對話的定制者確定一個或多個參數。從多個參數中導出特征向量,然后該設計者創造出與該特征向量的不同值相對應的對話模型集合。
[0009]利用參與的汽車乘員共有的特征,本發明的實施例優化了對話性能。在這些實施例中,這些特征與對話參與者有關,并且包括對話參與者的個人特征(如年齡范圍,為駕駛員或乘客等)和參與者所處的情況的特征(如他們所乘坐的汽車,他們的位置等)。本發明的實施例使用特征的子集,這些特征包括但不限于:
[0010]汽車品牌;[0011]汽車型號;
[0012]汽車情況(如移動、靜止、停車、行程開始、到達目的地);
[0013]車載對話系統的類型;
[0014]汽車地理位置(如大城市,郊區,農村等);
[0015]路的類型(如城市,農村,高速等);
[0016]星期幾和請求的時間;
[0017]乘員的類型(駕駛員與乘客);
[0018]乘員年齡。
[0019]在非限制性的例子中,設計者希望創造與駕駛員的年齡和汽車品牌相應的對話模型集合,其中駕駛員年齡的三個范圍為年輕的,中年的和年長的,并且考慮四個不同的汽車品牌。
[0020]本例子中的特征向量的形式為{年齡,品牌},設計者選擇生成與簇編號O至6相應的7個對話模型,來覆蓋由設計者詳細說明的如下映射表的所有組合:
[0021]
【權利要求】
1.一種用于對設備進行操作,以便與環境中的人類對話參與者進行對話的方法,該方法包括: 獲得與至少一個特征相關的參數,該至少一個特征選自包括對話參與者的特征和環境的特征的一組特征; 從多個對話模型中選擇具體的對話模型,使得該具體的對話模型與該參數相關; 基于該具體的對話模型,該設備生成至少一個輸出對話行為;以及 該設備將該至少一個輸出對話行為呈現給人類對話參與者。
2.如權利要求1所述的方法,進一步包括構造特征向量,其中該特征向量至少部分地從該參數中得出。
3.如權利要求2所述的方法,進一步包括確定人類對話參與者的簇。
4.如權利要求3所述的方法,進一步包括為給定簇選擇對話模型。
5.如權利要求1所述的方法,進一步包括: 將多個人類對話參與者分組成為多個簇;以及 為該多個簇中的每一個簇生成對話模型。
6.如權利要求5所述的方法,進一步包括在存儲設備中記錄對話。
7.如權利要求6所述的方法,進一步包括建立用于將多個參數轉換為特征向量的特征映射。
8.一種用于選擇選定的對話模型,并基于該選定的對話模型來生成和管理對話的系統,該系統包括: 語音生成單元; 對話模型集合存儲器; 對話控制單元,用于發送對話行為到該語音生成單元; 簇確定單元,用于確定與該對話相關聯的簇ID ;以及 對話模型選擇單元,用于根據該簇ID,從該對話模型集合存儲器中選擇選定的對話模型,并發送該選定的對話模型到該對話控制單元; 其中該對話控制單元基于該選定的對話模型,發送該對話行為到該語音生成單元。
9.一種用于建立對話模型的系統,該系統包括: 用于提供先前保存的對話的對話日志存儲器; 用于基于來自該對話日志存儲器的先前保存的對話,生成該對話模型的對話模型生成器;以及 生成用于從特征向量獲得簇ID的簇映射的簇映射生成器。
10.一種用于生成對話模型的系統,該系統包括: 用于提供先前保存的對話的對話日志存儲器; 用于基于來自該對話日志存儲器的先前保存的對話,生成該對話模型的對話模型生成器;以及 生成用于從對話參數獲得特征向量的特征映射的特征映射生成器。
【文檔編號】G06F17/50GK103544337SQ201310361706
【公開日】2014年1月29日 申請日期:2013年5月29日 優先權日:2012年5月29日
【發明者】E·茨爾克爾-漢科克, O·尖霍尼 申請人:通用汽車環球科技運作有限責任公司