麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制的制作方法

文檔序號:2832971閱讀:483來源:國知局
專利名稱:對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制的制作方法
技術(shù)領(lǐng)域
本發(fā)明總體上涉及諸如以數(shù)字方式連接的家庭或家庭網(wǎng)絡(luò)之類的數(shù)字網(wǎng)絡(luò),并且具體地涉及用于對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制的計算機網(wǎng)絡(luò)、計算機系統(tǒng)、計算機實現(xiàn)的方法和計算機程序產(chǎn)品。
背景技術(shù)
與多個電子、電氣和/或數(shù)字設(shè)備的交互正不斷地增加。諸如包括多個設(shè)備(諸如個人計算機、筆記本、⑶播放器、DVD播放器Blu-ray Di sc 回放設(shè)備、音響系統(tǒng)、電視、電話、移動電話、MP3播放器、洗衣機、烘干機、洗碗機、電燈和/或微波爐等)的家 庭網(wǎng)絡(luò)(也稱為數(shù)字家庭網(wǎng)絡(luò)或以數(shù)字方式連接的家庭)的數(shù)字網(wǎng)絡(luò)正變得越來越普及。家庭網(wǎng)絡(luò)可以涉及復(fù)合生態(tài)系統(tǒng),包括能夠管理起居(諸如家庭小氣候、能量消耗、電器、多媒體內(nèi)容、家庭娛樂、供暖和/或制冷系統(tǒng)等)的幾乎任何方面的多個設(shè)備。數(shù)字網(wǎng)絡(luò)也可以存在于包括辦公室、電影院、汽車、博物館等的其他區(qū)域中。換言之,數(shù)字網(wǎng)絡(luò)可以存在于可適用人機接口的任何以數(shù)字方式連接的環(huán)境中。然而,此類越來越復(fù)雜的數(shù)字網(wǎng)絡(luò)缺乏可以由用戶管理和/或控制的統(tǒng)一和有效的方式。此外,數(shù)字網(wǎng)絡(luò)要求用戶學(xué)習(xí)多個不同的、經(jīng)常是異種的用戶接口和/或與它們交互,以便令人滿意地與在數(shù)字網(wǎng)絡(luò)中相關(guān)聯(lián)的不同設(shè)備交互。因此,需要增強的人機交互以供用戶與數(shù)字網(wǎng)絡(luò)交互。

發(fā)明內(nèi)容
根據(jù)一個總方面,提供了(一種框架,用于構(gòu)建)計算機網(wǎng)絡(luò),該計算機網(wǎng)絡(luò)用于對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制。該網(wǎng)絡(luò)可以包括數(shù)字網(wǎng)絡(luò),可操作用于在該數(shù)字網(wǎng)絡(luò)中連接的多個設(shè)備之間提供對網(wǎng)絡(luò)訪問的共享(或共享的訪問);客戶端,安裝在該數(shù)字網(wǎng)絡(luò)中并且可操作用于向用戶提供用于使用自然語言控制該數(shù)字網(wǎng)絡(luò)的統(tǒng)一自然語言接口;服務(wù)器,通過該網(wǎng)絡(luò)連接至該客戶端并且可操作用于處理該用戶通過該統(tǒng)一自然語言接口執(zhí)行的用戶請求;以及一個或者多個軟件代理,可操作用于基于經(jīng)處理的用戶請求在該多個設(shè)備的至少一個設(shè)備上執(zhí)行至少一個動作。該框架(或者構(gòu)建的計算機網(wǎng)絡(luò))可以允許通過使用主動模式和/或被動模式的統(tǒng)一自然語言接口控制不同設(shè)備。用戶能夠向客戶端執(zhí)行自然語言請求(稱為用戶請求)以控制將在數(shù)字網(wǎng)絡(luò)中的設(shè)備上執(zhí)行的動作。可以被控制的動作包括例如打開該用戶的房間中的臺燈的燈光、在洗衣機上運行洗滌周期、為DVD播放器安排節(jié)目、為供暖系統(tǒng)設(shè)置溫
/又寸。除了理解此類顯式用戶請求之外,該框架還可以能夠從話音提取非語言信息(例如用戶的情緒),并且允許觸發(fā)由軟件代理在一個或者多個設(shè)備上執(zhí)行相應(yīng)的動作。例如,如果用戶高興,則應(yīng)當(dāng)激活音樂播放器以播放快樂的音樂,和/或如果用戶正在談?wù)撍纳蟼€假期,則家庭娛樂設(shè)備應(yīng)當(dāng)示出所述假期的照片。統(tǒng)一自然語言接口可以由客戶端通過實施包括向用戶暴露(expose)的圖形用戶界面的一個或者多個組件來提供,以便允許用戶從網(wǎng)絡(luò)獲得某些反饋和/或管理并且配置所控制的設(shè)備。為了降低成本和/或克服獨立設(shè)備的限制,該框架可以基于包括用于該客戶端的模塊化方式的客戶端-服務(wù)器架構(gòu)。例如,該客戶端可操作用于監(jiān)聽(自然語言的)用戶請求。該客戶端繼而可以與服務(wù)器通信以解釋和/或處理該用戶請求。該服務(wù)器可以向該客戶端發(fā)送回經(jīng)處理的用戶請求。可以處理該用戶請求從而產(chǎn)生標(biāo)簽的列表,例如從句子(用戶請求)提取的字詞的列表,該列表通過省略停用詞(stop-words)總結(jié)該句子的語義。基于從該服務(wù)器接收的該經(jīng)處理的用戶請求,該客戶端可以選擇并且執(zhí)行動 作以服務(wù)于該用戶請求。該客戶端可以通過觸發(fā)一個或者多個軟件代理(也稱為軟件集(bundles))以在該數(shù)字網(wǎng)絡(luò)的一個或者多個設(shè)備上執(zhí)行該動作來執(zhí)行該動作。客戶端可以包括對設(shè)備、它們的能力、位置和/或其他相關(guān)信息的(大體上)完整的知識。所述知識可以在語義詞典中指定。語義詞典可以包括對設(shè)備、它們的關(guān)系和/或?qū)傩?例如可以在它們上執(zhí)行的動作)進行描述的語義網(wǎng)絡(luò)。語義詞典還可以和/或備選地包括對數(shù)字網(wǎng)絡(luò)的設(shè)備進行分類和/或歸類的字典。客戶端可以包括如下知識,該知識包括如何使用適當(dāng)接口控制設(shè)備以用于通知和訂閱(subscribe)可以執(zhí)行動作的軟件代理。服務(wù)器可以從客戶端接收通過用戶請求生成的話音樣本。服務(wù)器可以將話音樣本轉(zhuǎn)換為本文并且可以提取相關(guān)信息,客戶端因此可以標(biāo)識待采取的動作以服務(wù)于用戶請求。可以將相關(guān)信息作為包括在諸如XML和/或任何其他適合的格式之類的計算機可讀格式中的標(biāo)簽的列表發(fā)送回客戶端。可以(由客戶端)使用該標(biāo)簽的列表以標(biāo)識為了滿足用戶請求所需的一個或者多個動作和一個或者多個相應(yīng)的設(shè)備。換言之,當(dāng)網(wǎng)絡(luò)運作時,客戶端可以從用戶請求對用戶的話音進行采樣并且繼而請求服務(wù)器從該用戶請求提取相關(guān)信息以便標(biāo)識將由一個或者多個軟件代理針對一個或者多個目標(biāo)設(shè)備執(zhí)行的一個或者多個目標(biāo)動作。包括在用戶請求中的信息可以是語言的(例如字詞、短語和/或句子)和/或非語言的(例如情感)。在用戶已經(jīng)選擇了主動模式或者被動模式之后,框架可以處理來自用戶請求的語言信息和/或非語言信息,并且可以相應(yīng)地服務(wù)于該用戶請求。用戶可能經(jīng)常通過顯式地觸發(fā)網(wǎng)絡(luò)(例如通過在表達(dá)請求時保持⑶I上的軟按鈕(soft-button)被按下)來按照主動模式操作該網(wǎng)絡(luò)。當(dāng)計算機網(wǎng)絡(luò)處于被動模式時,該網(wǎng)絡(luò)持續(xù)地監(jiān)聽用戶,從而產(chǎn)生對該用戶正在談?wù)摰闹黝}和他的情感進行總結(jié)的標(biāo)簽的持續(xù)流。用戶也可能按照混合模式操作網(wǎng)絡(luò),其中處理用戶的顯式請求和用戶的情感兩者,以便決定將采取的動作。由于中央服務(wù)器可以提供大部分所要求的計算能力,因此客戶端可以在通常存在于用戶的家庭網(wǎng)絡(luò)中的設(shè)備(例如,接入網(wǎng)關(guān)、機頂盒等)上運行。客戶端也可以向如下軟件代理(或者軟件集)提供接口(模塊管理組件),該軟件代理(或者軟件集)有興趣為了用戶請求進行動作。該軟件代理轉(zhuǎn)而可以控制數(shù)字網(wǎng)絡(luò)中的任何種類的設(shè)備。根據(jù)另一方面,客戶端可以包括模塊管理組件,該模塊管理組件可操作用于向一個或者多個軟件代理提供接口以用于發(fā)布由該一個或者多個軟件代理向該客戶端提供的一個或者多個動作。根據(jù)又一方面,客戶端可以包括向用戶暴露的圖形用戶界面(GUI),該圖形用戶界面用于指定對將由多個軟件代理在多個設(shè)備的至少一個設(shè)備上執(zhí)行的動作的用戶定義的設(shè)置,和/或選擇操作模式(主動和/或被動)。

根據(jù)又一方面,模塊管理組件可以進一步可操作用于向一個或者多個軟件代理輸出功能集合,以允許該一個或者多個軟件代理訪問GUI。根據(jù)又一方面,客戶端可以包括家庭知識組件,該家庭知識組件包括語義詞典,其中該語義詞典指定關(guān)于數(shù)字網(wǎng)絡(luò)中的多個設(shè)備的、與控制該多個設(shè)備相關(guān)的信息。根據(jù)又一方面,語義詞典可以包括針對多個設(shè)備的設(shè)備類別、設(shè)備類別之間和/或該多個設(shè)備之間的關(guān)系以及該設(shè)備類別和/或該多個設(shè)備的屬性。根據(jù)又一方面,服務(wù)器可以可操作用于對用戶請求進行處理以產(chǎn)生標(biāo)簽的列表,該標(biāo)簽的列表可由客戶端使用以觸發(fā)多個軟件代理來在多個設(shè)備的至少一個設(shè)備上執(zhí)行至少一個動作。根據(jù)又一方面,服務(wù)器可以可操作用于通過解釋從用戶請求提取的語言信息和/或非語言信息來處理該用戶請求。根據(jù)另一總方面,提供了用于對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制的客戶端。該客戶端包括統(tǒng)一自然語言接口,可操作用于接收用于使用自然語言控制數(shù)字網(wǎng)絡(luò)的用戶請求,其中該數(shù)字網(wǎng)絡(luò)可操作用于在該數(shù)字網(wǎng)絡(luò)中連接的多個設(shè)備之間提供對網(wǎng)絡(luò)訪問的共孕;以及模塊管理組件,可操作用于向一個或者多個軟件代理提供接口以用于向客戶端發(fā)布由該一個或者多個軟件代理提供的一個或者多個動作(和/或訂閱在處于被動模式而檢測到情感時將被通知的客戶端),其中該一個或者多個軟件代理可操作用于基于該用戶請求在該多個設(shè)備的至少一個設(shè)備上執(zhí)行至少一個動作,其中該客戶端安裝在該數(shù)字網(wǎng)絡(luò)中。根據(jù)又一總方面,提供了用于對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制的服務(wù)器。該服務(wù)器可以包括接口,可操作用于處理從客戶端接收的用戶請求,其中該用戶請求是通過在該客戶端處、用于使用自然語言控制數(shù)字網(wǎng)絡(luò)的統(tǒng)一自然語言接口處執(zhí)行的,其中該數(shù)字網(wǎng)絡(luò)可操作用于在該數(shù)字網(wǎng)絡(luò)中連接的多個設(shè)備之間提供對網(wǎng)絡(luò)訪問的共享;以及其中處理該用戶請求以產(chǎn)生標(biāo)簽的列表,該標(biāo)簽的列表可由該客戶端使用以觸發(fā)多個軟件代理基于經(jīng)處理的用戶請求在該多個設(shè)備的至少一個設(shè)備上執(zhí)行至少一個動作。根據(jù)又一方面,客戶端和服務(wù)器可以包括如所描述的計算機網(wǎng)絡(luò)的功能和/或組件。
根據(jù)又一總方面,提供了用于對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制的計算機實現(xiàn)的方法。該方法可以包括在客戶端向用戶提供用于使用自然語言控制數(shù)字網(wǎng)絡(luò)的統(tǒng)一自然語言接口,其中該數(shù)字網(wǎng)絡(luò)可操作用于在該數(shù)字網(wǎng)絡(luò)中連接的多個設(shè)備之間提供對網(wǎng)絡(luò)訪問的共享;向服務(wù)器發(fā)送用戶通過該統(tǒng)一自然語言接口執(zhí)行的用戶請求,其中該服務(wù)器通過該網(wǎng)絡(luò)連接至該客戶端并且可操作用于處理該用戶請求;以及觸發(fā)一個或者多個軟件代理基于經(jīng)處理的用戶請求在該多個設(shè)備的至少一個設(shè)備上執(zhí)行至少一個動作。根據(jù)又一方面,該計算機實現(xiàn)的方法可以包括如所描述的、用于在計算機網(wǎng)絡(luò)中執(zhí)行的功能和/或處理指令。

在又一總方面中,提供了包括計算機可讀指令的計算機程序產(chǎn)品,當(dāng)在計算機系統(tǒng)和/或計算機網(wǎng)絡(luò)系統(tǒng)中加載并且執(zhí)行該計算機可讀指令時,使得該計算機系統(tǒng)和/或該計算機網(wǎng)絡(luò)系統(tǒng)執(zhí)行如所描述的方法。在本說明書中描述的主題內(nèi)容可以實現(xiàn)為方法或者系統(tǒng),或者使用有形地體現(xiàn)在諸如CD-ROM、DVD-ROM、半導(dǎo)體存儲器、信號和/或數(shù)據(jù)流以及硬盤之類的信息載體中的計算機程序產(chǎn)品來實現(xiàn)。此類計算機程序產(chǎn)品可以使得數(shù)據(jù)處理裝置實施在本說明書中描述的一個或者多個操作。此外,在本說明書中描述的主題內(nèi)容也可以實現(xiàn)為包括處理器和耦合到該處理器的存儲器的系統(tǒng)。該存儲器可以對一個或者多個程序編碼,該一個或者多個程序使得該處理器執(zhí)行在本說明書中描述的一個或者多個方法動作。此外,可以使用各種MRI機器實現(xiàn)在本說明書中描述的主題內(nèi)容。在以下示例性描述和隨附示例性附圖中闡明了一個或者多個實現(xiàn)方式的細(xì)節(jié)。通過描述和附圖,以及通過權(quán)利要求書,其他特征將變得容易理解。


圖I示出了可從使用自然語言形成(formulate)的用戶請求提取的信息型內(nèi)容的示例性示意圖。圖2示出了用于提供對數(shù)字網(wǎng)絡(luò)進行自然語言控制的系統(tǒng)的示例性框架架構(gòu)。圖3A示出了按照主動模式操作時、框架中的交互的示例性流程圖。圖3B示出了按照被動模式操作時、框架中的交互的示例性流程圖。圖4涉及用于實現(xiàn)如圖I、圖2、圖3A和圖3B中所示的網(wǎng)絡(luò)、方法、客戶端和服務(wù)器的示例性計算機系統(tǒng)和/或計算機網(wǎng)絡(luò)系統(tǒng)。
具體實施例方式技術(shù)術(shù)語貫穿本說明書廣泛使用以下技術(shù)術(shù)語。這些術(shù)語可以指示但并不限于隨后給出的說明。家庭網(wǎng)絡(luò)家庭網(wǎng)絡(luò)(也稱為家庭區(qū)域網(wǎng)絡(luò)或者以數(shù)字方式連接的家庭)可以是數(shù)字網(wǎng)絡(luò)的示例。家庭網(wǎng)絡(luò)可以基于住宅局域網(wǎng)(LAN)。家庭網(wǎng)絡(luò)可以用于包括個人計算機、筆記本、⑶播放器、DVD播放器Blu-ray Disc 回放設(shè)備、音響系統(tǒng)、電視、電話、移動電話、MP3播放器、洗衣機、烘干機、洗碗機、電燈和/或微波爐等的數(shù)字設(shè)備之間的通信和/或交互。家庭網(wǎng)絡(luò)可以支持在家庭網(wǎng)絡(luò)中連接的一個或者多個數(shù)字設(shè)備例如通過有線電視和/或數(shù)字用戶線路(DSL)供應(yīng)商的寬帶服務(wù)訪問因特網(wǎng)。為了增強的功能,可以向家庭網(wǎng)絡(luò)添加家庭服務(wù)器。家庭網(wǎng)絡(luò)可以使用有線或者無線通信技術(shù)。語音識別語音識別(也稱為自動語音識別或者計算機語音識別)可以提供用于將口頭詞句轉(zhuǎn)換為文本的機制。附加地,語音識別還可以包括需要被訓(xùn)練以識別特定發(fā)言者的特定話音的系統(tǒng)(稱為發(fā)言者識別系統(tǒng))。識別特定發(fā)言者的話音可以有容易化和/或簡化將口頭詞句翻譯和/或轉(zhuǎn)化為文本的任務(wù)。可以獲得語音識別的各種算法。可以在基于統(tǒng)計的語音識別算法中使用聲學(xué)建模和/或語言建模。語音識別算法的示例可以包括隱式馬可 夫模型(HMM)。HMM可以涉及可以輸出符號和/或量的序列的統(tǒng)計模型。HMM可以在語音識別中使用,因為可以將語音信號認(rèn)為是短時間的(例如10毫秒的)平穩(wěn)信號。在短時間中,可以將語音近似為平穩(wěn)過程。在語音識別中,隱式馬可夫模型可以輸出η維實值(其中η為小整數(shù),諸如10),每10毫秒輸出它們中的一個。矢量將包括倒譜系數(shù)(cepstralcoefficient),其通過使用余弦變換對語音的短時間窗進行傅里葉變換并且對頻譜進行解相關(guān)、繼而獲取第一個(最重要的)系數(shù)來獲得。隱式馬可夫模型將傾向于在每個狀態(tài)中具有如下統(tǒng)計分布,該統(tǒng)計分布是對角協(xié)方差高斯的混合,其將針對每個所觀察的矢量給出似然性。每個字詞或者每個音素(對于更普通的語音識別系統(tǒng))可以包括不同的輸出分布。可以通過針對分離的字詞和音素連結(jié)個別的、經(jīng)訓(xùn)練的隱式馬可夫模型來針對字詞和/或音素的序列構(gòu)建隱式馬可夫模型。語音識別系統(tǒng)使用多個標(biāo)準(zhǔn)技術(shù)的各種組合以便改進通過如上所述的方式的結(jié)果。大詞匯量系統(tǒng)可能需要針對音素的語境依賴性(因而具有不同的左語境和右語境的音素具有如HMM狀態(tài)的不同的實現(xiàn))。系統(tǒng)也可以使用倒譜歸一化來針對不同發(fā)言者和記錄條件進行歸一化。對于進一步的發(fā)言者歸一化,語音識別系統(tǒng)可以針對男-女歸一化使用聲道長度歸一化(VTLN)和/或針對更普通的發(fā)言者自適應(yīng)使用最大似然性線性回歸(MLLR)。語音識別系統(tǒng)還可以使用所謂的區(qū)別訓(xùn)練技術(shù),其省略了用于HMM參數(shù)估計的純粹的統(tǒng)計方式并且作為替代優(yōu)化對訓(xùn)練數(shù)據(jù)的某些分類相關(guān)的測量。示例是最大互信息(MMI)、最小分類誤差(MCE)和最小音素誤差(MPE)。對語音的解碼(針對當(dāng)向系統(tǒng)呈現(xiàn)新話語并且系統(tǒng)必須計算最可能的源句子時所發(fā)生的情況的術(shù)語)可以包括用于查找最佳路徑的維特比算法,其中可以在動態(tài)創(chuàng)建包括聲學(xué)模型信息和語言模型信息兩者的組合隱式馬可夫模型或者對其預(yù)先進行靜態(tài)組合(有限狀態(tài)轉(zhuǎn)換器方式)之間提供選擇。話音中的情感識別情感識別方案可以取決于機器應(yīng)當(dāng)識別哪些情感以及出于什么目的。可以被考慮的情感可以包括例如悲傷、厭煩、驚奇、高興、憤怒、中性和/或其他已知的情感等。對語音的自動情感識別可以基于模式識別問題。由不同實驗利用情感識別產(chǎn)生的結(jié)果可以由被認(rèn)為與以下各項有關(guān)的特征來表征發(fā)言者的情感狀態(tài)、對系統(tǒng)感興趣的情感類型、用于訓(xùn)練和/或測試所使用的分類器的數(shù)據(jù)庫,和/或在實驗中使用的分類器類型,其中分類器和/或分類器類型涉及在實驗中使用以測試對話音的情感識別模式的情感類型。話音中的情感識別可以基于出于不同目的在人工智能中使用的算法,這些目的包括確定諸如神經(jīng)網(wǎng)絡(luò)之類的相似程度、支持向量機、支持最近鄰居法(k-nearest neighbor)和/或支持決策樹。語音合成語音合成可以涉及對人類語音的人工產(chǎn)生。出于這一目的而使用的計算機系統(tǒng)可以稱為語音合成器,諸如文本轉(zhuǎn)語音系統(tǒng)。文本轉(zhuǎn)語音系統(tǒng)可以將正常語言文本轉(zhuǎn)換為語音。其他系統(tǒng)可以將諸如語言抄本(transcription)之類的符號語言表示呈現(xiàn)為語音。可以通過連接可以存儲在數(shù)據(jù)庫中的所記錄的語音片段來創(chuàng)建合成的語音。多個系統(tǒng)可以在所存儲的語音單元的大小方面存在不同。例如,存儲音素或者雙音素的系統(tǒng)可以提供較大輸出范圍,但可能缺乏清晰度。對于具體使用領(lǐng)域,對整個字詞或者句子的存儲可以允許高質(zhì)量輸出。合成器可以并入聲道和/或其他人類話音特征的模型、以創(chuàng)建完全“合成的”話 音輸出。停用詞(stopword)在計算中,特別地,計算語言學(xué)包括用于語音識別和/或語音合成的方式,停用詞可以是搜索機/自然語言處理系統(tǒng)在處理自然語言數(shù)據(jù)(例如文本、話音和/或語音)之前和/或之后過濾掉的字詞。可以在可能的、非確定列表中定義停用詞。可以將自然語言的任何字詞選擇為停用詞。在某些自然語言處理系統(tǒng)中,使用該系統(tǒng)的目的可能是幫助確定停用詞。停用詞的示例包括“該(the)”、“是(is)”、“在(at)”、“和(and)”、“其(which,that)”、“到(to)”、“但(but)”以及其他類似的字詞。其他已知的自然語言處理系統(tǒng)可以取決于它們的信息型內(nèi)容而從自然語言數(shù)據(jù)移除諸如“想(want)”、“可以(may)”、“將(would) ”等停用詞,以改進執(zhí)行。語義網(wǎng)絡(luò)語義網(wǎng)絡(luò)可以涉及如下網(wǎng)絡(luò),該網(wǎng)絡(luò)可以代表自然語言概念之間的語義關(guān)系(例如熊是哺乳動物,而哺乳動物轉(zhuǎn)而是動物)。可以按照諸如本體論之類的知識表示的形式使用語義網(wǎng)絡(luò)。可以通過包括頂點與頂點之間的邊的有向圖或者無向圖實現(xiàn)語義網(wǎng)絡(luò)。頂點可以標(biāo)識概念而邊可以標(biāo)識概念之間的關(guān)系。語義網(wǎng)絡(luò)的示例可以是WordNet (詞匯網(wǎng)),其為英文單詞的詞匯數(shù)據(jù)庫。WordNet可以將字詞(概念)分組為同義詞的集合,可以提供對每個字詞的短的、一般的定義,和/或可以記錄所述同義詞的集合之間的一個或者多個語義關(guān)系。語義詞典語義詞典可以涉及用語義類別標(biāo)注的字詞的字典,從而使得可以導(dǎo)出的字詞之間的管理可以是先前沒有遇到過的。語義詞典可以包括與語義網(wǎng)絡(luò)相關(guān)聯(lián)的字典和/或詞典。軟件代理軟件代理可以涉及在計算中廣泛使用的概念。軟件代理可以涉及軟件的具體概念,其可以提供用于描述(可能復(fù)雜的)軟件實體或者軟件片段和/或其他軟件/硬件組件的方便的和/或強大的方式,該軟件實體或者軟件片段(a piece of software)可以能夠按照一定程度的自主性操作,以便為了用戶完成任務(wù)。換言之,軟件代理可以涉及為了用戶操作的軟件片段和/或按照代理關(guān)系(即,同意為了某人而操作)的其他組件。此類“為了某人”的動作可以意指用于決定哪個動作可能是合適的(以及一個動作是否合適)的職權(quán)。可以不僅為了任務(wù)、而是為了激活軟件代理自身而調(diào)用該軟件代理。軟件代理可以被實現(xiàn)為“軟件集”,其可以是獨立的軟件片段,該軟件片段通過由客戶端自身暴露的標(biāo)準(zhǔn)接口連接到客戶端。具體描述在下文中,將參考附圖給出對示例的詳細(xì)描述。應(yīng)當(dāng)理解,可以對示例進行各種修改。特別地,可以將一個示例中的元素在其他示例中組合和使用、以形成新的示例。為了改進與數(shù)字網(wǎng)絡(luò)的人機交互并且因此將用戶從學(xué)習(xí)使用不同的、經(jīng)常是異種的和/或復(fù)雜的用戶接口以便令人滿意地與數(shù)字網(wǎng)絡(luò)交互的麻煩的和/或耗時的任務(wù)(以及意識任務(wù))中解放,提供了可以支持通過統(tǒng)一自然語言用戶接口控制基本上任何(數(shù)字)設(shè)備的、用于與數(shù)字網(wǎng)絡(luò)進行統(tǒng)一自然語言和/或非語言交互的框架。通過提供統(tǒng)一自然 語言接口,用戶可以無需學(xué)習(xí)和/或理解接口。除了理解用戶的顯式(語言的)請求之外,根據(jù)該框架實現(xiàn)的統(tǒng)一自然語言接口還能夠從在框架的區(qū)域內(nèi)說話的用戶的話音提取非語言信息,以及基于所提取的為語言信息進行適當(dāng)?shù)姆磻?yīng)。用戶的話音的非語言信息可以包括不同類型的情感,諸如悲傷、厭煩、高興、憤怒、驚奇、中性或者其他情感。框架可以向一個或者多個軟件代理(也稱為軟件集)暴露另一接口,其可以基于訂閱-通知模型。以下進一步描述該模型。軟件代理可操作用于控制設(shè)備來執(zhí)行具體動作(例如打開/關(guān)閉燈光、在洗衣機上運行洗滌周期、控制供暖系統(tǒng)在特定時間提供某個溫度,以及與設(shè)備相關(guān)聯(lián)的其他動作)。以這種方式,用戶可以與一個統(tǒng)一自然語言接口進行交互、以操作和控制數(shù)字網(wǎng)絡(luò)中的所有設(shè)備。為了降低成本和/或克服獨立設(shè)備和/或組件的限制,可以基于客戶端-服務(wù)器架構(gòu)實現(xiàn)用于實現(xiàn)統(tǒng)一自然語言接口以供用戶統(tǒng)一地指示數(shù)字網(wǎng)絡(luò)中的設(shè)備的框架。中央服務(wù)器可以提供大多數(shù)所要求的計算能力。然而,本領(lǐng)域普通技術(shù)人員將領(lǐng)會到,可以使用多個位于同地或者地理上分散的服務(wù)器。可以在通常在數(shù)字網(wǎng)絡(luò)中可用的設(shè)備上運行客戶端或者客戶端軟件。例如,可以在接入網(wǎng)關(guān)(或者媒體網(wǎng)關(guān))、網(wǎng)絡(luò)連接存儲設(shè)備(NAS)、機頂盒(STB)等上運行客戶端。圖I涉及可以通過統(tǒng)一自然語言接口從用戶的話音和/或語音提取的信息內(nèi)容的示意圖。通過經(jīng)由統(tǒng)一自然語言接口與數(shù)字網(wǎng)絡(luò)交互,用戶使用自然語言12明確表達(dá)針對數(shù)字網(wǎng)絡(luò)的請求。例如,用戶明確表達(dá)基于自然語言的用戶請求12 “請打開我房間中的臺燈”。在下文中,用戶請求是指用戶針對框架的請求,其中使用自然語言(例如德語、英語、意大利語、法語等)明確表達(dá)用戶請求。統(tǒng)一自然語言接口可操作用于采集顯式信息,諸如語言信息14,其包括來自用戶請求12的、由用戶明確表達(dá)的句子的語義。例如,統(tǒng)一自然語言接口可以從句子“請打開我房間中的臺燈”導(dǎo)出包括以下的語義誰是用戶、意指哪個房間、所指示的設(shè)備是什么,和/或?qū)⒃谒_定的設(shè)備上執(zhí)行的動作(例如,在所確定房間中的臺燈應(yīng)當(dāng)被打開)。統(tǒng)一自然語言接口還可以可操作用于采集隱式信息,諸如非語言信息16,其包括來自用戶請求12的用戶的情感(例如,用戶是否緊張、高興、憤怒、感到驚奇、悲傷、中性)。例如,統(tǒng)一自然語言接口不僅可以從句子“請打開我房間中的臺燈”導(dǎo)出上述語義,還可以導(dǎo)出例如用戶是以高興的情緒還是以憤怒的情緒表達(dá)該句子。基于在與統(tǒng)一自然語言接口交互期間從用戶請求12提取的是語言信息14和/或非語言信息16,向用戶暴露統(tǒng)一自然語言接口的框架可以按照兩種不同的對應(yīng)模式操作。基于語言信息14進行操作的模式可以稱為主動模式。基于非語言信息16(可能也基于語言信息14)進行操作的模式稱為被動模式。當(dāng)按照主動模式操作時,用戶例如通過按壓⑶I上的按鈕并且說出用戶請求12來對統(tǒng)一自然語言接口進行顯式操作。統(tǒng)一自然語言接口可操作用于理解和/或解釋來自用戶請求12的語言信息14。基于語言信息14,框架可操作用于觸發(fā)對在用戶請求12中標(biāo)識的至少一個設(shè)備(例如所確定的房間中的臺燈)進行控制的軟件代理(或者軟件集),并且向軟件代理發(fā)布相應(yīng)的命令以執(zhí)行用戶請求12,例如打開所確定的房間中的臺燈的燈光。當(dāng)按照被動模式操作時,統(tǒng)一自然語言接口可操作用于持續(xù)地監(jiān)聽用戶講話并且 從用戶請求12提取非語言信息16和/或語言信息14。可以將所提取的信息處理并且轉(zhuǎn)發(fā)至已被訂閱為被動模式的一個或者多個軟件集。該一個或者多個軟件集繼而可以通過控制一個或者多個相應(yīng)的設(shè)備來執(zhí)行對應(yīng)于所提取的信息的一個或者多個動作。例如,如果用戶正以高興的情緒和朋友談?wù)撍纳蟼€假期,則相應(yīng)的軟件集可以操作設(shè)備以用于播放適當(dāng)?shù)亩嗝襟w內(nèi)容和/或可以使環(huán)境適應(yīng)于用戶的情緒。將基于非語言信息16采取的動作可以已經(jīng)由用戶自己經(jīng)由⑶I選擇和/或定義。圖2示出了用于實現(xiàn)用于使用自然語言控制諸如家庭網(wǎng)絡(luò)之類的數(shù)字網(wǎng)絡(luò)的計算機網(wǎng)絡(luò)、客戶端、服務(wù)器以及計算機實現(xiàn)的方法的示例性框架。換言之,該框架可以提供用于實現(xiàn)對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制的架構(gòu),其中用戶可以通過統(tǒng)一自然語言接口與數(shù)字網(wǎng)絡(luò)進行交互。該框架包括客戶端100,其位于將被控制的數(shù)字網(wǎng)絡(luò)400的用戶的環(huán)境中。為了通過明確表達(dá)自然語言用戶請求(以下稱為用戶請求)來控制數(shù)字網(wǎng)絡(luò)400,客戶端100向用戶提供統(tǒng)一自然語言接口。統(tǒng)一自然語言接口包括一個或者多個組件110、120、130、140、150、160、170。例如,可以將客戶端100實現(xiàn)為可以在通常在數(shù)字網(wǎng)絡(luò)400中可用的設(shè)備上運行的客戶端軟件。例如,可以在接入網(wǎng)關(guān)(或者媒體網(wǎng)關(guān))、網(wǎng)絡(luò)連接存儲設(shè)備(NAS)、機頂盒(STB)等上運行客戶端100。該框架可以管理一個或者多個軟件集300a、300b、300c、300d、300e、300f。軟件集300a、300b、300c、300d、300e和300f各自可以控制連接在數(shù)字網(wǎng)絡(luò)400中的至少一個設(shè)備410、420、430、440、450、460。設(shè)備的示例可以包括個人計算機、CD/DVD/Blu-ray Disc 回放設(shè)備、電視、攝像機和/或網(wǎng)絡(luò)攝像機、洗衣機、洗碗機、供暖和/或制冷系統(tǒng)、電燈等。數(shù)字網(wǎng)絡(luò)400可以例如通過有線電視和/或數(shù)字用戶線路(DSL)供應(yīng)商的寬帶服務(wù)在數(shù)字設(shè)備410、420、430、440、450、460之間提供對因特網(wǎng)500訪問的共享。為了增強的功能,可以向數(shù)字網(wǎng)絡(luò)添加家庭服務(wù)器。該框架包括服務(wù)器200。服務(wù)器200可操作用于與客戶端100進行交互以及處理在客戶端100處接收的用戶請求。服務(wù)器200可以位于客戶端100的遠(yuǎn)程并且可以通過網(wǎng)絡(luò)500與客戶端進行通信。客戶端100包括用于與用戶進行交互的一個或者多個組件110、120、130、140、150、160、170,該交互諸如用于處理用戶請求和/或用于支持對該一個或者多個軟件集300a、300b、300c、300d、300e 和 300f 的用戶定義的設(shè)置。組件 110、120、130、140、150、160、170也可以稱為功能。該一個或者多個組件110、120、130、140、150、160、170包括通信和協(xié)作組件110、話音記錄組件120、文本轉(zhuǎn)語音組件130、模塊控制組件140、家庭知識組件150、動作計劃組件160和/或圖形用戶界面(⑶I) 170。客戶端100的通信和協(xié)作組件110保持和/或提供用于客戶端100的計算和/或通信邏輯。可以將通信和協(xié)作組件110實現(xiàn)為信息總線,其由客戶端100在內(nèi)部使用以在操作于客戶端100內(nèi)的一個或者多個組件120、130、140、150、160、170之間交換數(shù)據(jù)和/或信息。通信和協(xié)作組件110提供用于客戶端100與服務(wù)器200進行通信和/或交互的功能。換言之,通信和協(xié)作組件110為客戶端100提供用于通過網(wǎng)絡(luò)500與服務(wù)器200進行通信的接口。如在以下更詳細(xì)說明的,服務(wù)器200包括相應(yīng)的通信和協(xié)作組件210,其提供用于通過網(wǎng)絡(luò)500與客戶端100進行通信的相應(yīng)的接口。客戶端100的話音記錄組件120可操作用于從用戶請求接收傳入語音并且對用戶請求的用戶話音進行采樣。對一個或者多個話音采樣進行格式化和/或數(shù)字化以便通過網(wǎng) 絡(luò)500發(fā)送至服務(wù)器200。可以按照諸如語音信號或者聲信號之類的信號序列的形式表示和/或存儲經(jīng)格式化的話音采樣。話音采樣涉及將用戶請求劃分和/分離為樣本,例如字詞、音節(jié)和/或音素。為了將話音樣本格式化和/或數(shù)字化為語音信號,可以將執(zhí)行用戶請求的用戶的話音樣本與存儲在數(shù)據(jù)庫中的樣本進行比較,以便例如通過模式匹配和/或相似度搜索對其進行標(biāo)識。所標(biāo)識的樣本繼而被組成語音信號。為了改進對樣本的匹配,話音記錄組件120可以預(yù)先標(biāo)識執(zhí)行用戶請求的用戶和/或針對客戶端100標(biāo)識其自身的用戶,從而使得可以將數(shù)據(jù)庫中的搜索限制到與該用戶關(guān)聯(lián)存儲的樣本。客戶端100的文本轉(zhuǎn)語音組件130可操作用于向已經(jīng)預(yù)先執(zhí)行了用戶請求的用戶給出聲音反饋。在一個示例性實現(xiàn)方式中,可以通過使用可用的語音合成系統(tǒng)實現(xiàn)文本轉(zhuǎn)語音組件130。客戶端100的模塊控制組件140針對該一個或者多個軟件集300a、300b、300c、300d、300e、300f提供單一聯(lián)系點,該單一聯(lián)系點與該框架進行交互以控制設(shè)備410、420、430、440、450、460。模塊控制組件 140 向軟件集 300a、300b、300c、300d、300e、300f 暴露用于向客戶端100發(fā)布它們的服務(wù)(或者動作)的接口。用戶可以通過指定針對將由軟件集300a、300b、300c、300d、300e、300f通過接口執(zhí)行的動作的用戶定義的設(shè)置,來配置軟件集300a、300b、300c、300d、300e、300f。以下進一步詳細(xì)描述對軟件集 300a、300b、300c、300d、300e、300f的配置。可以通過客戶端100的圖形用戶界面(⑶I) 170向用戶暴露用于配置軟件集300a、300b、300c、300d、300e、300f的接口。模塊控制組件140可以向軟件集300a、300b、300c、300d、300e、300f 提供對⑶I 的訪問權(quán),從而使得軟件集 300a、300b、300c、300d、300e、300f可以獲取用戶定義的設(shè)置(或者配置)。客戶端100的家庭知識組件150提供和/或存儲供客戶端100運行所必須的信息。家庭知識組件150可以包括關(guān)于通過客戶端100進行管理和/或控制的、數(shù)字網(wǎng)絡(luò)400的該一個或者多個設(shè)備410、420、430、440、450、460的信息。所述關(guān)于設(shè)備410、420、430、440、450,460的信息可以包括時間和/或資源能力、所要求的電子和/或電氣連接,和/或關(guān)于設(shè)備410、420、430、440、450、460 的、可能與控制和/或管理設(shè)備410、420、430、440、450、460相關(guān)的其他信息。示例包括數(shù)字網(wǎng)絡(luò)400中的物理位置,設(shè)備所屬于的分類和/或類別(例如臺燈是電燈,而電燈是照明系統(tǒng)的一部分)和/或可以在設(shè)備上執(zhí)行的動作(例如可以打開或者關(guān)閉和/或調(diào)暗電燈)。在一個實現(xiàn)方式中,家庭知識組件150包括語義詞典,該語義詞典包括對網(wǎng)絡(luò)400中的設(shè)備410、420、430、440、450、460進行描述的語義網(wǎng)絡(luò)和/或字典,該語義詞典包括設(shè)備種類,它們之間的關(guān)系和/或在設(shè)備410、420、430、440、450、460的動作方面的屬性。家庭知識組件150可以包括關(guān)于針對軟件集300a、300b、300c、300d、300e、300f的用戶定義的設(shè)置的信息。用戶定義的設(shè)置可以指定軟件集300a、300b、300c、300d.300e.300f的行為,包括將由軟件集300a、300b、300c、300d、300e、300f關(guān)于主動模式和/或被動模式采取的動作。例如,用戶已指定了如果他處于高興情緒中,則軟件集300a、300b、300c、300d、300e、300f控制網(wǎng)絡(luò)400的娛樂設(shè)備來播放快樂音樂。客戶端100的動作計劃組件160實現(xiàn)用于生成命令的功能,該命令用于指示軟件集300a、300b、300c、300d、300e、300f的至少一個目標(biāo)軟件集300a來控制由相應(yīng)的設(shè)備410、420、430、440、450、460響應(yīng)于用戶請求而執(zhí)行的具體動作以及來自處理了該用戶請求的服務(wù)器200的相應(yīng)的輸出。 客戶端100暴露用于與客戶端100和/或軟件集300a、300b、300c、300d、300e、300f進行用戶交互的圖形用戶界面(GUI) 170,該圖形用戶界面(GUI) 170向用戶提供了用于與客戶端100進行交互和/或通過指定用戶定義的設(shè)置來對軟件集300a、300b、300c、300d、300e、300f進行配置的能力。⑶I 170為用戶提供一個或者多個用戶控件(未示出),包括模式選擇控件、主動請求控件、設(shè)備控件、軟件集動作控件和/或用戶識別控件。模式選擇控件提供用于控制操作模式(例如用于選擇主動模式或者被動模式)的控件。主動請求控件提供用于在客戶端100處于主動模式時顯式發(fā)布用戶請求的控件。由于在主動模式中,客戶端100可以不持續(xù)監(jiān)聽發(fā)言的用戶,因此顯式激活主動請求控件(例如通過按壓按鈕)指示客戶端100何時監(jiān)聽當(dāng)前發(fā)言的用戶以確定用戶請求。設(shè)備控件支持用戶按照交互方式編輯將存儲在家庭知識組件150中的信息。例如,用戶向客戶端100提供關(guān)于數(shù)字網(wǎng)絡(luò)400的、可能無法由客戶端100從設(shè)備410、420、430、440、450、460自動推斷出的該一個或者多個設(shè)備410、420、430、440、450、460的信息,并且將該信息存儲在家庭知識組件150中。例如,客戶端100可能無法自動推斷出關(guān)于設(shè)備410、420、430、440、450、460在用戶的家庭中的物理位置的信息;而可以由客戶端100自動導(dǎo)出關(guān)于設(shè)備410、420、430、440、450、460的資源和/或事件能力的信息。軟件集動作控件支持用戶按照交互方式指定將由軟件集300a、300b、300c、300d、300e、300f采取的一個或者多個動作。可以關(guān)于諸如從用戶請求過濾的和/或提取的具體內(nèi)容種類之類的語言信息,和/或關(guān)于從用戶的語音提取的用戶的情感來指定動作。當(dāng)按照被動模式操作網(wǎng)絡(luò)時,可以由用戶依據(jù)條件動作規(guī)則來指定動作。條件動作規(guī)則允許將條件(諸如但不限于檢測到的情感或者檢測到的主題)與用于控制和/或操作設(shè)備的動作相關(guān)聯(lián)。在一個示例中,用戶可以指定通過網(wǎng)絡(luò)中的至少一個軟件集300a、300b、300c、300d、300e、300f控制的設(shè)備在用戶處于高興情緒(條件)時播放快樂音樂(動作),例如相應(yīng)的軟件集300a、300b、300c、300d、300e、300f可以激活數(shù)字網(wǎng)絡(luò)400的相應(yīng)娛樂設(shè)備并且控制其來選擇性地播放快樂音樂。在另一示例中,用戶可以指定當(dāng)用戶談?wù)撎囟ㄖ黝}(條件)時示出(動作)照片(而非相關(guān)視頻),例如相應(yīng)的軟件集300a、300b、300c、300d、300e、300f可以激活數(shù)字網(wǎng)絡(luò)400的相應(yīng)的娛樂設(shè)備以選擇性地示出與所討論的主題有關(guān)的照片。通過軟件集動作控件執(zhí)行的用戶設(shè)置可以連接至軟件集300a、300b、300c、300d、300e、300f和/或可以位于軟件集300a、300b、300c、300d、300e、300f中。出于這一目的,客戶端100通過模塊管理組件140向軟件集300a、300b、300c、300d、300e、300f暴露接口以允許軟件集300a、300b、300c、300d、300e、300f訪問⑶I 170。換言之,該框架還可以包括用于通過⑶I 170向用戶暴露軟件集300a、300b、300c、300d、300e、300f的接口。用戶識別控件提供用于改進該框架中的、對語音識別和/或發(fā)言者識別的理解的用戶控件。例如,將客戶端100安裝為連接至服務(wù)器200以用于控制他的數(shù)字網(wǎng)絡(luò)400的用戶可以向客戶端100標(biāo)識他自己并且使用用戶識別控件訓(xùn)練該框架。例如,可以由用戶通過說出預(yù)定的字詞和/或短語來訓(xùn)練框架。通過口述的預(yù)定字詞和/或短語,可以在該 框架中生成用戶的語音樣本。可以向服務(wù)器200發(fā)送語音樣本以便提取訓(xùn)練客戶端100的用戶的相應(yīng)的聲紋(voice print)和/或為了將來使用而存儲所述聲紋。聲紋可以涉及可以唯一地標(biāo)識個體的人類話音的可測量特征的集合。所述特征可以基于發(fā)言者的嘴和/或嗓子的物理外形(physical configuration)并且可以被表達(dá)為數(shù)學(xué)公式。聲紋因此可以包括出于該目的而記錄的話音樣本,所導(dǎo)出的數(shù)學(xué)公式,和/或其圖形表示。發(fā)言者識別(即,實現(xiàn)誰正在發(fā)言)可以包括對使用從用戶話音提取的特征(諸如用戶的聲紋)驗證用戶的聲稱身份的計算任務(wù)。應(yīng)當(dāng)從涉及識別正在說什么的語音識別區(qū)分發(fā)言者識別。話音識別可以涉及發(fā)言者識別和語音識別的組合,其中話音識別系統(tǒng)可以使用對發(fā)言者的話音的學(xué)習(xí)的方面來確定正在說什么。服務(wù)器200包括用于處理從客戶端100接收的用戶請求的一個或者多個組件210、220、230、240、250。當(dāng)處理用戶請求時,服務(wù)器200可操作用于將傳入請求總結(jié)為一個或者多個標(biāo)簽的列表,該標(biāo)簽的列表包括從用戶請求獲取的、足夠滿足用戶請求的語義內(nèi)容的信息。服務(wù)器200通過通信和協(xié)作組件210向客戶端100暴露接口。隱藏將用戶請求的語音樣本轉(zhuǎn)化為標(biāo)簽的列表的復(fù)雜性。標(biāo)簽的列表繼而可由客戶端100使用以觸發(fā)軟件集300a、300b、300c、300d、300e、300f 來控制數(shù)字網(wǎng)絡(luò) 400 中的設(shè)備 410、420、430、440、450、460以便服務(wù)于用戶請求。例如,客戶端100可以基于標(biāo)簽的列表、通過一個或者多個組件 110、120、130、140、150、160、170 觸發(fā)一個或者多個軟件集 300a、300b、300c、300d、300e、300f來在至少一個設(shè)備410、420、430、440、450、460上執(zhí)行至少一個動作以服務(wù)于用戶請求。可以在客戶端100用附加信息進一步處理和/或加強在處理器200生成的標(biāo)簽的列表,以便服務(wù)于用戶請求。在一個實現(xiàn)方式中,服務(wù)器200包括通信和協(xié)作組件210、話音標(biāo)識組件220、語音情感識別組件230、自動語音識別組件240和/或語音組件250。通信和協(xié)作組件210包括用于服務(wù)器200的計算和/或通信邏輯。可以將通信和協(xié)作組件210實現(xiàn)為信息總線,該信息總線由服務(wù)器200在內(nèi)部使用以在操作于服務(wù)器200內(nèi)的一個或者多個組件220、230、240、250之間交換數(shù)據(jù)和/或信息。通信和協(xié)作組件210提供用于服務(wù)器200與客戶端100進行通信和/或交互的功能。話音標(biāo)識組件220可操作用于標(biāo)識發(fā)布用戶請求的用戶。為了標(biāo)識已向客戶端100發(fā)布了用戶請求的用戶,話音標(biāo)識組件220處理來自客戶端100的用戶請求的傳入話音樣本,以從該話音樣本提取將與存儲在內(nèi)部數(shù)據(jù)庫中的用戶的聲紋匹配的一個或者多個特征。可以通過所提取的特征和該聲紋之間的相似度搜索來執(zhí)行該匹配。為了將用戶的標(biāo)識的范圍縮小到用戶的更小可能分組,客戶端100可以向服務(wù)器200發(fā)送話音樣本以及客戶端100的位置的位置信息和/或用戶的標(biāo)識。可以從如下用戶的客戶端100接收用戶聲紋,該用戶正通過如上所述的⑶I 170的用戶識別控件訓(xùn)練更佳話音理解。在一個示例性實現(xiàn)中,使用可用的發(fā)言者識別系統(tǒng)實現(xiàn)話音標(biāo)識組件220。例如,話音標(biāo)識組件220可以實現(xiàn)如下發(fā)言者識別系統(tǒng),該發(fā)言者識別系統(tǒng)記錄從與該框架進行交互的不同用戶提取按照聲紋(也稱為模板或者模型)形式的一個或者多個特征。繼而將從用戶的話音樣本獲取的語音樣本或者話語與存儲在內(nèi)部數(shù)據(jù)庫中的不同聲紋進行比較,以便確定最佳匹配。在用戶已經(jīng)連同用戶請求聲稱了身份和/或客戶端100以連同用戶請求發(fā)送了位置信息的情況下,話音標(biāo)識組件220將用戶的所生成的話音樣本的語音樣本與和用戶相關(guān)聯(lián)的聲紋和/或數(shù)據(jù)庫中的客戶端100的位置進行比較。

可以向自動語音識別組件240和/或語音組件250提供話音標(biāo)識組件220的輸出(例如作為用戶ID),以便改進上述組件240和250的輸出。在已被提供了發(fā)言者標(biāo)識的情況下,自動語音識別組件240和語音組件250可以加載從之前的訓(xùn)練獲取的、取決于發(fā)言者的參數(shù)集合,以便將針對用戶的命中概率最大化。此類參數(shù)可以包括最終從來自用戶的訓(xùn)練獲得的音高、共振峰、MFCC等。語音組件250可操作用于使用由話音標(biāo)識組件220和/或由自動語音識別組件240輸出的、關(guān)于用戶的信息(例如用戶ID),以正確地解釋用戶請求。語音情感識別組件230可操作用于在激活了被動模式時對當(dāng)前發(fā)言的用戶的話音進行分析、以從該用戶的話音提取包括諸如情緒、重讀、憤怒、高興之類的情感的非語言信息。例如,為了從用戶的話音提取非語言信息,語音情感識別組件230計算來自用戶的話音樣本的、一個或者多個頻譜特征(例如音高、話音共振峰、MFCC等),最終連同它們關(guān)于中立情況的偏差,并且繼而將計算出的頻譜特征與關(guān)于話音中的情感的樣本頻譜的預(yù)建知識知識庫進行匹配。為了改進匹配以確定以執(zhí)行了用戶請求的用戶的話音中的情感,用戶可以通過在⑶I 170內(nèi)提供的用戶識別控件、類似于針對語音識別來訓(xùn)練框架。例如,用戶可以使用不同情感表達(dá)預(yù)定字詞和/或短語。可以從所表達(dá)的預(yù)定字詞和/或短語生成話音樣本,并且針對用戶的、具有情感的相應(yīng)的聲紋可以類似于如之前描述的聲紋來生成。在一個實現(xiàn)方式中,使用可用的情感識別系統(tǒng)實現(xiàn)語音情感識別組件230。自動語音識別組件240可操作用于接收由客戶端100向服務(wù)器200發(fā)送的話音樣本并且輸出相應(yīng)的文本抄本。在一個示例性實現(xiàn)方式中,使用可用的語音識別系統(tǒng)實現(xiàn)自動語音識別組件240。向語義組件250輸入用戶的話音樣本的文本抄本。語義組件250可操作用于通過使用從話音標(biāo)識組件220接收的附加信息和/或通過使用從客戶端100的家庭知識組件150接收的附加信息來處理從自動語音識別組件240接收的用戶話音樣本的文本抄本,以從對應(yīng)于用戶請求的用戶話音樣本的文本抄本提取一個或者多個標(biāo)簽的列表。標(biāo)簽的列表通過省略可忽略信息來對用戶話音樣本的文本抄本的語義進行總結(jié)。可以通過使用如從話音標(biāo)識組件220接收的、已執(zhí)行了用戶請求的用戶的用戶ID、語義網(wǎng)絡(luò)和/或語義詞典(例如由家庭知識組件150提供的語義詞典結(jié)合停用詞列表)來執(zhí)行從用戶話音樣本的文本抄本確定標(biāo)簽的列表。例如,用戶已明確表達(dá)了用戶請求“請打開我房間中的臺燈”,該用戶請求先前在自動語音識別組件240中轉(zhuǎn)換為文本。使用停用詞列表和/或語義詞典,語義組件250如之前描述般進行處理,從初始用戶請求聲稱標(biāo)簽的列表{房間,臺燈,打開}。可以用另外的語義加強標(biāo)簽的列表,以在語義組件250處和/或在接收來自服務(wù)器200的、對用戶請求的響應(yīng)之后、在客戶端100的一個或者多個組件110、120、130、140、150、160、170處觸發(fā)相應(yīng)的動作。該響應(yīng)可以包括標(biāo)簽的列表、用戶ID和/或附加信息。為了觸發(fā)一個或者多個軟件集300a、300b、300c、300d、300e、300f來執(zhí)行打開用戶的房間中的臺燈的燈光的動作,可以在客戶端100和/或在服務(wù)器200處確定以下另外的語義。例如,所標(biāo)識的用戶是Sarah。可以從存儲在家庭知識組件150中的語義詞典確定在數(shù)字網(wǎng)絡(luò)中所組織的家庭中的哪個房間是Sarah的房間以及臺燈是電燈,而電燈屬于照明系統(tǒng)種類。還可以使用家庭知識組件150來確定Sarah的房間中的電燈中的那個電燈是臺燈,這 是因為例如這個特征可以在家庭知識組件150的語義詞典中描述。此外,可以從該種類導(dǎo)出可以使用照明系統(tǒng)進行的動作,例如打開、關(guān)閉和/或調(diào)暗。可以將軟件代理實現(xiàn)為軟件集300a、300b、300c、300d、300e、300f,其是可以通過由客戶端本身暴露的標(biāo)準(zhǔn)接口與客戶端交互并且可以彼此交互的獨立軟件片段。在如圖2中所示的框架中,將軟件集300a、300b、300c、300d、300e、300f實現(xiàn)為專用于執(zhí)行由用戶通過客戶端100請求的任務(wù)和/或控制數(shù)字網(wǎng)絡(luò)400中的一個或者多個設(shè)備410、420、430、440,450,460的軟件代理。例如,一個或者多個軟件集300a、300b、300c、300d、300e、300f 可以可操作用于例如通過控制一個或者多個設(shè)備410、420、430、440、450、460來執(zhí)行一個或者多個以下示例性任務(wù)打開或者關(guān)閉電燈、讀取環(huán)境數(shù)據(jù)、在洗衣機上運行洗滌周期、控制數(shù)字生活網(wǎng)絡(luò)聯(lián)盟(DLNA)等。客戶端100通過模塊管理組件140向軟件集300a、300b、300c、300d、300e、300f 暴露單一聯(lián)系點。軟件集300a、300b、300c、300d、300e、300f可以向模塊管理組件140暴露它們提供的服務(wù)。換言之,在一個實現(xiàn)方式中,由模塊管理組件140代表單一聯(lián)系點。模塊管理組件140通過該單一聯(lián)系點向軟件集300a、300b、300c、300d、300e、300f暴露注冊服務(wù)、訂閱服務(wù)和/或通知服務(wù)。在注冊階段期間,例如當(dāng)軟件集300a、300b、300c、300d、300e、300f向客戶端100注冊以用于向用戶提供其服務(wù)時,軟件集300a、300b、300C、300d、300e、300f使用注冊服務(wù)通知客戶端100。軟件集300a、300b、300c、300d、300e、300f可以通知客戶端100其(軟件集300a、300b、300c、300d、300e、300f)正在運行,可以輸出關(guān)于其自身(軟件集300a、300b、300c、300d、300e、300f)的信息(諸如其類別、供應(yīng)商、序號等)和/或可以向客戶端100提供其(軟件集 300a、300b、300c、300d、300e、300f 的)能力。軟件集 300a、300b、300c、300d、300e、300f的能力可以包括軟件集300a、300b、300c、300d、300e、300f能夠執(zhí)行的一個或者多個命令,例如打開/關(guān)閉電燈的燈光、運行洗衣機的周期、為DVD播放器安排節(jié)目等。一旦軟件集 300a、300b、300c、300d、300e、300f 獲知了 軟件集 300a、300b、300c、300d、300e、300f,則客戶端100可以要求用戶提供針對軟件集300a、300b、300c、300d、300e、300f的附加信息,諸如由軟件集 300a、300b、300c、300d、300e、300f 控制的設(shè)備 410、420、430、440、450,460的物理位置,與設(shè)備410、420、430、440、450、460相關(guān)聯(lián)的用戶,和/或可以通過針對軟件集300a、300b、300c、300d、300e、300f指定相應(yīng)的命令以執(zhí)行動作來在設(shè)備410、420、430、440、450、460上執(zhí)行的可能的動作等。用戶可以通過⑶I 170、例如通過與設(shè)備控件和/或軟件集動作控件進行交互來指定此類附加信息。用戶輸入可以與軟件集300a、300b、300c、300d、300e、300f —起存儲和/或存儲在家庭知識組件150中。經(jīng)先前注冊的軟件集300a、300b、300c、300d、300e、300f通過訂閱服務(wù)來訂閱客戶端100。在訂閱了客戶端100的情況下,軟件集300a、300b、300c、300d、300e、300f可以執(zhí)行針對客戶端100的請求,以處理在處理用戶請求期間由服務(wù)器200接收的標(biāo)簽的列表和/或標(biāo)識將由軟件集300a、300b、300c、300d、300e、300f采取的相應(yīng)的動作。在軟件集300a、300b、300c、300d、300e、300f響應(yīng)于用戶請求來執(zhí)行動作的情況下,客戶端100向軟件集300a、300b、300c、300d、300e、300f通知一個或者多個命令,以在由軟件集300a、300b、300c、300d、300e、300f控制的設(shè)備410、420、430、440、450、460處執(zhí)行相應(yīng)的動作。在框架按照被動模式進行操作的情況下,向客戶端100訂閱的軟件集300a、300b、300c、300d、300e、300f可以執(zhí)行對客戶端100的請求以接收數(shù)據(jù)流中的標(biāo)簽的列表。軟件集300a、300b、300c、300d、300e、300f繼而負(fù)責(zé)執(zhí)行與通過用戶請求確定的標(biāo)簽的列表有關(guān)的一個 或者多個動作。取決于軟件集300a、300b、300c、300d、300e、300f已在客戶端100處訂閱的至少一個服務(wù),當(dāng)執(zhí)行通知服務(wù)時,來自客戶端100的通知可以取決于框架所處于的實際模式而包括不同信息用于按照主動模式進行執(zhí)行的命令或者在被動模式中將觸發(fā)所請求的動作的所檢測的情感的列表。例如,客戶端100可以通知軟件集300a、300b、300c、300d、300e、300f來執(zhí)行通過從用戶請求生成的標(biāo)簽的列表而確定的命令。在另一示例中,客戶端100可以響應(yīng)于處理用戶請求而通知一個或者多個軟件集300a、300b、300c、300d、300e、300f關(guān)于由服務(wù)器200接收的標(biāo)簽的列表。從客戶端100向軟件集300a、300b、300c、300d、300e、300f發(fā)送所述通知,該通知可以定期地和/或在每次在客戶端100處接收到新標(biāo)簽時請求新列表,并且通知軟件集 300a、300b、300c、300d、300e、300f。除了軟件集300a、300b、300c、300d、300e、300f對客戶端100的上述注冊、訂閱和/或通知服務(wù)之外,軟件集300a、300b、300c、300d、300e、300f可以為了用戶要求進一步的配置而在框架中適當(dāng)?shù)貏幼鳌@纾浖?00a、300b、300c、300d、300e、300f可以改變其行為、可以從用戶請求關(guān)于如何響應(yīng)于用戶請求來執(zhí)行動作的附加信息。為了支持對軟件集300a、300b、300c、300d、300e、300f進行基于用戶的配置,客戶端100的模塊管理組件140向軟件集300a、300b、300c、300d、300e、300f暴露服務(wù)的集合以允許軟件集300a、300b、300c、300d、300e、300f訪問⑶I 170。如上所述,⑶I 170向用戶提供用于基于其個人需要來配置軟件集300a、300b、300c、300d、300e、300f的功能。以這種方式,可以降低對框架的開發(fā)努力,從而使得該框架的實現(xiàn)方式更加有效和靈活。圖3A和圖3B示出了用戶與參考圖2所描述的框架的示例性交互。應(yīng)當(dāng)理解,參考圖2中所示的實體描述的特征和/或?qū)傩砸部梢詰?yīng)用于圖3A和圖3B中示出的實體,其中相同的實體具有相同的參考號。圖3A示出了當(dāng)按照主動模式進行操作時、在圖2的框架中執(zhí)行的交互的示例性序列。用戶10已通過從通過⑶I 170暴露的模式選擇控件選擇并且激活主動模式而為客戶端100(并且因而為該框架)選擇了主動模式。例如,用戶10希望請求客戶端100來打開他房間中的臺燈的燈光。出于這一目的,用戶訪問客戶端100的GUI 170并且激活主動請求控件。當(dāng)主動請求控件被激活時,用戶10通過說出以下句子“請打開我房間中的臺燈”來執(zhí)行用戶請求。在Al處,由話音記錄組件120記錄用戶的話音和用戶請求。在A2處,話音記錄組件120對用戶請求進行采樣。將話音樣本格式化并且數(shù)字化為語音信號,以便將其通過網(wǎng)絡(luò)500發(fā)送至服務(wù)器200以供進一步處理。將語音信號發(fā)送至通信和協(xié)作組件110。在A3處,通信和協(xié)作組件110將對服務(wù)器200的請求格式化,該請求包括語音信號、在話音記錄組件120處生成的用戶請求的話音樣本和/或關(guān)于用戶10和/或關(guān)于在用戶請求中尋址的設(shè)備410、420、430、440、450、460的信息,諸如唯一設(shè)備標(biāo)識符。在服務(wù)器200的通信和協(xié)作組件210處接收用于服務(wù)于用戶請求的話音樣本和/或附加信息。在A4處,通信和協(xié)作組件210向話音標(biāo)識組件220提供話音樣本。話音標(biāo)識組件 220從用戶10的話音樣本標(biāo)識誰執(zhí)行了請求。在標(biāo)識了用戶10之后,在A5處,話音標(biāo)識組件220向通信和協(xié)作組件210發(fā)送相應(yīng)的用戶身份(用戶ID)。通信和協(xié)作組件210與當(dāng)前處理的用戶請求聯(lián)合存儲用戶ID,從而使得當(dāng)對所述用戶請求進行響應(yīng)時可以將用戶ID發(fā)送回客戶端100。在A6處,通信和協(xié)作組件210向自動語音識別組件240發(fā)送用戶10的話音樣本。通信和協(xié)作組件210可以附加地向自動語音識別組件240發(fā)送用戶10的相應(yīng)的、所確定的用戶ID,以便改進自動語音識別組件240的執(zhí)行。在已接受了話音樣本之后,自動語音識別組件240將話音樣本轉(zhuǎn)化為文本。例如,自動語音識別組件240可以實現(xiàn)可用的語音識別系統(tǒng)以將對應(yīng)于用戶請求的用戶10的話音樣本轉(zhuǎn)換為文本。在用戶10的用戶ID與話音樣本一起在自動語音識別組件240處接收時,可以將對匹配話音樣本的、可能的音節(jié)和/或字模的確定限制為關(guān)于用戶10。在將話音樣本轉(zhuǎn)錄為文本之后,在A7處,自動語音識別組件240向通信和協(xié)作組件210發(fā)送所生成的文本。通信和協(xié)作組件210可以與用戶請求、用戶ID和/或用戶請求的話音樣本關(guān)聯(lián)地存儲所接收的文本。在AS處,通信和協(xié)作組件210向語義組件250發(fā)送從用戶10的話音樣本生成的文本。語義組件250處理該文本以從該文本生成一個或者多個標(biāo)簽的列表。語義組件250可以通過經(jīng)由訪問家庭知識組件150來使用和/或?qū)崿F(xiàn)語義詞典、停用詞列表和/或語義網(wǎng)絡(luò)來從該文本生成標(biāo)簽的列表。例如,通過從如之前描述的翻譯為文本的用戶請求(即從“請打開我房間中的臺燈”)移除停用詞;通過制作所用字詞之間的語義關(guān)聯(lián)(例如將“臺燈”與“電燈”(其為“光”)相關(guān)聯(lián));和/或通過在該文本中的字詞之間導(dǎo)出語義關(guān)系,語義組件250可以從所接收的文本生成標(biāo)簽的列表{ “臺燈”,“打開”,“房間”}。在A9處,語義組件250向通信和協(xié)作組件210發(fā)送所生成的標(biāo)簽的列表,以格式化和/或生成將向客戶端100發(fā)送的相應(yīng)的響應(yīng)。該響應(yīng)可以包括對應(yīng)于用戶10的用戶請求的所生成的標(biāo)簽的列表、用戶10的用戶ID和/或如下附加信息,可以要求該附加信息以指示軟件集300a、300b、300c、300d、300e、300f來在數(shù)字網(wǎng)絡(luò)400中的設(shè)備410、420、430、440,450,460之一處執(zhí)行相應(yīng)的動作。在AlO處,通過網(wǎng)絡(luò)500向客戶端的通信和協(xié)作組件110發(fā)送回經(jīng)格式化的響應(yīng)。在All處,通信與協(xié)作組件110向動作計劃組件160發(fā)送該響應(yīng)。基于該響應(yīng),動作計劃組件160選擇數(shù)字網(wǎng)絡(luò)中的目標(biāo)設(shè)備410、420、430、440、450、460以及將被執(zhí)行的相應(yīng)的動作。例如,通過所接收的響應(yīng),動作計劃組件160根據(jù)用戶ID推斷用戶10是“Sarah”。通過檢查與該響應(yīng)一起接收的標(biāo)簽的列表,動作計劃組件160例如基于該標(biāo)簽的列表中的術(shù)語“臺燈”推斷目標(biāo)設(shè)備的類別。數(shù)字網(wǎng)絡(luò)400的設(shè)備410、420、430、440、450、460可以存儲在語義網(wǎng)絡(luò)中,該語義網(wǎng)絡(luò)存儲在家庭知識組件150處。在已確定了目標(biāo)設(shè)備的類別之后,動作計劃組件160可以通過標(biāo)簽的列表中的詞“房間”和用戶10的身份“Sarah”確定數(shù)字網(wǎng)絡(luò)400中的具體目標(biāo)設(shè)備410、420、430、440、450、460 (即臺燈在Sarah的房間中)。通過標(biāo)簽的列表中的詞“打開”,動作計劃組件160通過訪問家庭知識組件150、確定將在Sarah的房間中的臺燈上執(zhí)行的相應(yīng)的動作,即打開該臺燈。在確定了目標(biāo)設(shè)備410、420、430、440、450、460 以及將在所述設(shè)備 410、420、430、440、450、460 上執(zhí)行的動作之后,在A12處,動作計劃組件160向通信和協(xié)作組件110轉(zhuǎn)發(fā)相應(yīng)的命令(例如,指定目標(biāo)設(shè)備410、420、430、440、450、460,Sarah的房間中的臺燈,以及將在所述設(shè)備410、420、430、440,450,460上執(zhí)行的動作,即打開設(shè)備410、420、430、440、450、460)。在A13處,通信和協(xié)作組件110向模塊管理組件140發(fā)送命令,該命令觸發(fā)目標(biāo)軟件集300a、300b、300c、300d、30(^、30(^,該目標(biāo)軟件集控制所確定的目標(biāo)設(shè)備410、420、430、440、450、460來在該目標(biāo) 設(shè)備410、420、430、440、450、460上執(zhí)行所請求的動作,即打開Sarah的房間中的臺燈的燈光。在執(zhí)行了所指示的動作之后,在A14處,模塊管理組件140向通信和協(xié)作組件110返回所采取的動作的相應(yīng)的結(jié)果。例如,模塊管理組件140返回該動作的結(jié)果,即打開了目標(biāo)設(shè)備410、420、430、440、450、460的燈光。在A15處,通信和協(xié)作組件110向文本轉(zhuǎn)語音組件130提供相應(yīng)的響應(yīng),該文本轉(zhuǎn)語音組件130從該響應(yīng)例如通過使用可用的語音合成系統(tǒng)生成聲音或語音輸出。在A16處,例如通過話音接口向用戶10播放聲音反饋。圖3B示出了當(dāng)按照被動模式進行操作時、在圖2中示出的框架中執(zhí)行的交互的示例性序列。用戶10已通過從通過⑶I 170暴露的模式選擇控件選擇并且激活被動模式而為客戶端100(并且因而為該框架)選擇了被動模式。在Pl處,用戶10正在發(fā)言并且其話音由話音記錄組件120進行記錄。在P2處,話音記錄組件120對用戶10的話音進行采樣并且將話音樣本數(shù)字化為語音信號以便通過網(wǎng)絡(luò)500發(fā)送至在該框架中運作的服務(wù)器200。話音記錄組件120在相應(yīng)的語音信號中向通信和協(xié)作組件110發(fā)送發(fā)言的用戶10的話音樣本。在P3處,通信和協(xié)作組件110針對服務(wù)器200對請求進行格式化,該請求可以包括在話音記錄組件120處生成的語音信號中的話音樣本和/或關(guān)于用戶10的信息和/或關(guān)于在該用戶請求中尋址的設(shè)備410、420、430、440>450>460的信息(諸如唯一設(shè)備標(biāo)識符)。在P4處,通信和協(xié)作組件210向話音標(biāo)識組件220提供從客戶端100接收的話音樣本。話音標(biāo)識組件220從該話音樣本標(biāo)識已執(zhí)行了請求的用戶10并且提供相應(yīng)的用戶ID。在P5處,通信和協(xié)作組件210向語音情感識別組件230提供從客戶端100接收的話音樣本。語音情感識別組件230可以實現(xiàn)可用的情感識別系統(tǒng)以從所接收的話音樣本確定用10的情感。例如,語音情感識別組件230可以從用戶10的所接收的話音樣本確定用戶10處于“高興”情緒中。在P6處,語音情感識別組件230向通信和協(xié)作組件210發(fā)送用戶10的情感(在當(dāng)前示例中為“高興”),通信和協(xié)作組件210存儲與當(dāng)前處理的用戶請求和/或用戶10關(guān)聯(lián)的用戶10的情感“高興”。在P7中,話音標(biāo)識組件220向通信和協(xié)作組件210發(fā)送用戶10的所確定的用戶ID,通信和協(xié)作組件210存儲與當(dāng)前用戶請求和/或用戶10關(guān)聯(lián)的用戶10的用戶ID。在P8處,通信和協(xié)作組件210向自動語音識別組件240發(fā)送用戶10的話音樣本。通信和協(xié)作組件210可以向自動語音識別組件240附加地發(fā)送用戶10的相應(yīng)的、所確定的用戶ID,以便改進自動語音識別組件240的執(zhí)行。在接收了話音樣本之后,自動語音識別組件240將該話音樣本轉(zhuǎn)化為文本。例如,自動語音識別組件240可以實現(xiàn)可用的語音識別系統(tǒng)以將對應(yīng)于當(dāng)前用戶請求的用戶10的話音樣本轉(zhuǎn)換為文本。在用戶10的用戶ID與話音樣本一起在自動語音識別組件240處接收時,可以將對匹配話音樣本的、可能的音節(jié)和/或字模的確定限制為關(guān)于用戶10。在將話音樣本轉(zhuǎn)錄為文本之后,在P9處,自動語音識別組件240向通信和協(xié)作組件210發(fā)送所生成的文本。通信和協(xié)作組件210可以與用戶請求、用戶ID、用戶10的用戶請求的話音樣本和/或用戶10的所確定的情感“高興”關(guān)聯(lián)地存儲所接收的文本。在PlO處,通信和協(xié)作組件210向語義組件250發(fā)送從用戶請求 的話音樣本生成的文本。語義組件250處理該文本以從該文本生成一個或者多個標(biāo)簽的列表。語義組件250可以通過經(jīng)由訪問家庭知識組件150來使用和/或?qū)崿F(xiàn)語義詞典、停用詞列表和/或語義網(wǎng)絡(luò)來從該文本生成標(biāo)簽的列表。例如,通過從如之前描述的處理為文本的用戶請求移除停用詞;通過制作所用字詞之間的語義關(guān)聯(lián)(例如因為例如用戶10正與朋友談?wù)撍奶煸谌龆u的假期而將“撒丁島”與“意大利”相關(guān)聯(lián)),和/或通過在該句子中的字詞之間導(dǎo)出語義關(guān)系,語義功能可以從所接收的文本生成標(biāo)簽的列表{ “假期”,“海灘”,“撒丁島”}。在Pll處,語義組件250向通信和協(xié)作組件210發(fā)送所生成的標(biāo)簽的列表,以格式化和/或生成將向客戶端100發(fā)送的相應(yīng)的響應(yīng)。該響應(yīng)可以包括對應(yīng)于用戶10的用戶請求的所生成的標(biāo)簽的列表、用戶10的用戶ID、用戶10的所確定的情緒(例如“高興”)和/或如下附加信息,可以要求該附加信息以指示軟件集300a、300b、300c、300d、300e、300f來通過數(shù)字網(wǎng)絡(luò)400中的設(shè)備410、420、430、440、450、460之一執(zhí)行相應(yīng)的動作。在P12處,通過網(wǎng)絡(luò)500向客戶端的通信和協(xié)作組件110發(fā)送回經(jīng)格式化的響應(yīng)。已從服務(wù)器200接收到經(jīng)格式化的響應(yīng)的客戶端100的通信和協(xié)作組件110向模塊管理組件140發(fā)送標(biāo)簽的列表、所確定的用戶情感和/或用戶ID。模塊管理組件觸發(fā)一個或者多個軟件集300a、300b、300c、300d、300e、300f,該軟件集已訂閱了對一個或這多個所指定的用戶情感(例如對情感“高興”)進行反應(yīng)的相應(yīng)的服務(wù)。軟件集300a、300b、300C、300d、300e、300f基于用戶定義的內(nèi)部配置處理標(biāo)簽的列表。例如,用戶可以已配置了一個或者多個軟件集300a、300b、300c、300d、300e、300f來通過數(shù)字網(wǎng)絡(luò)400的設(shè)備410、420、430、440、450、460控制計算機設(shè)備和/或TV設(shè)備以示出來自用戶的在撒丁島的上個假期的照片。在觸發(fā)了相應(yīng)的軟件集300a、300b、300c、300d、300e、300f之后,模塊管理組件140向通信和協(xié)作組件110給出對所執(zhí)行的動作的反饋。圖4示出了用于實現(xiàn)本發(fā)明的、包括按照常規(guī)計算環(huán)境920的形式的通用計算設(shè)備(即個人計算機)的示例性系統(tǒng)。常規(guī)計算環(huán)境包括處理單元922、系統(tǒng)存儲器924和系統(tǒng)總線926。系統(tǒng)總線將包括系統(tǒng)存儲器924在內(nèi)的各種系統(tǒng)組件稱合至處理單兀922。處理單元922可以通過訪問系統(tǒng)存儲器924來執(zhí)行算術(shù)、邏輯和/或控制操作。系統(tǒng)存儲器924可以存儲用于與處理單元922結(jié)合使用的信息和/或指令。系統(tǒng)存儲器924可以包括易失性和非易失性存儲器,諸如隨機存取存儲器(RAM)928和只讀存儲器(ROM)930。在ROM 930中可以存儲基本輸入/輸出系統(tǒng)(BIOS),BI0S包含有有助于在個人計算機920內(nèi)的元件之間傳送信息(諸如在啟動期間)的基本例程。系統(tǒng)總線926可以是任何各種類型的總線結(jié)構(gòu),包括存儲器總線或者存儲器控制器、外圍設(shè)備總線,以及使用任何各種總線架構(gòu)的本地總線。個人計算機920可以進一步包括用于從硬盤(未示出)進行讀取和向該硬盤進行寫入的硬盤驅(qū)動器932,以及用于從可移動磁盤936進行讀取和向可移動磁盤936進行寫入的外部盤驅(qū)動器934。可移動磁盤可以是用于磁盤驅(qū)動器的磁盤或者用于光盤驅(qū)動器的、諸如⑶ROM之類的光盤。硬盤驅(qū)動器932和外部盤驅(qū)動器934分別通過硬盤驅(qū)動器接口938和外圍磁盤驅(qū)動器接口 940連接至系統(tǒng)總線926。驅(qū)動器及其相關(guān)聯(lián)的計算機可讀介質(zhì)為計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊以及用于個人計算機920的其他數(shù)據(jù)提供非易失性存儲。數(shù)據(jù)結(jié)構(gòu)可以包括用于如下方法的實現(xiàn)方式的相關(guān)數(shù)據(jù),該方法如上所述用于對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制。可以將相關(guān)數(shù)據(jù)組織在數(shù)據(jù)庫中,例如關(guān)系數(shù)據(jù)庫管理系統(tǒng)或者面向?qū)ο髷?shù)據(jù)庫管理系統(tǒng)。 雖然在此描述的示例性環(huán)境使用了硬盤(未示出)以及外部盤936,但本領(lǐng)域技術(shù)人員應(yīng)當(dāng)領(lǐng)會到,也可以在示例性操作環(huán)境中使用其他類型的計算機可讀介質(zhì),這些介質(zhì)可以存儲可由計算機訪問的數(shù)據(jù),這些介質(zhì)諸如磁帶盒、閃存卡、數(shù)字視頻盤、隨機存取存儲器、只讀存儲器等。可以在硬盤、外部盤936、R0M 930或者RAM 928上存儲多個程序模塊,包括操作系統(tǒng)(未示出)、一個或者多個應(yīng)用程序944、其他程序模塊(未示出)以及程序數(shù)據(jù)946。應(yīng)用程序可以包括如在圖I、圖2、圖3A和/或圖3B中描述的功能的至少一部分。用戶可以如下所述通過注入鍵盤948和鼠標(biāo)950之類的輸入設(shè)備在個人計算機920中錄入命令和信息。其他輸入設(shè)備(未示出)可以包括麥克風(fēng)(或者其他傳感器)、操縱桿、游戲手柄、掃描儀等。這些和其他輸入設(shè)備可以通過耦合到系統(tǒng)總線926的串行端口接口 952連接到處理單元922,或者可以通過注入并行端口接口 954、游戲端口或者通用串行總線(USD)連接。此外,可以使用打印機956打印信息。打印機956和其他并行輸入/輸出設(shè)備可以通過并行端口接口 954連接到處理單元922。監(jiān)視器958或者其他類型的顯示設(shè)備也經(jīng)由諸如視頻輸入/輸出960之類的接口連接到系統(tǒng)總線926。除了監(jiān)視器以外,計算環(huán)境920可以包括其他外圍輸出設(shè)備(未示出),諸如揚聲器或者其他可聽輸出。計算環(huán)境920可以與諸如計算機、電話(有線或者無線)、個人數(shù)字助理、電視之類的其他電子設(shè)備進行通信。為了進行通信,計算環(huán)境920可以在使用到一個或者多個電子設(shè)備的連接的聯(lián)網(wǎng)環(huán)境中運作。圖4描繪了與遠(yuǎn)程計算機962聯(lián)網(wǎng)的計算環(huán)境。遠(yuǎn)程計算機962可以是了諸如服務(wù)器、路由器、網(wǎng)絡(luò)PC、對等設(shè)備或者其他普通網(wǎng)絡(luò)節(jié)點之類的另一計算環(huán)境,并且可以包括以上相對于計算環(huán)境920描述的元件中的許多或者全部。在圖4中描繪的邏輯連接包括局域網(wǎng)(LAN)964和廣域網(wǎng)(WAN)966。此類聯(lián)網(wǎng)環(huán)境常見于辦公室、企業(yè)計算機網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)和因特網(wǎng)中,并且特別地可以被加密。當(dāng)在LAN聯(lián)網(wǎng)環(huán)境中使用時,計算環(huán)境920可以通過網(wǎng)絡(luò)1/0968連接至LAN 964。當(dāng)在WAN聯(lián)網(wǎng)環(huán)境中使用時,計算環(huán)境920可以包括調(diào)制解調(diào)器970或者用于建立通過WAN966的通信的其他裝置。可以位于計算環(huán)境920的內(nèi)部或者外部的調(diào)制解調(diào)器970經(jīng)由串行端口接口 952連接到系統(tǒng)總線926。在聯(lián)網(wǎng)環(huán)境中,相對于計算環(huán)境920所描繪的程序模塊或其部分可以存儲在位于遠(yuǎn)程計算機962或可由遠(yuǎn)程計算機962訪問的遠(yuǎn)程存儲器存儲設(shè)備中。此外,與用于優(yōu)化對策略的評估的方法(以上描述的)相關(guān)的其他數(shù)據(jù)可以位于遠(yuǎn)程計算機962上或可經(jīng)由遠(yuǎn)程計算機962訪問。應(yīng)當(dāng)領(lǐng)會到,所是的網(wǎng)絡(luò)連接是示例性的并且可以使用在電子設(shè)備之間建立通信鏈路的其他裝置。上述計算系統(tǒng)僅為可以用于實現(xiàn)用于對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制的方法的計算系統(tǒng)類型的一個示例。參考號列表10 用戶A1-A16按照主動模式進行操作的框架的方法步驟

P1-P14按照被動模式進行操作的框架的方法步驟12 用戶請求14 語言信息16 非語言信息100客戶端110通信和協(xié)作組件120話音記錄組件130文本轉(zhuǎn)語音組件140模塊管理組件150家庭知識組件160動作計劃組件170圖形用戶界面(GUI)200服務(wù)器210通信和協(xié)作組件220話音標(biāo)識組件230語音情感識別組件240自動語音識別組件250語義組件300a、300b、300c、300d、300e、300f 軟件集400數(shù)字網(wǎng)絡(luò)500網(wǎng)絡(luò)(例如因特網(wǎng))920常規(guī)計算環(huán)境922 處理單元924系統(tǒng)存儲器926系統(tǒng)總線928隨機存取存儲器(RAM)930只讀存儲器(ROM)932硬盤驅(qū)動器934外部盤驅(qū)動器936可移動磁盤
938硬盤驅(qū)動器接口940外部盤驅(qū)動器接口944一個或者多個應(yīng)用程序946程序數(shù)據(jù)948鍵盤950鼠標(biāo)952串行端口接口 954并行端口接口956打印機958監(jiān)視器960視頻輸入/輸出962遠(yuǎn)程計算機964局域網(wǎng)(LAN)966廣域網(wǎng)(WAN)968j 網(wǎng)絡(luò) I/O970調(diào)制解調(diào)器
權(quán)利要求
1.一種用于對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制的計算機網(wǎng)絡(luò),所述網(wǎng)絡(luò)包括 數(shù)字網(wǎng)絡(luò)(400),可操作用于在所述數(shù)字網(wǎng)絡(luò)(400)中連接的多個設(shè)備(410、420、430、440,450,460)之間提供對網(wǎng)絡(luò)(500)的訪問的共享; 客戶端(100),安裝在所述數(shù)字網(wǎng)絡(luò)(400)中并且可操作用于向用戶(10)提供用于使用自然語言控制所述數(shù)字網(wǎng)絡(luò)(400)的統(tǒng)一自然語言接口 ; 服務(wù)器(200),通過所述網(wǎng)絡(luò)(400)連接至所述客戶端(100)并且可操作用于處理所述用戶(10)通過所述統(tǒng)一自然語言接口執(zhí)行的用戶請求;以及 一個或者多個軟件代理(300&、30013、300(3、300(1、3006、30(^),可操作用于基于經(jīng)處理的用戶請求在所述多個設(shè)備(410、420、430、440、450、460)的至少一個設(shè)備上執(zhí)行至少一個動作。
2.根據(jù)權(quán)利要求I所述的計算機網(wǎng)絡(luò),其中所述客戶端(100)包括模塊管理組件(140),所述模塊管理組件(140)可操作用于向所述一個或者多個軟件代理(300a、300b、300c、300d、300e、300f)提供接口以用于向所述客戶端(100)發(fā)布由所述一個或者多個軟件代理(300a、300b、300c、300d、300e、300f)提供的一個或者多個動作。
3.根據(jù)權(quán)利要求2所述的計算機網(wǎng)絡(luò),其中所述客戶端(100)包括向所述用戶(10)暴露的圖形用戶界面⑶I (170),以用于指定對將由所述多個軟件代理(300a、300b、300c、300d.300e.300f)在所述多個設(shè)備(410、420、430、440、450、460)的至少一個設(shè)備上執(zhí)行的動作的用戶定義的設(shè)置。
4.根據(jù)權(quán)利要求3所述的計算機網(wǎng)絡(luò),其中所述模塊管理組件(140)進一步可操作用于向所述一個或者多個軟件代理(300a、300b、300c、300d、300e、300f)輸出功能集合,以允許所述一個或者多個軟件代理(300a、300b、300c、300d、300e、300f)訪問所述⑶I (170)。
5.根據(jù)前述任一權(quán)利要求所述的計算機網(wǎng)絡(luò),其中所述客戶端(100)包括家庭知識組件(150),所述家庭知識組件(150)包括語義詞典,其中所述語義詞典指定關(guān)于所述數(shù)字網(wǎng)絡(luò)(400)中的所述多個設(shè)備(410、420、430、440、450、460)的、與控制所述多個設(shè)備(410、420、430、440、450、460)相關(guān)的信息。
6.根據(jù)權(quán)利要求5所述的計算機網(wǎng)絡(luò),其中所述語義詞典包括針對所述多個設(shè)備(410、420、430、440、450、460)的設(shè)備類別、所述設(shè)備類別之間和/或所述多個設(shè)備(410、420、430、440、450、460)之間的關(guān)系以及所述設(shè)備類別和/或所述多個設(shè)備(410、420、430、440、450、460)的屬性。
7.根據(jù)前述任一權(quán)利要求所述的計算機網(wǎng)絡(luò),其中所述服務(wù)器(200)可操作用于處理所述用戶請求以產(chǎn)生標(biāo)簽的列表,所述標(biāo)簽的列表可由所述客戶端(100)使用以觸發(fā)所述多個軟件代理(300a、300b、300c、300d、300e、300f)來在所述多個設(shè)備(410、420、430、440、450、460)的至少一個設(shè)備上執(zhí)行所述至少一個動作。
8.根據(jù)前述任一權(quán)利要求所述的計算機網(wǎng)絡(luò),其中所述服務(wù)器(200)可操作用于通過解釋從所述用戶請求提取的語言信息和/或非語言信息來處理所述用戶請求。
9.一種用于對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制的計算機實現(xiàn)的方法,所述方法包括 在客戶端(100)向用戶提供用于使用自然語言控制數(shù)字網(wǎng)絡(luò)(400)的統(tǒng)一自然語言接口,其中所述數(shù)字網(wǎng)絡(luò)(400)可操作用于在所述數(shù)字網(wǎng)絡(luò)(400)中連接的多個設(shè)備(410、.420、430、440、450、460)之間提供對網(wǎng)絡(luò)(500)的訪問的共享; 向服務(wù)器(200)發(fā)送用戶(10)通過所述統(tǒng)一自然語言接口執(zhí)行的用戶請求,其中所述服務(wù)器(200)通過所述網(wǎng)絡(luò)(500)連接至所述客戶端(100)并且可操作用于處理所述用戶請求;以及 觸發(fā)一個或者多個軟件代理(300a、300b、300c、300d、300e、300f)基于經(jīng)處理的用戶請求在所述多個設(shè)備(410、420、430、440、450、460)的至少一個設(shè)備上執(zhí)行至少一個動作。
10.根據(jù)權(quán)利要求9所述的方法,所述方法進一步包括 在所述客戶端(100)的模塊管理組件(140)處向所述一個或者多個軟件代理(300a、.300b、300c、300d、300e、300f)提供接口以用于向所述客戶端(100)發(fā)布由所述一個或者多個軟件代理(300a、300b、300c、300d、300e、300f)提供的一個或者多個動作。
11.根據(jù)權(quán)利要求10所述的方法,所述方法進一步包括 在所述客戶端(100)處向所述用戶(10)暴露圖形用戶界面GUI (170),以用于指定對將由所述多個軟件代理(300a、300b、300c、300d、300e、300f)在所述多個設(shè)備(410、420、430、.440、450、460)的至少一個設(shè)備上執(zhí)行的動作的用戶定義的設(shè)置。
12.根據(jù)權(quán)利要求11所述的方法,所述方法進一步包括 通過所述模塊管理組件(140)向所述一個或者多個軟件代理(300a、300b、300c、300d、.300e、300f)輸出功能集合,以允許所述一個或者多個軟件代理(300a、300b、300c、300d、.300e、300f)訪問所述 GUI (170)。
13.—種包括計算機可讀指令的計算機程序產(chǎn)品,當(dāng)在計算機系統(tǒng)和/或計算機網(wǎng)絡(luò)系統(tǒng)中加載并且執(zhí)行所述計算機可讀指令時,使得所述計算機系統(tǒng)和/或所述計算機網(wǎng)絡(luò)系統(tǒng)執(zhí)行根據(jù)權(quán)利要求9至11中任一權(quán)利要求所述的方法的操作。
14.一種用于對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制的客戶端(100),所述客戶端(100)包括 統(tǒng)一自然語言接口,可操作用于接收用于使用自然語言控制數(shù)字網(wǎng)絡(luò)(400)的用戶請求,其中所述數(shù)字網(wǎng)絡(luò)(400)可操作用于在所述數(shù)字網(wǎng)絡(luò)(400)中連接的多個設(shè)備(410、.420、430、440、450、460)之間提供對網(wǎng)絡(luò)(500)的訪問的共享;以及 模塊管理組件(140),可操作用于向一個或者多個軟件代理(300a、300b、300c、300d、.300e、300f)提供接口以用于向所述客戶端(100)發(fā)布由所述一個或者多個軟件代理(300a、300b、300c、300d、300e、300f)提供的一個或者多個動作,其中所述一個或者多個軟件代理(300a、300b、300c、300d、300e、300f)可操作用于基于所述用戶請求在所述多個設(shè)備(410、420、430、440、450、460)的至少一個設(shè)備上執(zhí)行至少一個動作, 其中所述客戶端(100)安裝在所述數(shù)字網(wǎng)絡(luò)(400)中。
15.一種用于對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制的服務(wù)器(200),所述服務(wù)器(200)包括 接口,可操作用于處理從客戶端(100)接收的用戶請求, 其中所述用戶請求是通過在所述客戶端(100)處、使用自然語言控制數(shù)字網(wǎng)絡(luò)(400)的統(tǒng)一自然語言接口執(zhí)行的,其中所述數(shù)字網(wǎng)絡(luò)(400)可操作用于在所述數(shù)字網(wǎng)絡(luò)(400)中連接的多個設(shè)備(410、420、430、440、450、460)之間提供對網(wǎng)絡(luò)(500)的訪問的共享;以及其中所述用戶請求被處理以產(chǎn)生標(biāo)簽的列表,所述標(biāo)簽的列表可由所述客戶端(100)使用以觸發(fā)多個軟件代理(300a、300b、300c、300d、300e、300f)基于經(jīng)處理的用戶請求在所述多個設(shè)備(410、420、430、440、450、460)的至少一個設(shè)備上執(zhí)行至少一個動作。
全文摘要
本申請涉及用于對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制的計算機網(wǎng)絡(luò)、計算機實現(xiàn)的方法、計算機程序產(chǎn)品、客戶端和服務(wù)器。在一個方面中,用于對數(shù)字網(wǎng)絡(luò)進行基于自然語言的控制的計算機網(wǎng)絡(luò)包括數(shù)字網(wǎng)絡(luò),可操作用于在該數(shù)字網(wǎng)絡(luò)中連接的多個設(shè)備之間提供對網(wǎng)絡(luò)訪問的共享;客戶端,安裝在該數(shù)字網(wǎng)絡(luò)中并且可操作用于向用戶提供用于使用自然語言控制該數(shù)字網(wǎng)絡(luò)的統(tǒng)一自然語言接口;服務(wù)器,通過該網(wǎng)絡(luò)連接至該客戶端并且可操作用于處理該用戶通過該統(tǒng)一自然語言接口執(zhí)行的用戶請求;以及一個或者多個軟件代理,可操作用于基于經(jīng)處理的用戶請求在該多個設(shè)備的至少一個設(shè)備上執(zhí)行至少一個動作。
文檔編號G10L15/28GK102682769SQ20121003090
公開日2012年9月19日 申請日期2012年2月6日 優(yōu)先權(quán)日2011年3月7日
發(fā)明者D·德埃里科, F·馬莫利蒂, G·卡普奧佐, M·伯爾格希尼 申請人:埃森哲環(huán)球服務(wù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 宁武县| 桃源县| 元江| 南安市| 大化| 临洮县| 临桂县| 沽源县| 泸溪县| 云林县| 金坛市| 阳西县| 星座| 望城县| 镇坪县| 洮南市| 河南省| 平泉县| 新河县| 阿城市| 广丰县| 赫章县| 合水县| 崇礼县| 宽城| 宁河县| 泰来县| 丽水市| 濮阳市| 韶关市| 洛宁县| 寿宁县| 嵊泗县| 新泰市| 安远县| 九江县| 海林市| 昌江| 津南区| 芒康县| 天等县|