機器人的交互方法及系統與流程

文檔序號：11202369閱讀：867來源：國知局

本發明實施例涉及機器人技術領域，尤其涉及一種機器人的交互方法及系統。

背景技術：

機器人(robot)是自動執行工作的機器系統。它既可以接受人類指揮，又可以運行預先編排的程序，也可以根據以人工智能技術制定的原則綱領行動，用于協助或取代人類工作。

目前，隨著科學技術的快速發展，機器人不僅僅可以應用于商業或工業，還可以作為用戶的玩伴，能夠實現與人類的正常交互。在現有技術中，由于機器人接收到外界語音后，會對接收到的語音進行解析，再匹配出與該語音相對應的文字作為應答，因此并不能快速的做出應答。

技術實現要素：

本發明實施例提供一種機器人的交互方法及系統，能夠改善機器人與人類交互中反應速度慢的現象。

第一方面，本發明實施例提供了一種機器人的交互方法，包括：

采集交互用戶的圖像信息；

將所述交互用戶的圖像信息發送至服務器；

接收所述服務器發送的與所述交互用戶的圖像信息相匹配的關鍵字符庫；

于所述關鍵字符庫中，根據接收的所述交互用戶的聲音信息確定目標關鍵字。

進一步的，所述將所述交互用戶的圖像信息發送至服務器包括：

將所述交互用戶的圖像信息以圖片格式發送至所述服務器；

或者，若所述圖像信息為視頻信息時，將所述交互用戶的圖像信息以幀圖格式發送至所述服務器。

進一步的，所述交互用戶的圖像信息包括所述交互用戶的面部表情或者動作。

進一步的，還包括：

基于所述服務器中預存的日常圖像信息，將所述日常圖像信息進行分類并匹配相應的關鍵字符庫。

進一步的，所述將所述日常圖像信息進行分類包括；

按照發生情景對所述日常圖像信息進行分類；

或者，按照所述交互用戶的情緒對所述日常圖像信息進行分類。

第二方面，本發明實施例還提供了一種機器人的交互系統，包括：

圖像信息采集模塊，用以采集交互用戶的圖像信息；

圖像信息發送模塊，用以將所述交互用戶的圖像信息發送至服務器；

關鍵字符庫接收模塊，用以接收所述服務器發送的與所述交互用戶的圖像信息相匹配的關鍵字符庫；

目標關鍵字確定模塊，用以于所述關鍵字符庫中，根據接收的所述交互用戶的聲音信息確定目標關鍵字。

進一步的，所述圖像信息發送模塊具體用以：

將所述交互用戶的圖像信息以圖片格式發送至所述服務器；

或者，若所述圖像信息為視頻信息時，將所述交互用戶的圖像信息以幀圖格式發送至所述服務器。

進一步的，所述交互用戶的圖像信息包括所述交互用戶的面部表情或者動作。

進一步的，還包括：

分類模塊，用以基于所述服務器中預存的日常圖像信息，將所述日常圖像信息進行分類并匹配相應的關鍵字符庫。

進一步的，所述分類模塊具體用以：

按照發生情景對所述日常圖像信息進行分類；

或者，按照所述交互用戶的情緒對所述日常圖像信息進行分類。

本發明實施例提供了一種機器人的交互方法及系統，若采集交互用戶的圖像信息；將所述交互用戶的圖像信息發送至服務器；接收所述服務器發送的與所述交互用戶的圖像信息相匹配的關鍵字符庫；于所述關鍵字符庫中，根據接收的所述交互用戶的聲音信息確定目標關鍵字，通過交互用戶的圖像信息縮小原有關鍵字符庫的范圍，在該關鍵字符庫中匹配出目標關鍵字，能夠改善機器人與人類交互中反應速度慢的問題，提高機器人交互中的應答速度。

附圖說明

圖1是本發明實施例一中的一種機器人的交互方法的流程圖；

圖2是本發明實施例二中的一種機器人的交互系統的結構圖。

具體實施方式

下面結合附圖和實施例對本發明作進一步的詳細說明。可以理解的是，此處所描述的具體實施例僅僅用于解釋本發明，而非對本發明的限定。另外還需要說明的是，為了便于描述，附圖中僅示出了與本發明相關的部分而非全部結構。

實施例一

圖1為本發明實施例一提供的一種機器人的交互方法的流程圖，本實施例可適用于機器人的交互情況，該方法可以由本發明實施例提供的機器人的交互系統來執行。如圖1所示，具體包括：

s110、采集交互用戶的圖像信息。

其中，交互用戶可以是機器人固定服務的專屬用戶，也可以是任何出現在機器人視覺系統中的任意用戶。圖像信息可以包括圖片信息與視頻信息。當光線照射在一個物體上時，物體的表面就會反射光線。反射光進入我們的眼睛，使我們看見東西。同理，機器人能夠看見交互用戶也是基于這個原理。又由于光的傳播速度大于聲音的傳播速度，因此機器人的視覺系統能夠先看見交互用戶的圖像信息，而后聽覺系統才能接收到交互用戶的聲音信息。

因此，機器人可以先采集交互用戶的圖像信息，根據該圖像信息分析交互用戶所在的場景或者情緒，再根據該場景或者情緒縮小機器人回復給交互用戶的應答范圍。

示例性的，所述交互用戶的圖像信息包括所述交互用戶的面部表情或者動作。

具體的，交互用戶的圖像信息內容可以包括近距離拍攝的交互用戶的面部表情，也可以是遠距離拍攝的交互用戶的動作行為。例如，機器人的視覺系統若在預設時間閾值內檢測到交互用戶無明顯動作幅度，則可以近距離拍攝交互用戶的面部表情；若在預設時間閾值內檢測到交互用戶具有重復性的動作行為，則也可以近距離拍攝交互用戶的動作行為；若在預設時間閾值內檢測到交互用戶有明顯的動作幅度，則可以遠距離拍攝交互用戶的面部表情。具體例如，若交互用戶一直走路或者坐在椅子上不動，則可以近距離拍攝交互用戶細微的面部表情；若交互用戶走路突然跌倒時，可以遠距離拍攝交互用戶的動作行為。

s120、將所述交互用戶的圖像信息發送至服務器。

由于機器人也屬于一種智能設備，而智能設備的弊端是存儲器內存容量有限以及計算處理效率慢等。因此，大多數智能終端均會與服務器相連，將存儲以及計算處理的任務轉移至服務器，由服務器進行處理。在本實施例中，當機器人的視覺系統采集到交互用戶的圖像信息后，也會將該圖像信息發送至服務器。

示例性的，所述將所述交互用戶的圖像信息發送至服務器包括：將所述交互用戶的圖像信息以圖片格式發送至所述服務器；或者，若所述圖像信息為視頻信息時，將所述交互用戶的圖像信息以幀圖格式發送至所述服務器。

由于機器人的視覺系統檢測到交互用戶后，采集圖像信息可以是以不斷拍攝交互用戶的方式，以圖片格式的圖像信息發送至服務器，也可以是以連續拍攝關于交互用戶的視頻信息的方式，將視頻信息拆分成一幅幅幀圖像，以幀圖格式發送至服務器，或者還可以是直接將拍攝的關于交互用戶的視頻信息發送至服務器。

s130、接收所述服務器發送的與所述交互用戶的圖像信息相匹配的關鍵字符庫。

其中，關鍵字符庫為服務器存儲的用于機器人語音輸出的文字的集合。關鍵字符庫中包含了所有的字、詞以及語句，且關鍵字符庫中包含的語言種類不做限定。

具體的，服務器當接收到機器人上傳的關于交互用戶的圖像信息后，將對該圖像信息進行處理。例如，服務器可以提取圖像信息中含有的交互用戶的圖像，對交互用戶的動作或者面部表情進行分析，從而確定與之相匹配的關鍵字符庫。并將該關鍵字符庫發送至機器人。

通過篩選出與交互用戶的圖像信息相匹配的關鍵字符庫，避免了機器人在檢測到交互用戶的聲音信息后，在包含全部字、詞或語句中的關鍵字符庫中進行匹配，由于縮小了關鍵字符庫的范圍，因此機器人的應答速度大幅度提高。

示例性的，還包括：基于所述服務器中預存的日常圖像信息，將所述日常圖像信息進行分類并匹配相應的關鍵字符庫。

具體的，服務器中可以預存日常圖像信息，用于輔助對接收到的交互用戶的圖像信息進行分析。其中，日常圖像信息可以是存入的各種場景的圖像，也可以是輸入的電視劇或者電影場景。將日常圖像信息進行歸類并匹配上與該日常圖像信息相對應的關鍵字符庫，其中，與該日常圖像信息相對應的關鍵字符庫中包含的文字全部適用于該日常圖像信息。

示例性的，所述將所述日常圖像信息進行分類包括；按照發生情景對所述日常圖像信息進行分類；或者，按照所述交互用戶的情緒對所述日常圖像信息進行分類。

由于交互用戶可以在任何情境下跟機器人進行互動，因此，日常圖像信息可以根據發生場景進行分類。例如，若交互用戶在家里寫作業，與之相對應的關鍵字符庫可以包含學習類的文字。又例如，若交互用戶在室外打球，與之相對應的關鍵字符庫可以包含球類相關的文字，或者鼓勵類的文字。

或者，日常圖像信息可以是按照交互用戶的情緒進行分類。例如，若交互用戶的心情很差，在圖像信息的表現方式可以是撅嘴或者流眼淚，這時與之相對應的關鍵字符庫可以包含安慰類的文字。又例如，若用戶的心情很好，在圖像信息的表現方式可以是笑臉或者歡呼雀躍，這時與之相對應的關鍵字符庫可以包含慶祝類的文字。

s140、于所述關鍵字符庫中，根據接收的所述交互用戶的聲音信息確定目標關鍵字。

具體的，機器人在接收到服務器已縮小了范圍的關鍵字符庫后，在接收到交互用戶的聲音信息后，對聲音信息進行分析，在范圍縮小后的關鍵字符庫中匹配出與聲音信息對應的關鍵字，并將該對應的關鍵字作為目標關鍵字進行輸出。

需要說明的是，現有技術中的機器人與交互用戶之間的交互都是基于檢測到交互用戶的聲音后，將采集的交互用戶的語音轉化為文字，再對該文字進行識別分析，從而在包含所有字、詞與語句的關鍵字符庫中匹配出與聲音。本實施例通過預先對拍攝的圖像信息處理，能夠縮小元還有關鍵字符庫的范圍，從而提高機器人的應答效率。

例如，交互用戶為小孩，一個小孩在跟機器人玩耍時，不小心摔倒。一般情況下，小孩會想讓機器人提供安慰的回應。因此，機器人拍攝到小孩摔倒的圖像信息，該圖像信息包含小孩摔倒的動作以及小孩的面部表情，那么機器人將該圖像信息上傳至服務器，接收由服務器匹配出與該圖像信息相對應的關鍵字符庫，該關鍵字符庫只包含了安慰類以及摔倒等相關的關鍵字，排除了開心、興奮等其他情緒，也排除了寫作業、吃飯以及打球等其他情景。隨后，機器人在檢測到小孩的聲音信息后，可以直接在該關鍵字符庫中進行匹配目標關鍵字并轉化為語音進行輸出。

本發明實施例提供了一種機器人的交互方法，若采集交互用戶的圖像信息；將所述交互用戶的圖像信息發送至服務器；接收所述服務器發送的與所述交互用戶的圖像信息相匹配的關鍵字符庫；于所述關鍵字符庫中，根據接收的所述交互用戶的聲音信息確定目標關鍵字，通過交互用戶的圖像信息縮小原有關鍵字符庫的范圍，在該關鍵字符庫中匹配出目標關鍵字，能夠改善機器人與人類交互中反應速度慢的問題，提高機器人交互中的應答速度。

實施例二

圖2為本發明實施例二提供的一種機器人的交互系統的結構示意圖，本實施例可適用于各種機器人的交互情況。如圖2所示，具體包括：圖像信息采集模塊21、圖像信息發送模塊22、關鍵字符庫接收模塊23和目標關鍵字確定模塊24。

圖像信息采集模塊21，用以采集交互用戶的圖像信息；

圖像信息發送模塊22，用以將所述交互用戶的圖像信息發送至服務器；

關鍵字符庫接收模塊23，用以接收所述服務器發送的與所述交互用戶的圖像信息相匹配的關鍵字符庫；

目標關鍵字確定模塊24，用以于所述關鍵字符庫中，根據接收的所述交互用戶的聲音信息確定目標關鍵字。

在上述實施例基礎上，所述圖像信息發送模塊22具體用以：將所述交互用戶的圖像信息以圖片格式發送至所述服務器；或者，若所述圖像信息為視頻信息時，將所述交互用戶的圖像信息以幀圖格式發送至所述服務器。

在上述實施例基礎上，所述交互用戶的圖像信息包括所述交互用戶的面部表情或者動作。

在上述實施例基礎上，還包括：分類模塊25；

分類模塊25，用以基于所述服務器中預存的日常圖像信息，將所述日常圖像信息進行分類并匹配相應的關鍵字符庫。

在上述實施例基礎上，所述分類模塊25具體用以：按照發生情景對所述日常圖像信息進行分類；或者，按照所述交互用戶的情緒對所述日常圖像信息進行分類。

本實施例所述機器人的交互系統用于執行上述各實施例所述的機器人的交互方法，其技術原理和產生的技術效果類似，這里不再贅述。

注意，上述僅為本發明的較佳實施例及所運用技術原理。本領域技術人員會理解，本發明不限于這里所述的特定實施例，對本領域技術人員來說能夠進行各種明顯的變化、重新調整和替代而不會脫離本發明的保護范圍。因此，雖然通過以上實施例對本發明進行了較為詳細的說明，但是本發明不僅僅限于以上實施例，在不脫離本發明構思的情況下，還可以包括更多其他等效實施例，而本發明的范圍由所附的權利要求范圍決定。

完整全部詳細技術資料下載

當前第1頁1 2