基于大語言模型的玩具互動控制方法、裝置、終端及介質(zhì)與流程

文檔序號：41768112發(fā)布日期：2025-04-29 18:38閱讀：10來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及人工智能和智能設(shè)備控制技術(shù)的交叉領(lǐng)域，具體涉及一種基于大語言模型的玩具互動控制方法、裝置、終端及介質(zhì)。

背景技術(shù)：

1、現(xiàn)有玩具的結(jié)構(gòu)和種類有很多，如玩具娃娃等等，但大部分屬于比較簡單的傳統(tǒng)玩具，通常需要用戶根據(jù)玩具預(yù)設(shè)的操作方式進(jìn)行控制，缺少與用戶的智能交互，無法準(zhǔn)確理解用戶通過語言（文字）、語音（情緒）和肢體動作（強(qiáng)度、頻率）等表達(dá)的意圖，整體體驗(yàn)感不夠理想。

2、同時，現(xiàn)有技術(shù)尚未實(shí)現(xiàn)對多模態(tài)信息（如語音、文本、圖像、肢體動作、外部環(huán)境信息）的綜合處理，更缺乏利用深度學(xué)習(xí)模型（如大語言模型）準(zhǔn)確識別用戶意圖并生成相應(yīng)控制指令的方法。此外，在個性化用戶體驗(yàn)、實(shí)時反饋及安全性保障等方面，現(xiàn)有技術(shù)仍存在較大不足，難以滿足用戶對智能化和情感化交互的更高需求。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明旨在解決現(xiàn)有技術(shù)中玩具缺乏智能交互、用戶意圖識別不準(zhǔn)確以及個性化體驗(yàn)不足的問題，提供一種基于大語言模型的玩具互動控制方法及其相關(guān)裝置、終端和計(jì)算機(jī)可讀介質(zhì)。本發(fā)明通過多模態(tài)信息處理與深度學(xué)習(xí)模型的結(jié)合，實(shí)現(xiàn)玩具與用戶的智能交互，顯著提升用戶體驗(yàn)感。

2、本發(fā)明的第一方面，提供一種基于大語言模型的玩具互動控制方法，包括以下步驟：

3、獲取用戶端信息，所述用戶端信息包括語音、文本、圖像、肢體動作或外部環(huán)境信息中一種或多種；

4、對所述用戶端信息進(jìn)行特征提取，生成特征表示；

5、將所述特征表示輸入大語言模型，識別用戶意圖；

6、根據(jù)識別出的所述用戶意圖生成相應(yīng)的控制指令；

7、將所述控制指令轉(zhuǎn)化為具體的控制信號，發(fā)送至玩具的控制系統(tǒng)，以執(zhí)行相應(yīng)動作。

8、可選地，所述對所述用戶端信息進(jìn)行特征提取，生成特征表示，其中包括：

9、所述用戶端信息為語音、文本、圖像、肢體動作或外部環(huán)境信息中一種時，直接生成單一模態(tài)的特征表示；

10、所述用戶端信息為語音、文本、圖像、肢體動作或外部環(huán)境信息中兩種或兩種以上任意組合時，分別對每種信息進(jìn)行提取特征，并對多模態(tài)特征進(jìn)行融合，生成統(tǒng)一的特征表示。

11、可選地，所述分別對每種信息進(jìn)行提取特征，并對多模態(tài)特征進(jìn)行融合，生成統(tǒng)一的特征表示，包括：

12、對每種信息進(jìn)行特征向量化處理，得到各模態(tài)特征；

13、利用注意力機(jī)制對各模態(tài)特征進(jìn)行對齊處理，以增強(qiáng)特征間的相關(guān)性；

14、通過特征融合網(wǎng)絡(luò)將對齊后的特征融合為統(tǒng)一的特征表示。

15、可選地，所述大語言模型包括以下功能單元中一種或多種：

16、語言理解單元，用于解析和理解所述用戶端信息中的文本語義特征；

17、聲音情緒識別單元，用于分析所述用戶端信息中語音的情感特征；

18、面部表情識別單元，用于分析所述用戶端信息中圖像的面部表情語義特征；

19、動作識別單元，用于理解所述用戶端信息中肢體動作的語義；

20、上下文理解單元，用于結(jié)合歷史交互信息和當(dāng)前對話內(nèi)容，構(gòu)建語義理解框架；

21、當(dāng)包含多種上述功能單元時，所述大語言模型還包括：

22、多模態(tài)語義融合單元，用于融合多種上述功能單元的各語義分析結(jié)果，生成統(tǒng)一的語義理解。

23、可選地，所述用戶意圖還包括情緒狀態(tài)量化特征；對應(yīng)的，生成控制指令的過程包括：

24、基于用戶意圖的識別，提取用戶意圖的行為目標(biāo)；

25、對所述情緒狀態(tài)量化特征進(jìn)行分析，生成用于調(diào)整設(shè)備操作的情緒參數(shù)；

26、結(jié)合所述用戶意圖的行為目標(biāo)、所述情緒參數(shù)和外部環(huán)境信息，生成控制指令。

27、可選地，所述控制指令包括如下一種或多種：

28、動作控制指令，用于調(diào)節(jié)玩具的運(yùn)動方式、強(qiáng)度或頻率中一種或多種，其中運(yùn)動方式的參數(shù)范圍為預(yù)設(shè)的運(yùn)動模式集合；

29、語音控制指令，用于選擇預(yù)設(shè)的語音反饋模板，并根據(jù)所述情緒狀態(tài)量化特征調(diào)整語音參數(shù)；

30、氛圍控制指令，用于調(diào)節(jié)燈光亮度、顏色、閃爍頻率或氛圍音樂中一種或多種，以匹配用戶情緒。

31、可選地，所述的控制方法，還包括：

32、基于預(yù)設(shè)的所述用戶意圖的權(quán)重確定各所述控制指令的優(yōu)先級；

33、協(xié)調(diào)多個所述控制指令的執(zhí)行順序，確保所述控制指令間的協(xié)同與不沖突；

34、采集用戶的實(shí)時反饋數(shù)據(jù)，包括行為反應(yīng)，動態(tài)調(diào)整控制策略以優(yōu)化用戶體驗(yàn)。

35、可選地，所述的控制方法，還包括持續(xù)學(xué)習(xí)模塊，所述持續(xù)學(xué)習(xí)模塊通過以下方式優(yōu)化用戶意圖識別和控制策略：

36、收集用戶交互數(shù)據(jù)和反饋信息；

37、利用深度學(xué)習(xí)算法和強(qiáng)化學(xué)習(xí)算法，動態(tài)更新大語言模型的參數(shù)；

38、自適應(yīng)調(diào)整控制邏輯以滿足用戶的個性化需求。

39、可選地，所述的控制方法，還包括安全模塊，用于：

40、對用戶身份進(jìn)行多因素認(rèn)證和授權(quán)管理，確保只有授權(quán)用戶能控制玩具；

41、對用戶數(shù)據(jù)進(jìn)行端到端加密處理，防止未經(jīng)授權(quán)的訪問和數(shù)據(jù)泄露；

42、實(shí)時監(jiān)控所述控制指令的執(zhí)行過程，檢測并阻止異常指令以保障使用安全。

43、可選地，所述的控制方法，還包括：

44、遠(yuǎn)程更新模塊，所述遠(yuǎn)程更新模塊通過安全的網(wǎng)絡(luò)連接或云端平臺下載并安裝最新的大語言模型參數(shù)或控制邏輯，更新過程采用數(shù)字簽名和驗(yàn)證機(jī)制，確保更新內(nèi)容的真實(shí)性和完整性。

45、本發(fā)明的第二方面，提供一種基于大語言模型的玩具互動控制裝置，包括：

46、信息獲取模塊：獲取用戶端信息，所述用戶端信息包括語音、文本、圖像、肢體動作或外部環(huán)境信息中一種或多種；

47、特征提取模塊：對所述用戶端信息進(jìn)行特征提取，生成特征表示；

48、大語言模型模塊：將所述特征表示輸入大語言模型，識別用戶意圖；

49、指令生成模塊：根據(jù)識別出的所述用戶意圖生成相應(yīng)的控制指令；

50、控制信號生成模塊：將所述控制指令轉(zhuǎn)化為具體的控制信號，發(fā)送至玩具的控制系統(tǒng)，以執(zhí)行相應(yīng)動作。

51、本發(fā)明的第三方面，提供一種電子設(shè)備，包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序，所述處理器執(zhí)行所述程序時實(shí)現(xiàn)所述的基于大語言模型的玩具互動控制方法的步驟。

52、本發(fā)明的第四方面，提供一種計(jì)算機(jī)可讀存儲介質(zhì)，其上存儲有計(jì)算機(jī)程序，該計(jì)算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)所述的基于大語言模型的玩具互動控制方法的步驟。

53、與現(xiàn)有技術(shù)相比，本發(fā)明實(shí)施例具有如下至少一種有益效果：

54、本發(fā)明實(shí)施例中的基于大語言模型的玩具互動控制方法，可以實(shí)現(xiàn)智能交互：利用大語言模型感知用戶的語音、文本、圖像、肢體動作等多模態(tài)信息，準(zhǔn)確識別用戶的意圖，并生成符合用戶需求的控制指令，實(shí)現(xiàn)了玩具與用戶之間的智能化交互。

55、本發(fā)明實(shí)施例中的基于大語言模型的玩具互動控制方法，可以實(shí)現(xiàn)個性化反饋：結(jié)合用戶的情緒狀態(tài)量化特征和外部環(huán)境信息動態(tài)調(diào)整控制參數(shù)，能夠根據(jù)用戶的實(shí)時需求提供個性化的動作、語音或氛圍反饋，顯著提升用戶體驗(yàn)的沉浸感和真實(shí)感。

56、本發(fā)明實(shí)施例中的基于大語言模型的玩具互動控制方法，具有技術(shù)先進(jìn)性：通過大語言模型和多模態(tài)融合技術(shù)，克服了現(xiàn)有玩具交互方式單一、響應(yīng)不智能的問題，具備更高的交互準(zhǔn)確性和適應(yīng)性。

57、本發(fā)明實(shí)施例中的基于大語言模型的玩具互動控制方法，具有系統(tǒng)安全性：提供了多因素認(rèn)證、數(shù)據(jù)加密和異常指令檢測機(jī)制等安全保障，確保用戶數(shù)據(jù)和設(shè)備控制過程的安全性，進(jìn)一步增強(qiáng)用戶的信任感。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：姜華
技術(shù)所有人：上海旻浦科技有限公司
我是此專利的發(fā)明人

上一篇：一種金屬擠壓成型模具的制作方法
上一篇：一種鋁合金型材快速淬火裝置的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

基于大語言模型的玩具互動控制方法、裝置、終端及介質(zhì)與流程

基于大語言模型的玩具互動控制方法、裝置、終端及介質(zhì)與流程