麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

基于AIGC交互分析的交互數據處理方法及系統與流程

文檔序號:41744540發布日期:2025-04-25 17:28閱讀:3來源:國知局
基于AIGC交互分析的交互數據處理方法及系統與流程

本技術涉及數字數據處理領域,尤其涉及基于aigc交互分析的交互數據處理方法及系統。


背景技術:

1、aigc(artificial?intelligence?generated?content,人工智能生成內容)指的是利用人工智能來生產內容,其中ai是人工智能的簡稱,gc指的是創作內容,aigc可以包括各種形式的內容,如文章、新聞、音樂、繪畫視頻等,目前aigc主要運用在文字、圖像、視頻、音頻、游戲以及虛擬人等方面。

2、交互過程中,生成聯想詞是一種常見的需求,它可以幫助用戶更快地找到所需信息,提高輸入速度,增加用戶粘性,輔助語言學習等。例如,在搜索引擎中,聯想詞api可以提供與用戶輸入相關的搜索建議。在智能輸入法中,它可以預測用戶想要輸入的下一個詞匯。在社交媒體平臺中,聯想詞api可以幫助用戶快速完成標簽、話題或評論的輸入。此外,聯想詞api還可以應用于內容推薦系統,根據用戶的興趣推薦相關內容。

3、現有技術是根據語義相似度建立聯想詞詞庫的方法確定聯想詞,但是如果針對每一個用戶每一次的aigc交互數據都建立一個聯想詞庫,則會導致aigc平臺冗余較大,數據處理效率較低。


技術實現思路

1、為了解決上述由于聯想詞庫過多導致的aigc平臺冗余大、效率低的問題,本技術提供基于aigc交互分析的交互數據處理方法及系統。

2、第一方面,本技術提供基于aigc交互分析的交互數據處理方法,采用如下的技術方案:

3、基于aigc交互分析的交互數據處理方法,包括步驟:對歷史交互數據提取關鍵詞,構建全局聯想詞庫,全局聯想詞庫為無向完全圖,每一個關鍵詞為一個節點,兩個關鍵詞同時出現的頻次為邊權;獲取當前輪次交互數據,確定局部關鍵詞及局部聯想詞庫,局部關鍵詞作為當前輪次交互數據對應的聯想詞;向用戶推薦局部關鍵詞并獲取當前輪次交互數據的用戶反饋,完成aigc交互分析的交互數據處理;局部關鍵詞的獲取方法為:提取當前輪次交互數據的關鍵詞,并構建當前輪次交互數據的關鍵詞序列及局部聯想詞庫;從全局聯想詞庫中提取到一個包含局部聯想詞庫中所有關鍵詞的提取序列;利用預訓練的詞向量模型,對局部聯想詞庫中的關鍵詞進行向量化得到第一向量化詞庫,對提取序列中關鍵詞進行向量化得到第二向量化詞庫;將第二向量化詞庫中出現頻次最高的關鍵詞作為錨定關鍵詞,根據第一向量詞庫中關鍵詞的頻次與錨定關鍵詞的頻次比值構建第一比值序列;根據第二向量詞庫中關鍵詞的頻次與錨定關鍵詞的頻次比值構建第二比值序列;構建關鍵詞矩陣,關鍵詞矩陣的行表示關鍵詞個數,列表示預設的與各關鍵詞相關的相關詞個數;計算關鍵詞矩陣中關鍵詞的聯想系數,聯想系數與關鍵詞在第一比值序列對應比值與第二比值序列對應比值的差值為反比關系;通過對關鍵詞矩陣中每一個不重復的關鍵詞進行聯想系數從高到底排序,選取前預設數量的關鍵詞作為局部關鍵詞。

4、有益效果為:全局聯想詞庫為一個大型的聯想詞數據庫,如果直接利用該數據庫對當前的關鍵詞序列進行聯想詞生成,計算量過大,所以本技術構建局部聯想詞庫,獲取全局聯想詞庫中的一部分數據進行聯想詞的生成。在得到局部聯想詞庫后,從全局聯想詞庫中找到局部聯想詞庫作為近似的局部關鍵詞,局部關鍵詞作為當前輪次交互數據對應的聯想詞。

5、通過構建局部聯想詞庫,避免了直接使用全局聯想詞庫進行聯想詞生成時的大量計算,從而提高了數據處理的效率。且局部關鍵詞的提取和推薦能夠更精準地反映當前輪次交互數據的特點,使得aigc工具能夠提供更加個性化和上下文相關的回答,增強了人機交互的連貫性和準確性。進一步地,通過局部聯想詞庫的構建和局部關鍵詞的推薦,可以更有效地利用計算資源,將資源集中在與當前交互最相關的數據上,從而提高整體系統的響應速度和處理能力。

6、可選的,聯想系數的計算公式為:其中,fi,j,t表示用戶i第j輪次交互中第t個關鍵詞的聯想系數,exp表示以e為底的指數函數,ei,j,t表示第t個關鍵詞在第一比值序列中對應的差值,e'i,j,t表示第t個關鍵詞在第二比值序列中對應的差值;ht表示第t個關鍵詞在關鍵詞矩陣中出現的頻次,g表示關鍵詞矩陣內關鍵詞的個數,p為超參數。

7、有益效果為:聯想系數的計算考慮了關鍵詞在當前交互輪次中的相對頻率和在全局交互中的相對頻率,這種雙重考量有助于優化關鍵詞的推薦機制,使其更加符合用戶的當前需求和上下文環境。ei,j,t-e'i,j,t越大,第t個關鍵詞在ei,j中出現頻率相對越高;如果同時在其他對話中且相關的關鍵詞的出現頻率越高,即的值越大,表示在其他對話中與其相關的關鍵詞的出現頻率越高,exp(ei,j,t-e'i,j,t)越大,越大,則表示第t個關鍵詞越應該被聯想(被推薦),第t個關鍵詞的聯想系數越高。關鍵詞在關鍵詞矩陣的出現頻率頻率越高,表示相關性越強,但是如果e'i,j中的關鍵詞的頻次低,則即使與其相關的關鍵詞的出現頻率越高,但是推薦度仍然不高。

8、可選的,聯想系數的計算公式為:fi,j,t=exp(ei,j,t-e'i,j,t),其中,fi,j,t表示用戶i第j輪次交互中第t個關鍵詞的聯想系數,exp表示以e為底的指數函數,ei,j,t表示第t個關鍵詞在第一比值序列中對應的差值,e'i,j,t表示第t個關鍵詞在第二比值序列中對應的差值。

9、有益效果為:由于省略了部分計算步驟,如關鍵詞頻次的比值計算和超參數的調整,這種方法可以顯著減少計算量,從而加快處理速度,這種方法的計算得到的聯想系數準確度較低,但它適用于對推薦精準度要求較低、對計算量要求較小的應用場景。

10、可選的,向用戶推薦局部關鍵詞并獲取當前輪次交互數據的用戶反饋,完成aigc交互分析的交互數據處理,包括步驟:獲取用戶反饋,用戶反饋為聯想詞的確定指令,將確定的聯想詞作為更新聯想詞;根據更新聯想詞構建更新聯想詞序列,根據更新聯想詞更新關鍵詞矩陣得到聯想詞矩陣,以進行下一次的聯想詞推薦。

11、有益效果為:通過更新聯想詞和關鍵詞矩陣,系統能夠維持對話的連貫性,使得多輪對話更加自然和流暢。

12、可選的,根據更新聯想詞更新關鍵詞矩陣得到聯想詞矩陣,以進行下一次的聯想詞推薦,包括步驟:計算聯想詞矩陣中各關鍵詞的聯想系數以及關鍵詞矩陣中各關鍵詞的聯想系數;計算聯想詞矩陣與關鍵詞矩陣之間關鍵詞的余弦距離;將更新更新聯想詞與關鍵詞矩陣中關鍵詞進行圖結構數據重建,得到更新聯想詞庫,更新聯想詞庫中的節點為關鍵詞,邊權為兩個關鍵詞的余弦距離;對更新聯想詞庫中的關鍵詞利用聚類算法進行數據分類得到多個聚類簇,確定各聚類簇的最優關鍵詞;向用戶推薦最優關鍵詞并獲取對應輪次交互數據的用戶反饋。

13、有益效果為:在關鍵詞矩陣更新過程中,可能會引入新的關鍵詞,這些新詞可能與舊的關鍵詞關聯性不強,聚類可以幫助識別這些新詞,并減少它們對已有推薦系統的干擾。在推薦系統中,只需要關注那些屬于較大聚類簇的關鍵詞,而不是整個關鍵詞矩陣,進一步提高了數據處理的效率。

14、可選的,最優關鍵詞的確定方式為:將聚類簇內聯想系數最大值對應的關鍵詞作為該聚類簇的最優關鍵詞。

15、有益效果為:每個聚類簇包含語義上相似的關鍵詞,聯想系數是一個衡量關鍵詞與用戶興趣相關性的指標。在每個聚類簇中,找出聯想系數最大的關鍵詞。這個關鍵詞被認為是最能代表該聚類簇的,將這些最優關鍵詞推薦給用戶,以獲取用戶反饋。用戶反饋將用于進一步優化推薦系統,從而提高推薦的相關性和準確性。

16、可選的,聚類算法為k均值聚類算法。

17、可選的,每一次推薦關鍵詞的數量相同或不相同。

18、第二方面,本技術提供基于aigc交互分析的交互數據處理系統,采用如下的技術方案:

19、基于aigc交互分析的交互數據處理系統,包括:處理器和存儲器,所述存儲器存儲有計算機程序指令,當所述計算機程序指令被所述處理器執行時實現根據上述的基于aigc交互分析的交互數據處理方法。

20、有益效果為:將上述的基于aigc交互分析的交互數據處理方法生成計算機程序,并存儲于存儲器中,以被處理器加載并執行,從而,根據存儲器及處理器制作系統,方便使用。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 香河县| 菏泽市| 虎林市| 清流县| 武穴市| 开封县| 东明县| 沽源县| 柳江县| 安泽县| 江西省| 龙泉市| 潍坊市| 南安市| 湖州市| 唐海县| 永顺县| 谢通门县| 绥化市| 沙雅县| 奈曼旗| 图木舒克市| 长子县| 怀安县| 富裕县| 称多县| 南投县| 武隆县| 商河县| 阿图什市| 牙克石市| 乐陵市| 揭东县| 永胜县| 通道| 新疆| 三江| 尼勒克县| 静宁县| 共和县| 巴楚县|