本技術屬于計算機,尤其涉及一種數據處理方法、終端設備及程序產品。
背景技術:
1、智能體(artificial?intelligence?agent)是一種能夠感知環境、進行決策和執行動作的智能實體。它使用大型語言模型作為其核心計算引擎,使其能夠進行對話、執行任務、推理并展現一定程度的自主性。而智能體在進行對話、執行任務以及推理時,通常需要結合已存儲的各種記憶進行分析,以確定下一步的工作。在結合已存儲的各種記憶進行分析之前,需要對智能體的所有記憶進行檢索,以獲取所需的記憶。因此,為了實現智能體的信息檢索,需要對智能體與用戶交互過程產生的交互數據形成的記憶進行管理。
2、然而,現有技術通常是直接將上述交互記錄存儲為孤立的文本形式,而文本通常是以字符、單詞、句子和段落等為單位進行組織的。在計算機存儲中,這些元素會分散存儲。由此可見,現有技術存在記憶存儲碎片化的問題。
技術實現思路
1、本技術實施例提供了一種數據處理方法、終端設備及程序產品,以解決現有技術存在的記憶存儲碎片化的問題。
2、第一方面,本技術實施例提供了一種數據處理方法,包括:
3、獲取智能體與用戶之間的交互記錄;
4、對所述交互記錄進行向量轉換處理,得到所述交互記錄對應的向量化數據;
5、對所述交互記錄進行解析,得到所述交互記錄對應的圖數據;
6、將所述向量化數據存儲至向量數據庫,并將所述圖數據存儲至圖數據庫;所述圖數據庫中的各個圖數據通過邊進行關聯。
7、可選的,所述交互記錄包括多個所述用戶與所述智能體之間的對話信息;在所述獲取智能體與用戶之間的交互記錄之后,還包括:
8、基于設定規則對多個所述對話信息進行評估,得到多個所述對話信息各自的初始權重;
9、獲取所述用戶的偏好信息;
10、根據所述偏好信息對多個所述對話信息各自的初始權重進行調整,得到多個所述對話信息各自的目標權重;
11、基于所述目標權重確定多個所述對話信息各自的目標評分;每個信息的目標評分用于描述每個所述對話信息的重要程度;
12、相應的,所述將所述向量化數據存儲至向量數據庫,并將所述圖數據存儲至圖數據庫,包括:
13、將多個所述對話信息各自的目標評分與多個所述對話信息各自對應的向量化數據關聯存儲至所述向量數據庫,將多個所述對話信息各自的目標評分與多個所述對話信息各自對應的圖數據關聯存儲至所述圖數據庫。
14、可選的,所述交互記錄包括多個所述用戶與所述智能體之間的對話信息;在所述將所述向量化數據存儲至向量數據庫,并將所述圖數據存儲至圖數據庫之前,還包括:
15、確定多個所述對話信息各自對應的回應結果;所述回應結果用于描述所述智能體在與所述用戶的交互過程中是否對所述用戶的信息進行回應;
16、從多個所述對話信息中篩選出回應結果為未回應的目標信息;
17、對所述目標信息進行分析,得到所述目標信息對應的目標回應信息;
18、相應的,所述將所述向量化數據存儲至向量數據庫,并將所述圖數據存儲至圖數據庫,包括:
19、將所述目標回應信息對應的向量化數據存儲至所述向量數據庫,并將所述回應信息對應的圖數據存儲至所述圖數據庫。
20、可選的,所述對所述目標信息進行分析,得到所述目標信息對應的目標回應信息,包括:
21、將所述目標信息輸入至第一大語言模型進行處理,得到所述目標信息對應的問題信息;
22、從所述向量數據庫和所述圖數據庫中查找與所述問題信息對應的歷史回應信息;
23、將所述歷史回應信息和所述問題信息輸入至第二大語言模型進行處理,得到所述問題信息對應的目標回應信息。
24、可選的,在所述將所述向量化數據存儲至向量數據庫,并將所述圖數據存儲至圖數據庫之后,還包括:
25、在檢測到所述用戶與所述智能體進行交互時,獲取所述用戶輸入的內容信息;
26、從所述向量數據庫中篩選出與所述內容信息對應的第一內容;
27、從所述圖數據庫中篩選出與所述內容信息對應的第二內容;
28、對所述第一內容和所述第二內容進行組合,得到與所述內容信息對應的目標檢索內容。
29、可選的,所述向量數據庫中每個向量化數據均攜帶有評分和生成時間,每個所述向量化數據的目標評分用于描述每個所述向量化數據的重要程度;所述第一內容包括多條;所述從所述向量數據庫中篩選出與所述內容信息對應的第一內容,包括:
30、對所述內容信息進行向量化處理,得到所述內容信息對應的第一向量化數據;
31、遍歷計算所述向量數據庫中的各個向量化數據與所述第一向量化數據的相似度,得到各個相似度分數;
32、按照相似度分數從高到低的順序獲取第一數量的備用向量化數據;
33、基于各個所述備用向量化數據的相似度分數、所述評分以及所述生成時間,對各個所述備用向量化數據進行評估,得到所述各個所述備用向量化數據的目標分數;
34、按照目標分數從高到低的順序獲取第二數量的備選向量化數據,并將所述第二數量的所述備選向量化數據確定為所述第一內容;所述第二數量小于所述第一數量。
35、可選的,所述圖數據庫包括多個圖數據;每個所述圖數據包括邊和節點;所述邊用于描述任意兩個實體之間的關系;所述從所述圖數據庫中篩選出與所述內容信息對應的第二內容,包括:
36、遍歷計算所述圖數據庫中的各個所述節點與所述內容信息的相似度,得到所述內容信息對應的相似節點;
37、將與所述相似節點連接的各個節點確定為關聯節點;
38、將所述相似節點和所述關聯節點各自對應的內容確定為所述第二內容。
39、可選的,所述對所述第一內容和所述第二內容進行組合,得到與所述內容信息對應的目標檢索內容,包括:
40、從所述向量數據庫篩選出與所述第二內容對應的第三內容;
41、對所述第一內容、所述第二內容以及所述第三內容進行組合,得到所述目標檢索內容。
42、第二方面,本技術實施例提供了一種數據處理裝置,包括:
43、第一獲取單元,用于獲取智能體與用戶之間的交互記錄;
44、第一處理單元,用于對所述交互記錄進行向量轉換處理,得到所述交互記錄對應的向量化數據;
45、解析單元,用于對所述交互記錄進行解析,得到所述交互記錄對應的圖數據;
46、第一存儲單元,用于將所述向量化數據存儲至向量數據庫,并將所述圖數據存儲至圖數據庫;所述圖數據庫中的各個圖數據通過邊進行關聯。
47、第三方面,本技術實施例提供了一種終端設備,包括:存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,上述處理器執行所述計算機程序時實現如上述第一方面中任一項所述的數據處理方法。
48、第四方面,本技術實施例提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現如上述第一方面中任一項所述的數據處理方法。
49、第五方面,本技術實施例提供了一種計算機程序產品,當計算機程序產品在終端設備上運行時,使得終端設備可執行上述第一方面中任一項所述的數據處理方法。
50、本技術實施例與現有技術相比存在的有益效果是:
51、本技術實施例提供的一種數據處理方法,通過獲取智能體與用戶之間的交互記錄;對交互記錄進行向量轉換處理,得到交互記錄對應的向量化數據;對交互記錄進行解析,得到交互記錄對應的圖數據;將向量化數據存儲至向量數據庫,并將圖數據存儲至圖數據庫;圖數據庫中的各個圖數據通過邊進行關聯。一方面,本技術將交互記錄向量化處理,使得處理之后的向量化數據更為簡潔,方便后續從向量數據庫中檢索相關數據,即提高了檢索效率。同時,本技術將向量化數據存儲至向量數據庫,由于向量化數據通常是將數據特征和關系以數值形式進行表示,使得在向量數據庫中數值相近的向量化數據之間的距離較近,數值較遠的向量化數據之間的距離較遠,從而實現了智能體對應的記憶在向量數據庫中的存儲連貫性,解決了記憶存儲碎片化問題。另一方面,本技術對交互記錄進行解析,得到為知識圖譜結構數據的圖數據,由于圖數據包括節點和邊,通過構建節點以及用邊來連接相關節點,清晰地展現了交互的內在架構;同時,圖數據庫中各個圖數據依靠邊進行關聯,形成了一個復雜的關系網絡,能夠直觀地呈現出交互記錄之間的邏輯聯系、層次結構等,即可以直觀地展示各個實體之間的聯系和依賴關系,使得后續從圖數據庫中檢索數據時可以通過上述各個實體之間的聯系和依賴關系檢索到所有相關的圖數據,提高了檢索時的聯想記憶能力。同時,本技術將圖數據存儲至圖數據庫,由于圖數據包括節點、邊以及屬性,使得圖數據庫中的各個圖數據均可以通過屬性和邊與此時存儲的圖數據進行連接,從而實現了智能體對應的記憶在圖數據庫中的存儲連續性,進一步解決了記憶存儲碎片化問題,使得交互記錄可以形成連貫的記憶網絡。