本公開涉及人工智能技術、自然語言處理技術,尤其是一種對話信息的優化方法、電子設備及程序產品。
背景技術:
1、在基于大語言模型(large?language?model,llm)的智能體系統中,智能體可迭代處理任務,通過多輪迭代過程得到任務處理結果,以提高任務處理質量。
2、相關技術在智能體迭代處理任務的過程中,通常設置固定迭代輪數結束智能體的迭代過程,避免智能體的無限循環,但在多輪迭代過程中,智能體多次生成的對話信息中包括的任務描述信息(prompt)完全一致,使得智能體的多輪迭代無法生成更優的解決方案,對話無法收斂,影響智能體輸出結果的質量,且智能體陷入不必要的循環,造成計算資源的浪費,增加時間和經濟成本。
技術實現思路
1、本公開實施例提供一種對話信息的優化方法、電子設備、存儲介質及程序產品,以在一定程度上解決上述技術問題。
2、本公開實施例的一個方面,提供一種對話信息的優化方法,所述方法包括:
3、在智能體處理本次任務的過程中,響應于一輪對話結束,獲取本次任務對應的歷史對話信息,所述歷史對話信息包括所述智能體最近至少一個輪次生成的至少一輪對話信息,各輪對話信息分別包括輸入給所述智能體的任務描述信息;
4、對所述歷史對話信息進行內容分析,得到所述歷史對話信息的內容評分,所述內容評分用于表征所述歷史對話信息的相似性和有效性中至少之一;
5、響應于所述內容評分指示所述歷史對話信息存在相似對話信息和/或無效對話信息,對最近一輪對話中輸入給所述智能體的上一任務描述信息進行更新,得到更新任務描述信息,以使所述智能體基于所述更新任務描述信息進行下一輪對話。
6、在一個示例性的實施例中,所述對所述歷史對話信息進行內容分析,得到所述歷史對話信息的內容評分,包括:
7、對所述歷史對話信息進行相似性檢測,得到所述歷史對話信息的相似性評分,所述相似性評分用于表征不同輪次生成的對話信息之間的相似程度;
8、和/或,
9、對所述歷史對話信息進行有效性檢測,得到所述歷史對話信息的有效性評分,所述有效性評分用于表征對話信息與所述智能體需處理的任務目標的相關程度。
10、在一個示例性的實施例中,所述對所述歷史對話信息進行相似性檢測,得到所述歷史對話信息的相似性評分,包括:
11、獲取所述歷史對話信息中每輪對話信息包括的任務標簽,所述任務標簽用于指示所述對話信息對應的處理任務;基于所述任務標簽的重復次數,確定所述歷史對話信息的相似性評分;
12、和/或,
13、對所述歷史對話信息中不同對話信息的信息內容進行相似性檢測,得到所述歷史對話信息的相似性評分。
14、在一個示例性的實施例中,所述獲取所述歷史對話信息中每輪對話信息包括的任務標簽之后,所述方法還包括:
15、響應于所述任務標簽的重復次數達到次數閾值,對所述歷史對話信息中不同對話信息的信息內容進行相似性檢測,得到所述歷史對話信息的相似性評分。
16、在一個示例性的實施例中,所述響應于所述內容評分指示所述歷史對話信息存在相似對話信息和/或無效對話信息,對最近一輪對話中輸入給所述智能體的上一任務描述信息進行更新,包括:
17、響應于所述相似性評分高于相似度閾值,確定所述歷史對話信息存在所述相似對話信息,對最近一輪對話中輸入給所述智能體的上一任務描述信息進行更新;
18、和/或,
19、響應于所述有效性評分低于有效性閾值,確定所述歷史對話信息存在所述無效對話信息,對最近一輪對話中輸入給所述智能體的上一任務描述信息進行更新。
20、在一個示例性的實施例中,所述對最近一輪對話中輸入給所述智能體的上一任務描述信息進行更新,包括:
21、響應于所述相似性評分高于相似度閾值,在所述上一任務描述信息中添加第一引導信息,所述第一引導信息用于指示智能體對話信息重復;
22、響應于所述有效性評分低于有效性閾值,在所述上一任務描述信息中添加第二引導信息,所述第二引導信息用于指示智能體任務描述信息包括與任務目標無關的信息。
23、在一個示例性的實施例中,所述響應于所述內容評分指示所述歷史對話信息存在相似對話信息和/或無效對話信息,對最近一輪對話中輸入給所述智能體的上一任務描述信息進行更新:
24、響應于所述內容評分指示所述歷史對話信息存在相似對話信息和/或無效對話信息,基于所述內容評分確定所述歷史對話信息的相似等級和/或無效等級;
25、基于所述相似等級和/或所述無效等級,確定對所述上一任務描述信息進行更新的更新內容,所述相似等級和/或所述無效等級與所述更新內容包含的信息內容量、所述更新內容對所述智能體處理任務的干預強度中至少之一正相關;
26、基于所述更新內容,對最近一輪對話中輸入給所述智能體的上一任務描述信息進行更新。
27、在一個示例性的實施例中,所述基于所述內容評分確定所述歷史對話信息的相似等級和/或無效等級之后,所述方法還包括:
28、響應于所述相似等級屬于預設嚴重相似等級,向所述智能體發送終止對話指令,以使所述智能體停止迭代;
29、和/或,
30、響應于所述無效等級屬于預設嚴重無效等級,向所述智能體發送終止對話指令,以使所述智能體停止迭代。
31、在一個示例性的實施例中,所述對最近一輪對話中輸入給所述智能體的上一任務描述信息進行更新,包括:
32、在所述上一任務描述信息中添加引導智能體修改任務描述信息的引導信息、對所述上一任務描述信息的約束條件、以及新增任務描述信息中的至少之一。
33、本實施例的另一個方面,提供一種對話信息的優化系統,所述系統包括調整模塊以及至少一個智能體;
34、所述調整模塊,用于在所述至少一個智能體處理本次任務的過程中,響應于一輪對話結束,獲取本次任務對應的歷史對話信息,所述歷史對話信息包括所述至少一個智能體最近至少一個輪次生成的至少一輪對話信息,各輪對話信息分別包括輸入給所述至少一個智能體的任務描述信息;對所述歷史對話信息進行內容分析,得到所述歷史對話信息的內容評分,所述內容評分用于表征所述歷史對話信息的相似性和有效性中至少之一;響應于所述內容評分指示所述歷史對話信息存在相似對話信息和/或無效對話信息,對最近一輪對話中輸入給所述至少一個智能體的上一任務描述信息進行更新,得到更新任務描述信息,向所述至少一個智能體發送所述更新任務描述信息;
35、所述至少一個智能體,用于接收所述更新任務描述信息,基于所述更新任務描述信息進行下一輪對話。
36、本實施例的另一個方面,提供一種電子設備,包括:
37、存儲器,用于存儲計算機程序;
38、處理器,用于執行所述存儲器中存儲的計算機程序,且所述計算機程序被執行時,實現上述任一實施例所述的對話信息的優化方法。
39、本實施例的另一個方面,提供一種計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執行時,實現上述任一實施例所述的對話信息的優化方法。
40、本實施例的另一個方面,提供一種計算機程序產品,包括計算機程序,該計算機程序被處理器執行時,實現上述任一實施例所述的對話信息的優化方法。
41、本公開實施例中,在智能體處理本次任務的過程中,對智能體迭代生成的對話信息進行監控,在一輪對話結束后,獲取智能體處理本次任務過程最近至少一個輪次生成的至少一輪的歷史對話信息,可對歷史對話信息進行內容檢測,得到歷史對話信息的相似性和有效性中的至少之一,當檢測到歷史對話信息中存在相似對話信息和/或無效對話信息的情況下,可為對最近一輪對話中輸入給智能體的上一任務描述信息進行更新,為智能體提供不同的任務描述信息,以干預智能體的迭代過程,有助于提高智能體最終生成內容的質量,相較于相關技術固定輪數限制方法,本公開實施例可通過對不同輪次對話信息的監控與分析,動態調整輸入給智能體的任務描述信息,可引導智能體的對話向收斂方向發展,避免智能體陷入無效循環,有助于提高智能體收斂速度,提高任務處理效率,減少計算資源的浪費。
42、另外,通過動態監控對話信息以及自適應調整任務描述信息的機制,可平衡智能體生成內容的質量和對話收斂速度,在確保生成內容質量較高的同時,可提高智能體的對話收斂速度,有助于提高智能體對復雜任務的處理能力,實現生成內容質量與對話收斂之間的平衡,有助于提高系統的穩定性。
43、下面通過附圖和實施例,對本公開的技術方案做進一步的詳細描述。