本發明涉及一種設備運維智能體實現方法,尤其涉及一種基于小參數大語言模型的設備運維智能體實現方法。
背景技術:
1、動設備的故障診斷是確保設備穩定運行和延長使用壽命的重要環節,通過及時識別和解決潛在問題,能夠有效降低停機時間和維護成本。近年來,人工智能技術尤其是大語言模型,在動設備故障診斷領域取得了一定的應用進展。但是,在具體應用于動設備的故障診斷時,仍存在一些挑戰。
2、目前大語言模型在設備故障診斷中已展現出一定的潛力,但在許多實際場景下,由于數據安全和隱私保護的需求,無法使用大模型api進行在線服務;同時,現有在工業領域的私有化部署的開源大語言模型能力有限,導致其在執行agent任務表現不足,處理故障診斷任務能力低。
技術實現思路
1、為了解決上述技術所存在的不足之處,本發明提供了一種基于小參數大語言模型的設備運維智能體實現方法。
2、為了解決以上技術問題,本發明采用的技術方案是:一種基于小參數大語言模型的設備運維智能體實現方法,具體包括以下步驟:
3、步驟s1:構建動設備故障診斷知識庫以用于存儲結構化數據和非結構化數據;提供能夠完成agent復雜任務的大參數量級的大語言模型;
4、步驟s2:設置數據特征采集模型從動設備診斷故事庫中收集并處理歷史數據的異常信息;分析歷史數據中異常信息識別和提取測點的趨勢特征,編寫提示詞prompt,將趨勢特征解析為json格式;
5、步驟s3:構建agent?prompt模板庫,篩選優秀模板作為agent?prompt模板,agentprompt模板為若干個;將組件內容注入至各agent?prompt模板中,生成若干個agentprompt;
6、步驟s4:基于若干個agent?prompt構建用于agent微調訓練的agent微調訓練數據集;
7、步驟s5:對小參數大語言模型qwen-14b進行agent微調,形成微調后的小參數大語言模型;
8、步驟s6:本地部署微調后的小參數大語言模型,并對agent進行效果評估,篩選出合格的agent;
9、步驟s7:將合格的agent遷移到微調后的小參數大語言模型上,并進行實時應用。
10、進一步地,步驟s1中提供能夠完成agent復雜任務的大參數量級的大語言模型,通過在大語言模型服務網站上進行注冊,獲取能夠提供大語言模型gpt-4o服務的api秘鑰;通過api接口與大語言模型進行通信,使大語言模型能夠完成agent復雜任務。
11、進一步地,步驟s1的構建動設備故障診斷知識庫,具體包括以下步驟:
12、步驟s12-1:使用關系型數據庫存儲和管理與動設備相關的全部結構化數據;具體包括以下步驟:
13、步驟s12-11:在關系型數據庫中設計數據庫表結構以用于確保數據的高效存儲和檢索;
14、步驟s12-12:收集多種數據源中的數據,并實時自動導入到關系型數據庫中;
15、步驟s12-13:對數據進行清洗,以用于去除錯誤和冗余信息;
16、步驟s12-14:對清洗后的數據進行標準化處理,以確保數據格式的一致性且便于跨系統集成和分析;
17、步驟s12-2:基于rag技術即retrieval?augmented?generation檢索增強生成技術,處理和利用非結構化知識,以用于增強故障診斷的能力和效率;具體包括以下步驟:步驟s12-21:整合多種非結構化的信息源,構成非結構化知識庫;
18、步驟s12-22:基于預訓練的大語言模型gpt將非結構化數據庫中的非結構化文本數據轉換為高維向量表示,即將非結構化文檔和查詢轉換為高維向量,以便于進行相似性計算;
19、步驟s12-23:使用向量數據庫存儲和管理非結構化文檔的嵌入向量,即各非結構化文檔中高維向量對應嵌入的向量,以實現快速檢索和查詢向量最相似的文檔;
20、步驟s12-24:設置并配置rag框架,結合向量數據庫和預訓練的大語言模型,從非結構化文檔中高效檢索相關信息并生成診斷建議;
21、步驟s12-3:將全部結構化知識和非結構化知識存儲至同一知識庫中,該知識庫為動設備故障診斷知識庫。
22、進一步地,步驟s2中收集并處理歷史數據的異常信息,具體包括以下步驟:
23、步驟s21:設置數據特征采集模型,采集設備正常運轉時的歷史數據和設備異常故障時的歷史數據;從歷史數據中識別和提取所有測點的趨勢特征,得到趨勢特征數據;
24、其中,數據特征采集模型進行數據特征采集,具體包括以下步驟:
25、步驟s21-1:對歷史數據進行預處理;
26、步驟s21-2:在歷史數據特征采集模型中設置數據特征采集算法識別測點的趨勢特征;
27、步驟s21-3:對于被識別出具有趨勢特征的歷史數據即趨勢特征數據,根據設備和時間信息進行聯合分組;
28、步驟s21-4:將經過分組的趨勢特征數據保存至特征信息分組數據庫中。
29、步驟s22:將趨勢特征數據解析為json格式,作為meta-agent模板庫的待輸入信息;具體包括以下步驟:
30、步驟s22-1:從特征信息分組數據庫中提取每組趨勢特征數據的信息;趨勢特征數據的信息包括同一設備在同一時間點觸發的一組測點趨勢特征;
31、步驟s22-2:編寫解析趨勢特征的提示詞prompt;
32、步驟s22-3:將提取的趨勢特征數據的信息住入至提示詞中,并通過大語言模型,將趨勢特征解析為固定的json格式;
33、步驟s22-4:在生成的json文件中添加一條備注信息。
34、進一步地,步驟s3中生成若干個agent?prompt,具體包括以下步驟:
35、步驟s31:根據實際需要設計編寫用于調用meta-agent模板的提示詞即meta-agent?prompt;
36、步驟s32:meta-agent?prompt基于不同的種子query生成不同的new?meta-agentprompt;不同的new?meta-agent?prompt基于gpt-4o生成多種候選agent?prompt,構成agent?prompt模板庫;
37、步驟s33:基于gpt-4o從agent?prompt模板庫中篩選優秀模板作為agent?prompt模板;
38、步驟s34:將組件內容注入至agent?prompt模板,生成若干個agent?prompt。
39、進一步地,步驟s32中構成agent?prompt模板庫,具體包括以下步驟:
40、步驟s32-1:收集來自實際動設備故障診斷業務的query;
41、步驟s32-2:將相似的query分組為多個集合;其中,使用gpt-4o對query進行擴展;
42、步驟s32-3:將不同的query集合插入到meta-agent?prompt中,形成不同的newmeta-agent?prompt;
43、步驟32-4:不同的new?meta-agent?prompt通過gpt-4技術生成多種候選的agentprompt模板;多種候選的agent?prompt模板構成agent?prompt模板庫。
44、進一步地,步驟s33中篩選優秀模板作為agent?prompt模板,具體包括以下步驟:
45、步驟s33-1:創建prompt對比組,即將一組相同的query分別插入到經過驗證的基準prompt模板和meta-agent生成的候選prompt模板中,形成prompt對比組;
46、步驟s33-2:將prompt對比組中的兩個prompt分別輸入到gpt-4o中,生成相應的響應;
47、步驟s33-3:使用gpt-4o對步驟s33-2中的兩個響應進行評分,得到基準prompt模板實例score1和候選prompt模板實例score2;
48、步驟s33-4:設置第一閾值∈1,判斷score1、score2與∈1的關系;若score2-score1>∈1,則保留該候選prompt模板實例,反之,則刪除該候選prompt模板實例;
49、步驟s33-5:設置第二閾值∈2,并對同一候選prompt模板的所有實例計算平均分,得到該模板的總體得分average;若average>∈2,則保留該候選prompt模板;反之,則刪除該候選prompt模板及其候選prompt模板實例。
50、進一步地,步驟s4中構建agent微調訓練數據集,具體包括以下步驟:
51、步驟s41:步驟s3中的各agent?prompt作為agent微調訓練數據集的輸入部分;
52、步驟s42:為步驟s3中的各agent?prompt創建相應的標準答案,各標準答案作為agent微調訓練數據集的輸出部分。
53、進一步地,步驟s5對小參數大語言模型qwen-14b進行agent微調,具體包括以下步驟:
54、步驟s51:將步驟s4中訓練數據集中的若干個輸入部分與其相對應的輸出部分,構成若干個agent微調指令按照agent標準流程,且直至下一組的輸入包括本組的輸出,形成agent微調指令集;
55、步驟s52:通過agent微調指令集對小參數大語言模型進行微調。
56、進一步地,步驟s7中小參數大語言模型利用合格的agent進行實時應用,具體包括以下步驟:
57、步驟s72-1:通過數據特征采集模型采集實時數據特征;
58、步驟s72-2:將實時數據特征傳送至基于小參數大語言模型qwen-14b的agent中,作為輸入;
59、步驟s72-3:qwen-14b驅動agent分析實時數據特征,識別潛在的異常測點,以用于快速發現異常情況;
60、步驟s73-3:在動設備故障診斷知識庫中查找與異常相符的故障類型,利用經驗知識確定故障原因和故障模式;
61、步驟s73-4:根據故障模型,在動設備故障診斷知識庫中匹配相應的處置措施,處置措施包括維修步驟、調整建議和應急處理方案;
62、步驟s73-5:對故障模式和處置措施進行反饋并執行;即將故障模式和處置措施反饋給操作人員或者將故障模式和處置措施反饋給自動化系統并進行操作,確保故障得到及時有效的處理。
63、本發明公開了一種基于小參數大語言模型的設備運維智能體實現方法,本地化部署小參數大語言模型qwen-14b,確保了數據的私密性和安全性,無需擔心數據泄露,能夠在安全的環境中進行故障診斷,符合工業領域對數據隱私的嚴格要求;通過將agent能力遷移到小參數大語言模型qwen-14b上,能夠在本地化環境中快速處理故障診斷任務;用戶利用優化的小參數大語言模型快速識別問題并生成解決方案,節省了分析和診斷的時間,提高了診斷效率。