本發明屬于人工智能,具體涉及一種基于大語言模型及企業知識庫的員工知識問答系統及方法。
背景技術:
1、目前企業建立了企業微信群、企業即時通訊服務群作為及時咨詢和解決遇到的技術問題的重要工具和場所,在業務經營過程中,基層員工遇到制度理解、系統操作及技術層面問題無法得到及時指導,主要表現在上傳下達通知要求有斷層、員工的提問與解答供需不匹配、專家知識經驗得不到有效固化和傳承。因此,亟待進一步暢通員工疑難問題的解決渠道,進一步優化客戶服務體驗,提高客戶服務質量。
2、鑒于此,本發明提出一種基于大語言模型及企業知識庫的員工知識問答系統及方法以解決上述問題。
技術實現思路
1、本發明的目的在于提供一種基于大語言模型及企業知識庫的員工知識問答系統及方法。
2、為了達到上述目的,本發明所采用的技術方案之一是:
3、提供了一種基于大語言模型及企業知識庫的員工知識問答系統,包括問題搜集模塊、問題預處理模塊、匹配回答模塊、新問題入庫模塊和激勵機制模塊,其中:問題搜集模塊用于對聊天記錄進行識別,并按照提問時間進入提問隊列;所述問題預處理模塊獲取過往業務問題預處理后生成知識庫;所述匹配回答模塊基于知識庫,使用大語言模型理解用戶輸入,匹配問題并輸出。
4、在一種可行的實現方式中,一種基于大語言模型及企業知識庫的員工知識問答系統還包括新問題入庫模塊,所述新問題入庫模塊用于對于進入提問隊列的新問題,且在隊列內有有效回答自動記錄到問答系統。
5、在一種可行的實現方式中,一種基于大語言模型及企業知識庫的員工知識問答系統還包括激勵機制模塊,所述激勵機制模塊用于引入競爭激勵機制,聊天機器人實時統計并公布專家解答問題的數量與速度,與歷史最佳記錄進行對比。
6、在一種可行的實現方式中,所述匹配回答模塊基于知識庫,使用大語言模型理解用戶輸入,匹配問題并輸出,如匹配到相似度超過60%的問題,生成問答鏈接,即時推送給提問者,如未匹配到自動記錄到知識庫模型中生成提問鏈接,通過群@功能發送提問鏈接,提醒專家查看問題和指導。
7、本發明所采用的技術方案之二是:
8、提供一種基于大語言模型及企業知識庫的員工知識問答方法,包括以下步驟:s1,實時監測企業微信群、公司即時通訊服務群提問動態,通過特定關鍵詞識別員工提問,并按照提問時間進入問題提問隊列;s2,問題預處理模塊確定提問隊列中的問題間的關聯性并分類,形成類似問題組并構建問答引擎;s3,從已有知識庫中匹配出相似問題,如匹配到相似度超過60%的問題,生成問答鏈接,即時推送給提問者,如未匹配到自動記錄到知識庫模型中生成提問鏈接,通過群@功能發送提問鏈接進行解答并自動進入新問題入庫模塊。
9、在一種可行的實現方式中,基于大語言模型及企業知識庫的員工知識問答方法還包括以下步驟:s4,聊天機器人實時統計并公布專家解答問題的數量與速度,與歷史最佳記錄對比,激發專家積極性與參與度。
10、在一種可行的實現方式中,所述s2中問答引擎包括歧義詞文本、分類文本的建立,搜集過往業務問題建立知識庫及知識語料庫,運用tf-idf對問題進行詞組分割,統計關鍵詞次數,建立關鍵詞和整個知識庫的權重關系文本,初步實現文本分詞,再進行人工干預,將停止詞權重調整為零,將根據公司業務的系統和業務相關的專有名詞,權重調大,建立歧義詞字典文本;
11、歧義詞文本階段統計的業務及系統相關的關鍵詞根據公司現有技術和系統分類,建立分類文本;
12、建立分類專家關聯庫,根據業務類別對行內專家進行劃分,將分類及專家賬號關聯;
13、chatglm模型訓練,首先通過無監督學習讓模型在大規模文本數據上學習語言結構、語義以及上下文依賴關系,再將已收集的業務問答知識庫作為微調數據集,采用有監督學習方式進行模型微調,并根據前面建立的歧義詞文本和分類文本,通過權重剪枝技術移除模型中對生成效果貢獻較小的權重,減少模型的復雜性。
14、本發明的有益效果:
15、本發明程序實時監測群聊天記錄,根據語言特征如“請問”等語義邏輯為尋求意見或“什么”、“嗎”等帶有疑問的詞,識別該聊天記錄為員工提問,該程序還設置了一套鏈接生產規則,通過分類和序號等可綁定問答鏈接,利用該規則與知識庫系統形成交互,實現微信群鏈接推送。本發明通過建立了統一的知識庫獲取系統,問題直達員工,解決上傳下達流程,利用大語言模型等多種方式為員工提供快速問答,避免等待,同時通過問答入庫沉淀專家知識。
1.一種基于大語言模型及企業知識庫的員工知識問答系統,其特征在于,包括問題搜集模塊、問題預處理模塊、匹配回答模塊、新問題入庫模塊和激勵機制模塊,其中:問題搜集模塊用于對聊天記錄進行識別,并按照提問時間進入提問隊列;所述問題預處理模塊獲取過往業務問題預處理后生成知識庫;所述匹配回答模塊基于知識庫,使用大語言模型理解用戶輸入,匹配問題并輸出。
2.根據權利要求1所述的一種基于大語言模型及企業知識庫的員工知識問答系統,其特征在于,還包括新問題入庫模塊,所述新問題入庫模塊用于進入提問隊列的新問題進行入庫,且將有效回答自動記錄到問答系統。
3.根據權利要求1或2所述的基于大語言模型及企業知識庫的員工知識問答系統,其特征在于,還包括激勵機制模塊,所述激勵機制模塊用于引入競爭激勵機制,聊天機器人實時統計并公布專家解答問題的數量與速度,與歷史最佳記錄進行對比。
4.根據權利要求3所述的基于大語言模型及企業知識庫的員工知識問答系統,其特征在于,所述匹配回答模塊基于知識庫,使用大語言模型理解用戶輸入,匹配問題并輸出,如匹配到相似度超過60%的問題,生成問答鏈接,即時推送給提問者,如未匹配到自動記錄到知識庫模型中生成提問鏈接,通過群@功能發送提問鏈接,提醒專家查看問題和指導。
5.一種基于大語言模型及企業知識庫的員工知識問答方法,其特征在于,包括以下步驟:s1,實時監測企業微信群、公司即時通訊服務群提問動態,通過特定關鍵詞識別員工提問,并按照提問時間進入問題提問隊列;s2,問題預處理模塊確定提問隊列中的問題間的關聯性并分類,形成類似問題組匹配知識庫;s3,從已有知識庫中匹配出相似問題,如匹配到相似度超過60%的問題,生成問答鏈接,即時推送給提問者,如未匹配到自動記錄到知識庫模型中生成提問鏈接,通過群@功能發送提問鏈接進行解答并自動進入新問題入庫模塊,新問題通過大語言模型進行回答。
6.根據權利要求5所述的基于大語言模型及企業知識庫的員工知識問答方法,其特征在于,還包括以下步驟:s4,聊天機器人實時統計并公布專家解答問題的數量與速度,與歷史最佳記錄對比,激發專家積極性與參與度。
7.根據權利要求6所述的基于大語言模型及企業知識庫的員工知識問答方法,其特征在于,所述s2中知識庫建立包括歧義詞文本、分類文本、分類專家關聯庫的建立,搜集過往業務問題建立知識庫及知識語料庫,運用tf-idf對問題進行詞組分割,統計關鍵詞次數,建立關鍵詞和整個知識庫的權重關系文本,初步實現文本分詞,再進行人工干預,將停止詞權重調整為零,將根據公司業務的系統和業務相關的專有名詞,權重調大,建立歧義詞字典文本;歧義詞文本階段統計的業務及系統相關的關鍵詞根據公司現有技術和系統分類,建立分類文本;建立分類專家關聯庫,根據業務類別對行內專家進行劃分,將分類及專家賬號關聯。
8.根據權利要求5所述的基于大語言模型及企業知識庫的員工知識問答方法,其特征在于,所述大語言模型采用chatglm模型,首先通過無監督學習讓模型在大規模文本數據上學習語言結構、語義以及上下文依賴關系,再將已收集的業務問答知識庫作為微調數據集,采用有監督學習方式進行模型微調,并根據前面建立的歧義詞文本和分類文本,通過權重剪枝技術移除模型中對生成效果貢獻較小的權重。
9.根據權利要求5所述的基于大語言模型及企業知識庫的員工知識問答方法,其特征在于,所述s2中關聯性是通過根據前期建立的歧義詞字典識別問題中的關鍵詞,根據關鍵詞匹配問題分類。