本申請涉及文件版本管理和檢索,具體而言,涉及一種基于大語言模型優化文件版本管理和檢索的方法及相關設備。
背景技術:
1、目前的文本文件版本管理系統,例如git、svn等,主要是基于字符變更和文件變更來進行管理的。用戶在查詢某個文件的某個版本時,只能通過時間信息和當時的提交信息進行關鍵字檢索,這種方式對用戶記憶力要求很高,需要用戶在檢索的時候準確記提交時輸入的信息或準確記得提交時間。
技術實現思路
1、本申請的實施例提供了一種基于大語言模型優化文件版本管理和檢索的方法及相關設備,以解決現有技術中存在的技術問題。
2、本申請的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本申請的實踐而習得。
3、根據本申請實施例的第一方面,提供了一種基于大語言模型優化文件版本管理和檢索的方法,包括:
4、提取文件變更時生成的變更差異數據;
5、基于所述變更差異數據,利用大語言模型進行分析生成變更記錄;
6、將所述變更記錄轉換為向量數據并進行存儲;
7、基于所述向量數據進行檢索。
8、在本申請的一些實施例中,基于前述方案,所述提取文件變更時生成的變更差異數據,包括:
9、當用戶提交文件變更時,利用文本比較算法確定文件的變更內容,生成所述變更差異數據。
10、在本申請的一些實施例中,基于前述方案,所述基于所述變更差異數據,利用大語言模型進行分析生成變更記錄,包括:
11、利用大語言模型對所述變更差異數據進行語義理解,理解變更的上下文和意圖,生成結構化的變更記錄。
12、在本申請的一些實施例中,基于前述方案,所述變更記錄包括:時間戳、文件名、變更類型、變更內容摘要以及變更效果。
13、在本申請的一些實施例中,基于前述方案,所述基于所述向量數據進行檢索,包括:
14、利用自然語言處理技術提取用戶輸入的檢索信息中的關鍵信息;
15、將所述關鍵信息轉換為查詢向量;
16、基于所述查詢向量進行語義相似檢索,確定與所述查詢向量最相似的向量數據,并確定向量數據對應的變更記錄。
17、根據本申請實施例的第二方面,提供了一種基于大語言模型優化文件版本管理和檢索的裝置,包括:
18、提取單元,用于提取文件變更時生成的變更差異數據;
19、生成單元,用于基于所述變更差異數據,利用大語言模型進行分析生成變更記錄;
20、轉換單元,用于將所述變更記錄轉換為向量數據并進行存儲;
21、檢索單元,用于基于所述向量數據進行檢索。
22、根據本申請實施例的第三方面,提供了一種計算機可讀存儲介質,所述存儲介質中存儲有計算機指令,所述計算機指令在計算機上運行時,使得所述計算機執行如第一方面所述的方法。
23、根據本申請實施例的第四方面,提供了一種電子設備,包括:存儲器和處理器;
24、所述存儲器,用于存儲計算機指令;
25、所述處理器,用于調用所述存儲器中存儲的計算機指令,使得所述電子設備執行如第一方面所述的方法。
26、本申請的技術方案在文件變更的時候能夠根據文本變化從文本變更效果的角度自動生成變更記錄,并在檢索文件版本的時候通過描述文件變更效果來進行檢索,提高了文件版本的管理效率以及檢索效率。
27、應當理解的是,以上的一般描述和后文的細節描述僅是示例性和解釋性的,并不能限制本申請。
1.一種基于大語言模型優化文件版本管理和檢索的方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述提取文件變更時生成的變更差異數據,包括:
3.根據權利要求1所述的方法,其特征在于,所述基于所述變更差異數據,利用大語言模型進行分析生成變更記錄,包括:
4.根據權利要求3所述的方法,其特征在于,所述變更記錄包括:時間戳、文件名、變更類型、變更內容摘要以及變更效果。
5.根據權利要求1所述的方法,其特征在于,所述基于所述向量數據進行檢索,包括:
6.一種基于大語言模型優化文件版本管理和檢索的裝置,其特征在于,包括:
7.一種計算機可讀存儲介質,其特征在于,所述存儲介質中存儲有計算機指令,所述計算機指令在計算機上運行時,使得所述計算機執行如權利要求1-5中任一項所述的方法。
8.一種電子設備,其特征在于,包括:存儲器和處理器;