1.一種大模型訓練樣本重加權方法,其特征在于,包括:
2.根據權利要求1所述的大模型訓練樣本重加權方法,其特征在于,訓練集和驗證集是根據大模型的下游任務選取的,訓練集和驗證集采用指令微調的形式。
3.根據權利要求1所述的大模型訓練樣本重加權方法,其特征在于,利用低秩適應方法將大模型的訓練參數的變化量矩陣分解為兩個低秩矩陣包括:
4.根據權利要求1所述的大模型訓練樣本重加權方法,其特征在于,提取訓練樣本和驗證樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活和一維輸出梯度包括:
5.根據權利要求4所述的大模型訓練樣本重加權方法,其特征在于,間隔是根據選取的訓練集和驗證集所對應的樣本數量設置的。
6.根據權利要求4所述的大模型訓練樣本重加權方法,其特征在于,每間隔輪訓練,提取驗證樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活和一維輸出梯度包括:
7.根據權利要求4所述的大模型訓練樣本重加權方法,其特征在于,根據一維輸入激活和一維輸出梯度,計算訓練樣本的權重包括:
8.根據權利要求7所述的大模型訓練樣本重加權方法,其特征在于,訓練樣本與驗證樣本的一維輸入激活相似度的計算公式為,其中,表示第個可訓練模塊中第個訓練樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活,表示第個可訓練模塊中第個驗證樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活,表示轉置;
9.根據權利要求7所述的大模型訓練樣本重加權方法,其特征在于,若當前訓練輪次中未提取驗證樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活和一維輸出梯度,則將上一次提取的驗證樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活和一維輸出梯度作為當前訓練輪次中驗證樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活和一維輸出梯度。
10.根據權利要求1所述的大模型訓練樣本重加權方法,其特征在于,基于訓練樣本的權重,對訓練樣本的損失值進行加權求和,獲取訓練樣本的總損失,并利用訓練樣本的總損失對大模型進行反向傳播和參數更新包括: