麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種大模型訓練樣本重加權方法

文檔序號:41770698發布日期:2025-04-29 18:41閱讀:來源:國知局

技術特征:

1.一種大模型訓練樣本重加權方法,其特征在于,包括:

2.根據權利要求1所述的大模型訓練樣本重加權方法,其特征在于,訓練集和驗證集是根據大模型的下游任務選取的,訓練集和驗證集采用指令微調的形式。

3.根據權利要求1所述的大模型訓練樣本重加權方法,其特征在于,利用低秩適應方法將大模型的訓練參數的變化量矩陣分解為兩個低秩矩陣包括:

4.根據權利要求1所述的大模型訓練樣本重加權方法,其特征在于,提取訓練樣本和驗證樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活和一維輸出梯度包括:

5.根據權利要求4所述的大模型訓練樣本重加權方法,其特征在于,間隔是根據選取的訓練集和驗證集所對應的樣本數量設置的。

6.根據權利要求4所述的大模型訓練樣本重加權方法,其特征在于,每間隔輪訓練,提取驗證樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活和一維輸出梯度包括:

7.根據權利要求4所述的大模型訓練樣本重加權方法,其特征在于,根據一維輸入激活和一維輸出梯度,計算訓練樣本的權重包括:

8.根據權利要求7所述的大模型訓練樣本重加權方法,其特征在于,訓練樣本與驗證樣本的一維輸入激活相似度的計算公式為,其中,表示第個可訓練模塊中第個訓練樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活,表示第個可訓練模塊中第個驗證樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活,表示轉置;

9.根據權利要求7所述的大模型訓練樣本重加權方法,其特征在于,若當前訓練輪次中未提取驗證樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活和一維輸出梯度,則將上一次提取的驗證樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活和一維輸出梯度作為當前訓練輪次中驗證樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活和一維輸出梯度。

10.根據權利要求1所述的大模型訓練樣本重加權方法,其特征在于,基于訓練樣本的權重,對訓練樣本的損失值進行加權求和,獲取訓練樣本的總損失,并利用訓練樣本的總損失對大模型進行反向傳播和參數更新包括:


技術總結
本發明公開了一種大模型訓練樣本重加權方法,屬于大模型訓練技術領域,方法包括:選取訓練集和驗證集對大模型進行訓練,并利用低秩適應方法將大模型的訓練參數的變化量矩陣分解為兩個低秩矩陣;基于低秩矩陣,提取訓練樣本和驗證樣本通過大模型進行前向傳播和反向傳播后在低秩適應層上的一維輸入激活和一維輸出梯度,并根據一維輸入激活和一維輸出梯度,計算訓練樣本的權重;基于訓練樣本的權重,對訓練樣本的損失值進行加權求和,獲取訓練樣本的總損失,并利用訓練樣本的總損失對大模型進行反向傳播和參數更新。該方法能夠高效地為每個訓練樣本進行加權,減少顯存開銷。

技術研發人員:鄒立新,李偉誠,李國強,胡家銘
受保護的技術使用者:武漢大學
技術研發日:
技術公布日:2025/4/28
當前第2頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 临朐县| 太谷县| 且末县| 安塞县| 介休市| 夹江县| 云梦县| 屏东县| 滨州市| 三门县| 东兴市| 文安县| 奉节县| 湾仔区| 新乡市| 万源市| 库伦旗| 防城港市| 安平县| 新津县| 巢湖市| 奈曼旗| 武强县| 古交市| 墨江| 凌海市| 和顺县| 长治市| 东阳市| 桓台县| 济南市| 永州市| 岳阳县| 兰西县| 鄂尔多斯市| 涞源县| 托克逊县| 汝阳县| 佳木斯市| 沽源县| 吴旗县|