1.一種用于大模型訓練優化的數據增強方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的用于大模型訓練優化的數據增強方法,其特征在于,構建用于生成任務樣本對的任務模板函數的步驟包括:根據需求生成的任務樣本數據的類型,構建不同類型的任務模板函數并為每個任務模板函數配置參數;每種類型的任務模板函數的構建過程如下:
3.根據權利要求2所述的用于大模型訓練優化的數據增強方法,其特征在于,通過多次調用不同類型的任務模板函數生成多樣化的數據樣本生成混合數據集的步驟包括:
4.根據權利要求3所述的用于大模型訓練優化的數據增強方法,其特征在于,基于模型集合m對n個任務對應的樣本數據進行預測,并根據模型的預測結果和真實標簽,計算評估指標值,根據計算得到的評估指標的值,得出每個任務的精度的步驟包括:
5.根據權利要求4所述的用于大模型訓練優化的數據增強方法,其特征在于,基于每個任務的精度使用softmax函數計算任務模板的權重的步驟中公式如下:
6.根據權利要求5所述的用于大模型訓練優化的數據增強方法,其特征在于,根據任務模板的權重,調整混合數據集中不同任務類型的數據比例,生成增強數據集的步驟包括:
7.一種用于大模型訓練優化的數據增強裝置,其特征在于,包括構建模塊、混合數據集生成模塊、模型集合生成模塊、任務精度計算模塊、模板權重計算模塊和增強數據集生成模塊;
8.根據權利要求7所述的用于大模型訓練優化的數據增強裝置,其特征在于,任務精度計算模塊基于每個任務的精度使用softmax函數計算任務模板的權重的步驟中公式如下:
9.一種電子設備,其特征在于,所述電子設備包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;存儲器存儲有可被至少一個處理器執行的計算機程序指令,所述計算機程序指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行如權利要求1至6中任一項所述的用于大模型訓練優化的數據增強方法。
10.一種非暫態計算機可讀存儲介質,其特征在于,所述非暫態計算機可讀存儲介質存儲計算機指令,所述計算機指令使所述計算機執行如權利要求1至6任一項所述的用于大模型訓練優化的數據增強方法。