麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

用于生成智能體的大語(yǔ)言模型訓(xùn)練方法及相關(guān)設(shè)備與流程

文檔序號(hào):41758093發(fā)布日期:2025-04-29 18:26閱讀:4來(lái)源:國(guó)知局
用于生成智能體的大語(yǔ)言模型訓(xùn)練方法及相關(guān)設(shè)備與流程

所屬的技術(shù)人員能夠理解,本公開的各個(gè)方面可以實(shí)現(xiàn)為系統(tǒng)、方法或程序產(chǎn)品。因此,本公開的各個(gè)方面可以具體實(shí)現(xiàn)為以下形式,即:完全的硬件實(shí)施方式、完全的軟件實(shí)施方式(包括固件、微代碼等),或硬件和軟件方面結(jié)合的實(shí)施方式,這里可以統(tǒng)稱為“電路”、“模塊”或“系統(tǒng)”。下面參照?qǐng)D9來(lái)描述根據(jù)本公開的這種實(shí)施方式的電子設(shè)備900。圖9顯示的電子設(shè)備900僅僅是一個(gè)示例,不應(yīng)對(duì)本公開實(shí)施例的功能和使用范圍帶來(lái)任何限制。如圖9所示,電子設(shè)備900以通用計(jì)算設(shè)備的形式表現(xiàn)。電子設(shè)備900的組件可以包括但不限于:上述至少一個(gè)處理單元910、上述至少一個(gè)存儲(chǔ)單元920、連接不同系統(tǒng)組件(包括存儲(chǔ)單元920和處理單元910)的總線930。其中,存儲(chǔ)單元存儲(chǔ)有程序代碼,程序代碼可以被處理單元910執(zhí)行,使得處理單元910執(zhí)行本說(shuō)明書上述“示例性方法”部分中描述的根據(jù)本公開各種示例性實(shí)施方式的步驟。例如,處理單元910可以執(zhí)行上述方法實(shí)施例中的任一項(xiàng)的步驟。存儲(chǔ)單元920可以包括易失性存儲(chǔ)單元形式的可讀介質(zhì),例如隨機(jī)存取存儲(chǔ)單元(ram)9201和/或高速緩存存儲(chǔ)單元9202,還可以進(jìn)一步包括只讀存儲(chǔ)單元(rom)9203。存儲(chǔ)單元920還可以包括具有一組(至少一個(gè))程序模塊9205的程序/實(shí)用工具9204,這樣的程序模塊9205包括但不限于:操作系統(tǒng)、一個(gè)或者多個(gè)應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個(gè)或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實(shí)現(xiàn)。總線930可以為表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲(chǔ)單元總線或者存儲(chǔ)單元控制器、外圍總線、圖形加速端口、處理單元或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。電子設(shè)備900也可以與一個(gè)或多個(gè)外部設(shè)備940(例如鍵盤、指向設(shè)備、藍(lán)牙設(shè)備等)通信,還可與一個(gè)或者多個(gè)使得用戶能與該電子設(shè)備900交互的設(shè)備通信,和/或與使得該電子設(shè)備900能與一個(gè)或多個(gè)其它計(jì)算設(shè)備進(jìn)行通信的任何設(shè)備(例如路由器、調(diào)制解調(diào)器等等)通信。這種通信可以通過(guò)輸入/輸出(i/o)接口950進(jìn)行。并且,電子設(shè)備900還可以通過(guò)網(wǎng)絡(luò)適配器960與一個(gè)或者多個(gè)網(wǎng)絡(luò)(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖所示,網(wǎng)絡(luò)適配器960通過(guò)總線930與電子設(shè)備900的其它模塊通信。應(yīng)當(dāng)明白,盡管圖中未示出,可以結(jié)合電子設(shè)備900使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設(shè)備驅(qū)動(dòng)器、冗余處理單元、外部磁盤驅(qū)動(dòng)陣列、raid系統(tǒng)、磁帶驅(qū)動(dòng)器以及數(shù)據(jù)備份存儲(chǔ)系統(tǒng)等。通過(guò)以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員易于理解,這里描述的示例實(shí)施方式可以通過(guò)軟件實(shí)現(xiàn),也可以通過(guò)軟件結(jié)合必要的硬件的方式來(lái)實(shí)現(xiàn)。因此,根據(jù)本公開實(shí)施方式的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該軟件產(chǎn)品可以存儲(chǔ)在一個(gè)非易失性存儲(chǔ)介質(zhì)(可以是cd-rom,u盤,移動(dòng)硬盤等)中或網(wǎng)絡(luò)上,包括若干指令以使得一臺(tái)計(jì)算設(shè)備(可以是個(gè)人計(jì)算機(jī)、服務(wù)器、終端裝置、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行根據(jù)本公開實(shí)施方式的方法。特別地,根據(jù)本公開的實(shí)施例,上文參考流程圖描述的過(guò)程可以被實(shí)現(xiàn)為計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序,該計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序包括計(jì)算機(jī)指令,該計(jì)算機(jī)指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中。計(jì)算機(jī)設(shè)備的處理器從計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取該計(jì)算機(jī)指令,處理器執(zhí)行該計(jì)算機(jī)指令,使得該計(jì)算機(jī)設(shè)備執(zhí)行上述實(shí)施例中的方法。在本公開的示例性實(shí)施例中,還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是可讀信號(hào)介質(zhì)或者可讀存儲(chǔ)介質(zhì)。其上存儲(chǔ)有能夠?qū)崿F(xiàn)本公開上述方法的程序產(chǎn)品。在一些可能的實(shí)施方式中,本公開的各個(gè)方面還可以實(shí)現(xiàn)為一種程序產(chǎn)品的形式,其包括程序代碼,當(dāng)所述程序產(chǎn)品在終端設(shè)備上運(yùn)行時(shí),所述程序代碼用于使所述終端設(shè)備執(zhí)行本說(shuō)明書上述“示例性方法”部分中描述的根據(jù)本公開各種示例性實(shí)施方式的步驟。本公開中的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子可以包括但不限于:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤、硬盤、隨機(jī)訪問(wèn)存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、可擦式可編程只讀存儲(chǔ)器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲(chǔ)器(cd-rom)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。在本公開中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào),其中承載了可讀程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式,包括但不限于電磁信號(hào)、光信號(hào)或上述的任意合適的組合。可讀信號(hào)介質(zhì)還可以是可讀存儲(chǔ)介質(zhì)以外的任何可讀介質(zhì),該可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。可選地,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括但不限于無(wú)線、有線、光纜、rf等等,或者上述的任意合適的組合。在具體實(shí)施時(shí),可以以一種或多種程序設(shè)計(jì)語(yǔ)言的任意組合來(lái)編寫用于執(zhí)行本公開操作的程序代碼,所述程序設(shè)計(jì)語(yǔ)言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言—諸如java、c++等,還包括常規(guī)的過(guò)程式程序設(shè)計(jì)語(yǔ)言—諸如“c”語(yǔ)言或類似的程序設(shè)計(jì)語(yǔ)言。程序代碼可以完全地在用戶計(jì)算設(shè)備上執(zhí)行、部分地在用戶設(shè)備上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算設(shè)備上部分在遠(yuǎn)程計(jì)算設(shè)備上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算設(shè)備或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算設(shè)備的情形中,遠(yuǎn)程計(jì)算設(shè)備可以通過(guò)任意種類的網(wǎng)絡(luò),包括局域網(wǎng)(lan)或廣域網(wǎng)(wan),連接到用戶計(jì)算設(shè)備,或者,可以連接到外部計(jì)算設(shè)備(例如利用因特網(wǎng)服務(wù)提供商來(lái)通過(guò)因特網(wǎng)連接)。應(yīng)當(dāng)注意,盡管在上文詳細(xì)描述中提及了用于動(dòng)作執(zhí)行的設(shè)備的若干模塊或者單元,但是這種劃分并非強(qiáng)制性的。實(shí)際上,根據(jù)本公開的實(shí)施方式,上文描述的兩個(gè)或更多模塊或者單元的特征和功能可以在一個(gè)模塊或者單元中具體化。反之,上文描述的一個(gè)模塊或者單元的特征和功能可以進(jìn)一步劃分為由多個(gè)模塊或者單元來(lái)具體化。此外,盡管在附圖中以特定順序描述了本公開中方法的各個(gè)步驟,但是,這并非要求或者暗示必須按照該特定順序來(lái)執(zhí)行這些步驟,或是必須執(zhí)行全部所示的步驟才能實(shí)現(xiàn)期望的結(jié)果。附加的或備選的,可以省略某些步驟,將多個(gè)步驟合并為一個(gè)步驟執(zhí)行,以及/或者將一個(gè)步驟分解為多個(gè)步驟執(zhí)行等。通過(guò)以上實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員易于理解,這里描述的示例實(shí)施方式可以通過(guò)軟件實(shí)現(xiàn),也可以通過(guò)軟件結(jié)合必要的硬件的方式來(lái)實(shí)現(xiàn)。因此,根據(jù)本公開實(shí)施方式的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該軟件產(chǎn)品可以存儲(chǔ)在一個(gè)非易失性存儲(chǔ)介質(zhì)(可以是cd-rom,u盤,移動(dòng)硬盤等)中或網(wǎng)絡(luò)上,包括若干指令以使得一臺(tái)計(jì)算設(shè)備(可以是個(gè)人計(jì)算機(jī)、服務(wù)器、移動(dòng)終端、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行根據(jù)本公開實(shí)施方式的方法。本領(lǐng)域技術(shù)人員在考慮說(shuō)明書及實(shí)踐這里公開的發(fā)明后,將容易想到本公開的其它實(shí)施方案。本公開旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本中的公知常識(shí)或慣用技術(shù)手段。說(shuō)明書和實(shí)施例僅被視為示例性的,本公開的真正范圍和精神由所附的權(quán)利要求指出。


背景技術(shù):

1、在人工智能領(lǐng)域,智能體的迭代和優(yōu)化是一個(gè)復(fù)雜且關(guān)鍵的過(guò)程。當(dāng)前,智能體的訓(xùn)練依賴于大量的語(yǔ)料,這些語(yǔ)料往往需要通過(guò)大模型來(lái)生成。

2、然而,這些語(yǔ)料在一些方面對(duì)大模型訓(xùn)練表現(xiàn)不佳,基于此,如何獲得高質(zhì)量的智能體訓(xùn)練語(yǔ)料,提升對(duì)復(fù)雜任務(wù)的有效性和可靠性,依舊是一個(gè)亟待解決的問(wèn)題。

3、需要說(shuō)明的是,在上述背景技術(shù)部分公開的信息僅用于加強(qiáng)對(duì)本公開的背景的理解,因此可以包括不構(gòu)成對(duì)本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。


技術(shù)實(shí)現(xiàn)思路

1、本公開提供一種用于生成智能體的大語(yǔ)言模型訓(xùn)練方法及相關(guān)設(shè)備,至少可以提升大語(yǔ)言模型訓(xùn)練預(yù)料的質(zhì)量,提升后續(xù)生成的智能體質(zhì)量,提升智能體可靠性和有效性。

2、本公開的其他特性和優(yōu)點(diǎn)將通過(guò)下面的詳細(xì)描述變得顯然,或部分地通過(guò)本公開的實(shí)踐而習(xí)得。

3、第一方面,本公開中的實(shí)施例提供一種用于生成智能體的大語(yǔ)言模型訓(xùn)練方法,所述方法包括:

4、獲取待訓(xùn)練代理模板的智能體組成元信息;

5、根據(jù)輸入的問(wèn)題查詢和所述智能體組成元信息,通過(guò)大參數(shù)量的大語(yǔ)言模型,生成多個(gè)待訓(xùn)練代理模板;

6、根據(jù)每個(gè)標(biāo)簽智能體的標(biāo)簽代理模板,對(duì)所述多個(gè)待訓(xùn)練代理模板進(jìn)行篩選,得到目標(biāo)代理模板;

7、根據(jù)所述目標(biāo)代理模板,對(duì)待訓(xùn)練大語(yǔ)言模型進(jìn)行訓(xùn)練。

8、在一種可能的實(shí)施例中,所述獲取待訓(xùn)練代理模板的智能體組成元信息,包括:

9、獲取多個(gè)標(biāo)簽智能體;

10、提取所述多個(gè)標(biāo)簽智能體的共同架構(gòu)特征,生成待訓(xùn)練代理模板的智能體組成元信息。

11、在一種可能的實(shí)施例中,所述智能體組成元信息包括以下至少一項(xiàng):簡(jiǎn)介、指令、工具、記憶、目標(biāo)、格式和用戶偏好。

12、在一種可能的實(shí)施例中,所述根據(jù)輸入的問(wèn)題查詢和所述智能體組成元信息,通過(guò)大參數(shù)量的大語(yǔ)言模型,生成多個(gè)待訓(xùn)練代理模板,包括:

13、將所述問(wèn)題查詢輸入所述大參數(shù)量的大語(yǔ)言模型,確定待生成智能體的代理模板對(duì)應(yīng)的應(yīng)用場(chǎng)景和任務(wù)需求,生成不同的引導(dǎo)提示信息;

14、將所述智能體組成元信息、所述引導(dǎo)提示信息和所述問(wèn)題查詢,輸入至所述大參數(shù)量的大語(yǔ)言模型中,生成多個(gè)待訓(xùn)練代理模板。

15、在一種可能的實(shí)施例中,所述將所述問(wèn)題查詢輸入所述大參數(shù)量的大語(yǔ)言模型,確定待生成智能體的代理模板對(duì)應(yīng)的應(yīng)用場(chǎng)景和任務(wù)需求,生成引導(dǎo)提示信息,包括:

16、將所述問(wèn)題查詢輸入所述大參數(shù)量的大語(yǔ)言模型,確定待生成智能體的代理模板對(duì)應(yīng)的應(yīng)用場(chǎng)景和任務(wù)需求;

17、根據(jù)所述應(yīng)用場(chǎng)景和所述任務(wù)需求,通過(guò)關(guān)鍵詞擴(kuò)展、上下文模擬和預(yù)先設(shè)置的引導(dǎo)詞模板生成所述引導(dǎo)提示信息。

18、在一種可能的實(shí)施例中,所述根據(jù)每個(gè)所述標(biāo)簽智能體的標(biāo)簽代理模板,對(duì)所述多個(gè)待訓(xùn)練代理模板進(jìn)行篩選,得到目標(biāo)代理模板,包括:

19、針對(duì)任意一個(gè)待評(píng)估代理模板和輸入的多個(gè)所述問(wèn)題查詢中的任意一個(gè)問(wèn)題查詢,確定所述任意一個(gè)待評(píng)估代理模板與每個(gè)標(biāo)簽代理模板之間的相似度得分;

20、篩選相似度得分大于或者等于分?jǐn)?shù)閾值的目標(biāo)相似度得分,確定對(duì)應(yīng)的剩余標(biāo)簽代理模板;

21、根據(jù)所述任意一個(gè)問(wèn)題查詢,以及,所述剩余標(biāo)簽代理模板對(duì)應(yīng)的執(zhí)行結(jié)果,確定相關(guān)性得分;

22、根據(jù)每個(gè)剩余標(biāo)簽代理模板對(duì)應(yīng)的所述相關(guān)性得分和所述目標(biāo)相似度得分,確定所述任意一個(gè)待評(píng)估代理模板與每個(gè)剩余標(biāo)簽代理模板之間的綜合評(píng)分;

23、從所述綜合評(píng)分中,確定所述任意一個(gè)問(wèn)題查詢的最大綜合評(píng)分,分別確定多個(gè)問(wèn)題查詢對(duì)應(yīng)的最大綜合評(píng)分;

24、根據(jù)所述多個(gè)問(wèn)題查詢對(duì)應(yīng)的最大綜合評(píng)分,確定所述任意一個(gè)待評(píng)估代理模板的最終得分,得到每個(gè)所述待評(píng)估代理模板的最終得分;

25、根據(jù)每個(gè)所述待評(píng)估代理模板的最終得分,確定目標(biāo)代理模板。

26、在一種可能的實(shí)施例中,所述根據(jù)所述目標(biāo)代理模板,對(duì)待訓(xùn)練大語(yǔ)言模型進(jìn)行訓(xùn)練,包括:

27、將所述目標(biāo)代理模板、所述多個(gè)標(biāo)簽代理模板和通用代理模板數(shù)據(jù)集混合,得到訓(xùn)練數(shù)據(jù)集;

28、根據(jù)所述訓(xùn)練數(shù)據(jù)集,對(duì)小參數(shù)量的大語(yǔ)言模型進(jìn)行訓(xùn)練。

29、第二方面,本公開中的實(shí)施例提供一種用于生成智能體的大語(yǔ)言模型訓(xùn)練裝置,包括:

30、獲取單元,用于獲取待訓(xùn)練代理模板的智能體組成元信息;

31、生成單元,用于根據(jù)輸入的問(wèn)題查詢和所述智能體組成元信息,通過(guò)大參數(shù)量的大語(yǔ)言模型,生成多個(gè)待訓(xùn)練代理模板;

32、篩選單元,用于根據(jù)每個(gè)所述標(biāo)簽智能體的標(biāo)簽代理模板,對(duì)所述多個(gè)待訓(xùn)練代理模板進(jìn)行篩選,得到目標(biāo)代理模板;

33、訓(xùn)練單元,用于根據(jù)所述目標(biāo)代理模板,對(duì)待訓(xùn)練大語(yǔ)言模型進(jìn)行訓(xùn)練。

34、第三方面,本公開實(shí)施例提供一種電子設(shè)備,包括:處理器;以及存儲(chǔ)器,用于存儲(chǔ)處理器的可執(zhí)行指令;其中,處理器配置為經(jīng)由執(zhí)行可執(zhí)行指令來(lái)執(zhí)行上述的第一方面中的方法。

35、第四方面,本公開實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的第一方面中的方法。

36、第五方面,根據(jù)本公開的另一個(gè)方面,還提供了一種計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序,該計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序包括計(jì)算機(jī)指令,該計(jì)算機(jī)指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中。計(jì)算機(jī)設(shè)備的處理器從計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取該計(jì)算機(jī)指令,處理器執(zhí)行該計(jì)算機(jī)指令,使得該計(jì)算機(jī)設(shè)備執(zhí)行上述任一項(xiàng)的方法。

37、本公開的實(shí)施例所提供的一種用于生成智能體的大語(yǔ)言模型訓(xùn)練方法及相關(guān)設(shè)備,涉及人工智能技術(shù)領(lǐng)域,該方法包括:獲取待訓(xùn)練代理模板的智能體組成元信息;根據(jù)輸入的問(wèn)題查詢和智能體組成元信息,通過(guò)大參數(shù)量的大語(yǔ)言模型,生成多個(gè)待訓(xùn)練代理模板;根據(jù)每個(gè)標(biāo)簽智能體的標(biāo)簽代理模板,對(duì)多個(gè)待訓(xùn)練代理模板進(jìn)行篩選,得到目標(biāo)代理模板;根據(jù)目標(biāo)代理模板,對(duì)待訓(xùn)練大語(yǔ)言模型進(jìn)行訓(xùn)練。通過(guò)上述方式,以現(xiàn)有的高質(zhì)量智能體,即標(biāo)簽智能體的代理模板對(duì)生成的代理模板進(jìn)行篩選,并對(duì)大語(yǔ)言模型進(jìn)行訓(xùn)練,形成自動(dòng)迭代閉環(huán),可以實(shí)現(xiàn)智能體訓(xùn)練語(yǔ)料的優(yōu)化和模型性能的不斷提升,自動(dòng)反饋和調(diào)整,使得智能體能夠不斷學(xué)習(xí)和適應(yīng),提高了模型的穩(wěn)定性和可靠性。

38、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
主站蜘蛛池模板: 蓬安县| 古田县| 抚顺市| 嘉义市| 桃园县| 张家港市| 唐海县| 大埔县| 鲁甸县| 盐山县| 吉首市| 青龙| 长泰县| 大英县| 手机| 绥化市| 璧山县| 台中市| 杭锦旗| 金寨县| 桐柏县| 永川市| 余庆县| 留坝县| 时尚| 娱乐| 泾阳县| 错那县| 当雄县| 兴仁县| 凤山县| 高阳县| 报价| 遵义市| 巫溪县| 孟津县| 临桂县| 渝中区| 普格县| 蒲江县| 宁津县|