本發(fā)明屬于生成式人工智能領(lǐng)域,具體涉及一種基于大模型的自動(dòng)化作文評(píng)分與反饋的方法及系統(tǒng)。
背景技術(shù):
1、作文評(píng)分和反饋一直是教育領(lǐng)域中的核心問(wèn)題之一,傳統(tǒng)的作文評(píng)分方法通常依賴人工評(píng)分,耗時(shí)且主觀性較強(qiáng),難以做到公正性和一致性的評(píng)估。近年來(lái),隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于大模型的自動(dòng)化作文評(píng)分系統(tǒng)逐漸成為可能。這些系統(tǒng)可以通過(guò)自然語(yǔ)言處理(nlp)模型,自動(dòng)評(píng)估作文的質(zhì)量,并為學(xué)生提供個(gè)性化的反饋。
2、然而,現(xiàn)有的自動(dòng)化作文評(píng)分系統(tǒng)主要關(guān)注于單一評(píng)分維度(如語(yǔ)法或內(nèi)容),缺乏多維度綜合評(píng)估能力。同時(shí),現(xiàn)有技術(shù)在生成個(gè)性化反饋時(shí),往往無(wú)法根據(jù)學(xué)生的具體寫作問(wèn)題提供深入、針對(duì)性的建議,導(dǎo)致反饋的有效性不足。此外,現(xiàn)有系統(tǒng)通常依賴于有限的數(shù)據(jù)集和標(biāo)注,難以適應(yīng)各種作文類型和風(fēng)格的評(píng)分需求。
3、隨著預(yù)訓(xùn)練語(yǔ)言大模型的發(fā)展,基于大規(guī)模語(yǔ)料庫(kù)進(jìn)行預(yù)訓(xùn)練,再進(jìn)行微調(diào),能夠顯著提升自動(dòng)化評(píng)分的準(zhǔn)確性和可靠性。這些模型可以捕捉語(yǔ)言中的深層次規(guī)律,從而提高評(píng)分的精確度。與此同時(shí),生成模型在自然語(yǔ)言生成任務(wù)中表現(xiàn)出色,使得個(gè)性化反饋生成成為可能。
4、然而,盡管大模型在自然語(yǔ)言處理領(lǐng)域取得了顯著的進(jìn)展,如何結(jié)合這些模型進(jìn)行高效的作文評(píng)分和反饋生成,尤其是如何為學(xué)生提供具體的改進(jìn)建議,依然是一個(gè)需要深入研究的問(wèn)題。因此,如何結(jié)合大模型的強(qiáng)大能力,提供更為全面、準(zhǔn)確且個(gè)性化的作文評(píng)分和反饋,成為當(dāng)前技術(shù)中的一個(gè)重要挑戰(zhàn)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于解決現(xiàn)有技術(shù)中的上述問(wèn)題,并提供一種基于大模型的自動(dòng)化作文評(píng)分與反饋的方法及系統(tǒng)。
2、本發(fā)明所采用的具體技術(shù)方案如下:
3、第一方面,本發(fā)明提供了一種基于大模型的自動(dòng)化作文評(píng)分與反饋的方法,其包括:
4、s1、獲取由學(xué)生作文圖像組成的第一數(shù)據(jù)集,對(duì)第一數(shù)據(jù)集中的學(xué)生作文圖像進(jìn)行超分辨率重建,然后通過(guò)光學(xué)字符識(shí)別(ocr)技術(shù)將每篇學(xué)生作文由重建圖像轉(zhuǎn)換為文本,再將轉(zhuǎn)換文本輸入錯(cuò)誤修正模型中校正識(shí)別錯(cuò)誤,從而建立由學(xué)生作文文本組成的第二數(shù)據(jù)集;
5、s2、將第二數(shù)據(jù)集分為多個(gè)子數(shù)據(jù)集,每個(gè)子數(shù)據(jù)集隨機(jī)發(fā)送至多個(gè)不同的專家評(píng)分客戶端供專家對(duì)其中的每篇學(xué)生作文文本進(jìn)行多維度評(píng)分,對(duì)所有專家評(píng)分客戶端返回的多維度評(píng)分?jǐn)?shù)據(jù)進(jìn)行質(zhì)量控制和結(jié)果融合,獲得第二數(shù)據(jù)集中每篇學(xué)生作文文本的多維度評(píng)分標(biāo)簽;
6、s3、以帶有所述多維度評(píng)分標(biāo)簽的第二數(shù)據(jù)集為微調(diào)數(shù)據(jù)集,對(duì)第一大語(yǔ)言模型進(jìn)行微調(diào),獲得能夠?qū)W(xué)生作文文本進(jìn)行多維度評(píng)分的作文評(píng)分模型;
7、s4、針對(duì)學(xué)生客戶端上傳的目標(biāo)作文圖像,將轉(zhuǎn)換為目標(biāo)作文文本后輸入所述作文評(píng)分模型中獲得多維度評(píng)分結(jié)果,然后將所述目標(biāo)作文文本以及所述多維度評(píng)分結(jié)果替換提示詞模板中的占位符,形成用于驅(qū)動(dòng)模型生成多維度作文改進(jìn)建議的提示詞文本,最后將提示詞文本輸入基于第二大語(yǔ)言模型構(gòu)建的作文反饋模型中,并將生成的多維度作文改進(jìn)建議反饋至學(xué)生客戶端。
8、作為上述第一方面的優(yōu)選,所述錯(cuò)誤修正模型采用bilstm-crf模型。
9、作為上述第一方面的優(yōu)選,所述第一數(shù)據(jù)集中的學(xué)生作文圖像需要輸入預(yù)先訓(xùn)練的雙通道cnn模型中評(píng)估圖像質(zhì)量,剔除圖像質(zhì)量評(píng)分小于閾值的樣本。
10、作為上述第一方面的優(yōu)選,對(duì)所有專家評(píng)分客戶端返回的多維度評(píng)分?jǐn)?shù)據(jù)進(jìn)行質(zhì)量控制和結(jié)果融合時(shí),需針對(duì)同一篇學(xué)生作文文本的所有多維度評(píng)分?jǐn)?shù)據(jù)進(jìn)行異常值剔除,然后將剩余的多維度評(píng)分?jǐn)?shù)據(jù)進(jìn)行逐維度平均,從而獲得多維度平均評(píng)分作為這篇學(xué)生作文文本對(duì)應(yīng)的多維度評(píng)分標(biāo)簽。
11、作為上述第一方面的優(yōu)選,對(duì)所述第一大語(yǔ)言模型進(jìn)行微調(diào)時(shí),損失函數(shù)為模型輸出的多維度評(píng)分結(jié)果與專家評(píng)分得到的所述多維度評(píng)分標(biāo)簽之間的均方誤差。
12、作為上述第一方面的優(yōu)選,所述多維度評(píng)分所采用的評(píng)分維度包括語(yǔ)法、內(nèi)容、流暢性、邏輯性和創(chuàng)意性。
13、第二方面,本發(fā)明提供了一種基于大模型的自動(dòng)化作文評(píng)分與反饋的系統(tǒng),其包括:
14、訓(xùn)練數(shù)據(jù)構(gòu)建模塊,用于獲取由學(xué)生作文圖像組成的第一數(shù)據(jù)集,對(duì)第一數(shù)據(jù)集中的學(xué)生作文圖像進(jìn)行超分辨率重建,然后通過(guò)光學(xué)字符識(shí)別(ocr)技術(shù)將每篇學(xué)生作文由重建圖像轉(zhuǎn)換為文本,再將轉(zhuǎn)換文本輸入錯(cuò)誤修正模型中校正識(shí)別錯(cuò)誤,從而建立由學(xué)生作文文本組成的第二數(shù)據(jù)集;
15、評(píng)分標(biāo)簽生成模塊,用于將第二數(shù)據(jù)集分為多個(gè)子數(shù)據(jù)集,每個(gè)子數(shù)據(jù)集隨機(jī)發(fā)送至多個(gè)不同的專家評(píng)分客戶端供專家對(duì)其中的每篇學(xué)生作文文本進(jìn)行多維度評(píng)分,對(duì)所有專家評(píng)分客戶端返回的多維度評(píng)分?jǐn)?shù)據(jù)進(jìn)行質(zhì)量控制和結(jié)果融合,獲得第二數(shù)據(jù)集中每篇學(xué)生作文文本的多維度評(píng)分標(biāo)簽;
16、模型微調(diào)模塊,用于以帶有所述多維度評(píng)分標(biāo)簽的第二數(shù)據(jù)集為微調(diào)數(shù)據(jù)集,對(duì)第一大語(yǔ)言模型進(jìn)行微調(diào),獲得能夠?qū)W(xué)生作文文本進(jìn)行多維度評(píng)分的作文評(píng)分模型;
17、評(píng)分反饋模塊,用于針對(duì)學(xué)生客戶端上傳的目標(biāo)作文圖像,將轉(zhuǎn)換為目標(biāo)作文文本后輸入所述作文評(píng)分模型中獲得多維度評(píng)分結(jié)果,然后將所述目標(biāo)作文文本以及所述多維度評(píng)分結(jié)果替換提示詞模板中的占位符,形成用于驅(qū)動(dòng)模型生成多維度作文改進(jìn)建議的提示詞文本,最后將提示詞文本輸入基于第二大語(yǔ)言模型構(gòu)建的作文反饋模型中,并將生成的多維度作文改進(jìn)建議反饋至學(xué)生客戶端。
18、第三方面,本發(fā)明提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí),能實(shí)現(xiàn)如上述第一方面任一方案所述的基于大模型的自動(dòng)化作文評(píng)分與反饋的方法。
19、第四方面,本發(fā)明提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),能實(shí)現(xiàn)如上述第一方面任一方案所述的基于大模型的自動(dòng)化作文評(píng)分與反饋的方法。
20、第五方面,本發(fā)明提供了一種計(jì)算機(jī)電子設(shè)備,其包括存儲(chǔ)器和處理器;
21、所述存儲(chǔ)器,用于存儲(chǔ)計(jì)算機(jī)程序;
22、所述處理器,用于當(dāng)執(zhí)行所述計(jì)算機(jī)程序時(shí),能實(shí)現(xiàn)如上述第一方面任一方案所述的基于大模型的自動(dòng)化作文評(píng)分與反饋的方法。
23、本發(fā)明相對(duì)于現(xiàn)有技術(shù)而言,具有以下有益效果:
24、本發(fā)明可以利用基于大語(yǔ)言模型微調(diào)的作文評(píng)分模型來(lái)自動(dòng)對(duì)作文文本進(jìn)行多維度評(píng)分,再使用大語(yǔ)言模型將評(píng)分結(jié)果與作文內(nèi)容結(jié)合,自動(dòng)生成針對(duì)作文的改進(jìn)建議,幫助學(xué)生在具體作文維度上進(jìn)行改進(jìn)。與傳統(tǒng)人工評(píng)分方法相比,本發(fā)明具有高效、客觀、可擴(kuò)展等優(yōu)勢(shì),同時(shí)能夠提供更具針對(duì)性的反饋,幫助學(xué)生在寫作中得到及時(shí)的改進(jìn)建議,提高寫作水平。
1.一種基于大模型的自動(dòng)化作文評(píng)分與反饋的方法,其特征在于,包括:
2.如權(quán)利要求1所述的基于大模型的自動(dòng)化作文評(píng)分與反饋的方法,其特征在于,所述錯(cuò)誤修正模型采用bilstm-crf模型。
3.如權(quán)利要求1所述的基于大模型的自動(dòng)化作文評(píng)分與反饋的方法,其特征在于,所述第一數(shù)據(jù)集中的學(xué)生作文圖像需要輸入預(yù)先訓(xùn)練的雙通道cnn模型中評(píng)估圖像質(zhì)量,剔除圖像質(zhì)量評(píng)分小于閾值的樣本。
4.如權(quán)利要求1所述的基于大模型的自動(dòng)化作文評(píng)分與反饋的方法,其特征在于,對(duì)所有專家評(píng)分客戶端返回的多維度評(píng)分?jǐn)?shù)據(jù)進(jìn)行質(zhì)量控制和結(jié)果融合時(shí),需針對(duì)同一篇學(xué)生作文文本的所有多維度評(píng)分?jǐn)?shù)據(jù)進(jìn)行異常值剔除,然后將剩余的多維度評(píng)分?jǐn)?shù)據(jù)進(jìn)行逐維度平均,從而獲得多維度平均評(píng)分作為這篇學(xué)生作文文本對(duì)應(yīng)的多維度評(píng)分標(biāo)簽。
5.如權(quán)利要求1所述的基于大模型的自動(dòng)化作文評(píng)分與反饋的方法,其特征在于,對(duì)所述第一大語(yǔ)言模型進(jìn)行微調(diào)時(shí),損失函數(shù)為模型輸出的多維度評(píng)分結(jié)果與專家評(píng)分得到的所述多維度評(píng)分標(biāo)簽之間的均方誤差。
6.如權(quán)利要求1所述的基于大模型的自動(dòng)化作文評(píng)分與反饋的方法,其特征在于,所述多維度評(píng)分所采用的評(píng)分維度包括語(yǔ)法、內(nèi)容、流暢性、邏輯性和創(chuàng)意性。
7.一種基于大模型的自動(dòng)化作文評(píng)分與反饋的系統(tǒng),其特征在于,包括:
8.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,其特征在于,該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí),能實(shí)現(xiàn)如權(quán)利要求1~7任一所述的基于大模型的自動(dòng)化作文評(píng)分與反饋的方法。
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1~7任一所述的基于大模型的自動(dòng)化作文評(píng)分與反饋的方法。
10.一種計(jì)算機(jī)電子設(shè)備,其特征在于,包括存儲(chǔ)器和處理器;