本申請屬于數據處理,具體涉及一種基于cr-hepb平臺的乙肝研究路徑生成方法、裝置及電子設備。
背景技術:
1、乙型肝炎是一種全球性公共衛生問題,乙肝病毒(hbv)感染引起的慢性疾病可能導致嚴重的肝臟損害,包括肝硬化和肝細胞癌。目前全球約有2.57億人感染乙肝病毒,每年導致超過80萬人死亡。盡管在疫苗接種和抗病毒治療方面取得了顯著進展,但許多研究空白仍未被填補,包括病毒變異機制、抗藥性問題、新型治療方案、以及個性化醫療的優化。
2、在乙肝領域,研究的核心挑戰主要包括:現有研究積累了大量的文獻、臨床試驗數據和實驗數據,但這些數據分散且缺乏系統化整理;科研人員往往需要花費大量時間從海量文獻和數據中尋找研究空白,而這種依賴手動分析的方式效率低下且容易遺漏潛在的重要研究方向;乙肝領域的研究熱點隨臨床實踐和科學技術的進步不斷變化,但傳統的研究路徑規劃缺乏動態更新能力。因此,亟需一種研究路徑生成方法以動態適應科研領域的變化。
技術實現思路
1、本申請的目的是提供一種基于cr-hepb平臺的乙肝研究路徑生成方法、裝置及電子設備以動態適應科研領域的變化生成研究路徑。
2、根據本申請實施例的第一方面,提供了一種基于cr-hepb平臺的乙肝研究路徑生成方法,該方法可以包括:
3、從cr-hepb平臺獲取乙肝相關的多維度領域數據;
4、對多維度領域數據進行數據整合處理,得到多源輸入數據;
5、將多源輸入數據輸入到訓練好的qwen2模型中,得到乙肝研究路徑,訓練好的qwen2模型為引入動態權重調整機制的模型。
6、在本申請的一些可選實施例中,從cr-hepb平臺獲取乙肝相關的多維度領域數據,包括:
7、獲取cr-hepb平臺中收錄的乙肝相關研究文獻;
8、獲取cr-hepb平臺中電子病歷和隨訪記錄;
9、獲取cr-hepb平臺的基因測序數據庫;
10、獲取cr-hepb平臺中整理的疾病進展和監測數據。
11、在本申請的一些可選實施例中,對多維度領域數據進行數據整合處理,得到多源輸入數據,包括:
12、基于知識圖譜對多維度領域數據進行整合,得到整合數據;
13、對整合數據進行預處理,得到多源輸入數據。
14、在本申請的一些可選實施例中,基于知識圖譜對多維度領域數據進行整合,得到整合數據,包括:
15、將多維度領域數據中的關鍵內容提取為標準實體;
16、在標準實體之間建立關系邊,以表示數據項之間的語義關聯;
17、將不同模態的數據對齊到統一的語義空間中,得到融合數據;
18、將提取的實體與關系組織成動態的知識圖譜,知識圖譜隨數據變化更新;
19、對知識圖譜進行數據驗證與優化,得到整合數據。
20、在本申請的一些可選實施例中,對整合數據進行預處理,得到多源輸入數據,包括:
21、對文獻數據進行動態摘要生成與多層次語義標注;
22、對臨床數據進行多維時間序列對齊與動態預測;
23、對基因組數據進行實時功能注釋擴展與多維特征提取;
24、對整合數據進行清洗,得到多源輸入數據。
25、在本申請的一些可選實施例中,訓練好的qwen2模型是通過下述方法訓練得到:
26、從文獻數據、臨床數據及基因組數據中提取關鍵詞;
27、對關鍵詞進行詞頻統計,得到關鍵詞的出現頻率;
28、根據出現頻率,計算每個關鍵詞的權重;
29、根據關鍵詞的語義重要性,在qwen2模型的訓練中動態調整關鍵詞的語義權重。
30、在本申請的一些可選實施例中,權重的計算公式為:
31、
32、其中,wi為權重;為通用詞權重;freq(k)為關鍵詞頻率。
33、根據本申請實施例的第二方面,提供一種基于cr-hepb平臺的乙肝研究路徑生成裝置,該裝置可以包括:
34、獲取模塊,用于從cr-hepb平臺獲取乙肝相關的多維度領域數據;
35、整合處理模塊,用于對多維度領域數據進行數據整合處理,得到多源輸入數據;
36、研究路徑生成模塊,用于將多源輸入數據輸入到訓練好的qwen2模型中,得到乙肝研究路徑,訓練好的qwen2模型為引入動態權重調整機制的模型。
37、根據本申請實施例的第三方面,提供一種電子設備,該電子設備可以包括:
38、處理器;
39、用于存儲處理器可執行指令的存儲器;
40、其中,處理器被配置為執行指令,以實現如第一方面的任一項實施例中所示的基于cr-hepb平臺的乙肝研究路徑生成方法。
41、根據本申請實施例的第四方面,提供一種存儲介質,當存儲介質中的指令由信息處理裝置或者服務器的處理器執行時,以使信息處理裝置或者服務器實現如第一方面的任一項實施例中所示的基于cr-hepb平臺的乙肝研究路徑生成方法。
42、本申請的上述技術方案具有如下有益的技術效果:
43、本申請實施例方法通過利用定制化訓練的大語言模型結合cr-hepb平臺的多維度數據資源,智能生成乙肝研究路徑和研究方法。通過領域定制化訓練,能夠精準解析科研文獻、挖掘研究空白,并生成動態適配的研究路線圖,涵蓋實驗設計、數據分析路徑等具體內容。此外,該方法實現了多維數據整合與邏輯一致的創新性研究方法生成,同時支持個性化的科研路徑定制與動態優化,顯著提升科研效率和創新能力。
1.一種基于cr-hepb平臺的乙肝研究路徑生成方法,其特征在于,包括:
2.根據權利要求1所述的基于cr-hepb平臺的乙肝研究路徑生成方法,其特征在于,所述從cr-hepb平臺獲取乙肝相關的多維度領域數據,包括:
3.根據權利要求1所述的基于cr-hepb平臺的乙肝研究路徑生成方法,其特征在于,所述對所述多維度領域數據進行數據整合處理,得到多源輸入數據,包括:
4.根據權利要求3所述的基于cr-hepb平臺的乙肝研究路徑生成方法,其特征在于,所述基于知識圖譜對所述多維度領域數據進行整合,得到整合數據,包括:
5.根據權利要求4所述的基于cr-hepb平臺的乙肝研究路徑生成方法,其特征在于,所述對所述整合數據進行預處理,得到多源輸入數據,包括:
6.根據權利要求1所述的基于cr-hepb平臺的乙肝研究路徑生成方法,其特征在于,所述訓練好的qwen2模型是通過下述方法訓練得到:
7.根據權利要求6所述的基于cr-hepb平臺的乙肝研究路徑生成方法,其特征在于,所述權重的計算公式為:
8.一種基于cr-hepb平臺的乙肝研究路徑生成裝置,其特征在于,包括:
9.一種電子設備,其特征在于,包括:處理器,存儲器及存儲在所述存儲器上并可在所述處理器上運行的程序或指令,所述程序或指令被所述處理器執行時實現如權利要求1-7任一項所述的基于cr-hepb平臺的乙肝研究路徑生成方法的步驟。
10.一種可讀存儲介質,其特征在于,所述可讀存儲介質上存儲程序或指令,所述程序或指令被處理器執行時實現如權利要求1-7任一項所述的基于cr-hepb平臺的乙肝研究路徑生成方法的步驟。