麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種單細胞藥物反應(yīng)預(yù)測模型的訓(xùn)練方法及裝置

文檔序號:41750498發(fā)布日期:2025-04-25 17:42閱讀:6來源:國知局
一種單細胞藥物反應(yīng)預(yù)測模型的訓(xùn)練方法及裝置

本發(fā)明屬于生物醫(yī)藥和數(shù)據(jù)處理交叉,尤其涉及一種單細胞藥物反應(yīng)預(yù)測模型的訓(xùn)練方法及裝置。


背景技術(shù):

1、在當(dāng)前的癌癥研究中,總rna測序(bulk?rna?sequencing,bulk?rna-seq)和單細胞rna測序(single-cell?rna?sequencing,scrna-seq)被廣泛應(yīng)用于理解腫瘤生物學(xué),scrna-seq能夠量化單個細胞的基因表達,而bulk?rna-seq則提供了細胞群體的混合轉(zhuǎn)錄組數(shù)據(jù)。對單細胞藥物敏感性的推斷有助于深入理解抗癌反應(yīng)的異質(zhì)性及耐藥機制,當(dāng)前針對單細胞藥物反應(yīng)預(yù)測的研究方法主要有以下幾種:

2、(1)生物標志物/簽名基礎(chǔ)方法(biomarker-or?signature-basedmethods)通常通過從bulk?rna-seq數(shù)據(jù)中識別與藥物反應(yīng)相關(guān)的基因或基因簽名,并將其應(yīng)用于scrna-seq數(shù)據(jù)進行預(yù)測,然而,該類方法依賴于bulk?rna-seq數(shù)據(jù)進行標志物發(fā)現(xiàn),這使得它們無法捕捉單細胞層面的復(fù)雜性和細胞間的異質(zhì)性,限制了預(yù)測的準確性和適用范圍,同時,由于單細胞中的基因表達水平低且存在隨機的掉失(dropout)現(xiàn)象,基于預(yù)定義基因集的預(yù)測能力往往受到限制,導(dǎo)致預(yù)測結(jié)果的不可靠性,另外,大多數(shù)基于生物標志物的預(yù)測方法只能針對特定藥物或疾病重新定義和驗證標志物,這使得它們在不同藥物或疾病條件下的泛化能力較弱;

3、(2)傳統(tǒng)機器學(xué)習(xí)方法(machine?learningmethods)在藥物發(fā)現(xiàn)領(lǐng)域有著豐富的歷史,它們通常用于整合各種基因組空間,包括藥物-基因相互作用、疾病-基因相互作用和基因-基因相互作用,但是,大部分傳統(tǒng)機器學(xué)習(xí)方法處理和學(xué)習(xí)大規(guī)模的scrna-seq數(shù)據(jù)效率很低,對大規(guī)模數(shù)據(jù)的處理能力有限,同時,傳統(tǒng)機器學(xué)習(xí)方法不擅長捕捉數(shù)據(jù)中的復(fù)雜和非線性關(guān)系,另外,傳統(tǒng)機器學(xué)習(xí)方法可能需要更多的手動特征選擇和模型結(jié)構(gòu)優(yōu)化,而通過端到端的訓(xùn)練自動完成這些任務(wù)更方便,但傳統(tǒng)機器學(xué)習(xí)方法無法做到;

4、(3)神經(jīng)網(wǎng)絡(luò)/深度學(xué)習(xí)方法(neural?network/dlmethods)利用深度學(xué)習(xí)技術(shù)處理大量的scrna-seq數(shù)據(jù),學(xué)習(xí)復(fù)雜的數(shù)據(jù)關(guān)系,發(fā)現(xiàn)潛在特征,并提供細粒度的細胞藥物敏感性標簽,但是這個領(lǐng)域的許多方法存在以下一些缺點:

5、a.在面對不同數(shù)據(jù)分布時泛化能力不足:傳統(tǒng)的深度學(xué)習(xí)方法可能在源域(例如,bulk?rna-seq數(shù)據(jù))上表現(xiàn)良好,但直接應(yīng)用于目標域(例如,scrna-seq數(shù)據(jù))時,由于數(shù)據(jù)分布的差異,性能可能會下降;

6、b.許多深度學(xué)習(xí)方法未能充分利用bulk?rna-seq數(shù)據(jù)中的信息來提高對單細胞數(shù)據(jù)的預(yù)測能力;

7、c.一些深度學(xué)習(xí)方法通常需要大量的標記數(shù)據(jù)來訓(xùn)練模型,但在單細胞藥物反應(yīng)領(lǐng)域,這樣的數(shù)據(jù)往往是稀缺的;

8、d.一些深度學(xué)習(xí)方法可能無法有效處理單細胞數(shù)據(jù)中的異質(zhì)性,尤其是當(dāng)數(shù)據(jù)來自不同的技術(shù)平臺或生物學(xué)條件時。

9、綜上所述,由于現(xiàn)有針對單細胞藥物反應(yīng)預(yù)測的技術(shù)存在批次效應(yīng)問題:來自不同實驗批次或平臺的數(shù)據(jù)往往存在批次效應(yīng),導(dǎo)致細胞間關(guān)系的失真,從而影響藥物反應(yīng)預(yù)測的準確性;細胞間關(guān)系忽視問題:傳統(tǒng)方法通常忽視細胞間的關(guān)系,往往僅依賴于基因表達數(shù)據(jù)進行分析,未能有效捕捉細胞之間的相互作用,導(dǎo)致對藥物反應(yīng)的預(yù)測不夠精準;跨領(lǐng)域適應(yīng)性差問題:現(xiàn)有方法多基于特定數(shù)據(jù)集(如scrna-seq或bulkrna-seq),無法有效應(yīng)對來自不同數(shù)據(jù)源或領(lǐng)域的數(shù)據(jù),尤其是跨平臺或跨實驗條件下的性能下降,因此,亟需一種新的單細胞藥物反應(yīng)預(yù)測方法以解決上述問題。


技術(shù)實現(xiàn)思路

1、本發(fā)明的目的在于提供一種單細胞藥物反應(yīng)預(yù)測模型的訓(xùn)練方法、裝置、設(shè)備及存儲介質(zhì),旨在解決由于現(xiàn)有技術(shù)導(dǎo)致在單細胞藥物反應(yīng)預(yù)測中跨領(lǐng)域適應(yīng)性差、批次效應(yīng)干擾大、預(yù)測精度差的問題。

2、一方面,本發(fā)明提供了一種單細胞藥物反應(yīng)預(yù)測模型的訓(xùn)練方法,所述方法包括下述步驟:

3、基于無監(jiān)督領(lǐng)域自適應(yīng)和圖轉(zhuǎn)換器,構(gòu)建單細胞藥物反應(yīng)預(yù)測模型的訓(xùn)練用模型;

4、采用預(yù)設(shè)的數(shù)據(jù)預(yù)處理策略對源域數(shù)據(jù)集和目標域數(shù)據(jù)集分別進行預(yù)處理,得到源鄰接矩陣和目標鄰接矩陣;

5、基于所述源鄰接矩陣和所述目標鄰接矩陣,對所述訓(xùn)練用模型進行訓(xùn)練,直至所述訓(xùn)練用模型的目標損失函數(shù)收斂,根據(jù)訓(xùn)練完成后的所述訓(xùn)練用模型,得到所述單細胞藥物反應(yīng)預(yù)測模型。

6、優(yōu)選地,采用預(yù)設(shè)的數(shù)據(jù)預(yù)處理策略對源域數(shù)據(jù)集和目標域數(shù)據(jù)集分別進行預(yù)處理,得到源鄰接矩陣和目標鄰接矩陣的步驟,包括:

7、采用預(yù)設(shè)的源數(shù)據(jù)預(yù)處理策略對所述源域數(shù)據(jù)集進行預(yù)處理,得到源特征矩陣;

8、采用預(yù)設(shè)的目標數(shù)據(jù)預(yù)處理策略對所述目標域數(shù)據(jù)集進行預(yù)處理,得到目標特征矩陣;

9、對所述源特征矩陣和所述目標特征矩陣均采用k-最近鄰算法計算特征之間的相似性,基于所述相似性得到對應(yīng)的所述源鄰接矩陣和所述目標鄰接矩陣。

10、優(yōu)選地,所述訓(xùn)練用模型的模型結(jié)構(gòu)包括第一模塊、第二模塊、共享編碼器、領(lǐng)域判別器及節(jié)點分類器,其中,所述第一模塊和所述第二模塊均為圖變分自編碼器架構(gòu),所述第一模塊用于對所述源鄰接矩陣進行編解碼處理,所述第二模塊用于對所述目標鄰接矩陣進行編解碼處理,所述共享編碼器用于提取所述源域數(shù)據(jù)集與所述目標域數(shù)據(jù)集之間的共享特征,所述領(lǐng)域判別器用于指導(dǎo)所述共享編碼器學(xué)習(xí)到領(lǐng)域不變的特征,所述節(jié)點分類器用于使用所述源域數(shù)據(jù)集的標簽信息來指導(dǎo)所述目標域數(shù)據(jù)集的節(jié)點分類。

11、優(yōu)選地,基于無監(jiān)督領(lǐng)域自適應(yīng)和圖轉(zhuǎn)換器,構(gòu)建單細胞藥物反應(yīng)預(yù)測模型的訓(xùn)練用模型的步驟,包括:

12、基于所述模型結(jié)構(gòu),為所述訓(xùn)練用模型構(gòu)建所述目標損失函數(shù),其中,所述目標損失函數(shù)包括分類損失函數(shù)、域分類損失函數(shù)、重構(gòu)損失函數(shù)、差異損失函數(shù)及熵損失函數(shù),以通過所述分類損失函數(shù)確保模型在源域數(shù)據(jù)集上能夠正確預(yù)測節(jié)點的類別、通過所述域分類損失函數(shù)實現(xiàn)源域和目標域的對抗訓(xùn)練、通過所述重構(gòu)損失函數(shù)衡量模型生成的圖結(jié)構(gòu)與原始圖結(jié)構(gòu)之間的差異、通過所述差異損失函數(shù)衡量源域和目標域之間在隱空間表示的差異、通過所述熵損失函數(shù)衡量在目標域上節(jié)點分類器預(yù)測的不確定性。

13、優(yōu)選地,基于所述源鄰接矩陣和所述目標鄰接矩陣,對所述訓(xùn)練用模型進行訓(xùn)練的步驟,包括:

14、基于所述第一模塊中的編碼器生成的第一潛在表示、所述第二模塊中的編碼器生成的第二潛在表示及所述共享編碼器生成的共享特征,確定所述差異損失函數(shù)的差異損失值;

15、基于所述第一模塊中的解碼器生成的源重構(gòu)鄰接矩陣和所述第二模塊中的解碼器生成的目標重構(gòu)鄰接矩陣,確定所述重構(gòu)損失函數(shù)的重構(gòu)損失值;

16、基于所述節(jié)點分類器生成的節(jié)點預(yù)測類別,確定所述分類損失函數(shù)的分類損失值和所述熵損失函數(shù)的熵損失值;

17、基于所述領(lǐng)域判別器生成的域預(yù)測結(jié)果,確定所述域分類損失函數(shù)的域分類損失值;

18、基于所述差異損失值、所述重構(gòu)損失值、所述分類損失值、所述熵損失值及所述域分類損失值,確定所述目標損失函數(shù)的目標損失,以根據(jù)所述目標損失對所述訓(xùn)練用模型的模型參數(shù)進行更新。

19、優(yōu)選地,基于所述第一模塊中的編碼器生成的第一潛在表示、所述第二模塊中的編碼器生成的第二潛在表示及所述共享編碼器生成的共享特征,確定所述差異損失函數(shù)的差異損失值的步驟,包括:

20、通過所述第一模塊中的編碼器對所述源鄰接矩陣進行編碼,得到所述第一潛在表示;

21、通過所述第二模塊中的編碼器對所述目標鄰接矩陣進行編碼,得到所述第二潛在表示;

22、根據(jù)所述源鄰接矩陣和所述目標鄰接矩陣,通過所述共享編碼器提取所述源域數(shù)據(jù)集與所述目標域數(shù)據(jù)集之間的所述共享特征;

23、根據(jù)所述第一潛在表示、所述第二潛在表示及所述共享特征,確定所述差異損失值。

24、另一方面,本發(fā)明提供了一種基于上述任一項訓(xùn)練方法得到的單細胞藥物反應(yīng)預(yù)測模型的單細胞藥物反應(yīng)預(yù)測方法,所述方法包括下述步驟:

25、獲取與待檢測藥物相關(guān)的源域數(shù)據(jù)和目標域數(shù)據(jù),并對所述目標域數(shù)據(jù)進行預(yù)處理;

26、通過所述單細胞藥物反應(yīng)預(yù)測模型的共享編碼器對預(yù)處理后的所述目標域數(shù)據(jù)進行特征提取,得到目標域單細胞特征;

27、根據(jù)所述目標域單細胞特征和所述源域數(shù)據(jù)的標簽信息,通過所述單細胞藥物反應(yīng)預(yù)測模型的節(jié)點分類器對所述目標域數(shù)據(jù)中每個單細胞進行藥物反應(yīng)預(yù)測,得到所述目標域數(shù)據(jù)中每個單細胞對所述待檢測藥物的藥物敏感性預(yù)測結(jié)果。

28、另一方面,本發(fā)明提供了一種單細胞藥物反應(yīng)預(yù)測模型的訓(xùn)練裝置,所述裝置包括:

29、模型構(gòu)建單元,用于基于無監(jiān)督領(lǐng)域自適應(yīng)和圖轉(zhuǎn)換器,構(gòu)建單細胞藥物反應(yīng)預(yù)測模型的訓(xùn)練用模型;

30、數(shù)據(jù)預(yù)處理單元,用于采用預(yù)設(shè)的數(shù)據(jù)預(yù)處理策略對源域數(shù)據(jù)集和目標域數(shù)據(jù)集分別進行預(yù)處理,得到源鄰接矩陣和目標鄰接矩陣;

31、模型訓(xùn)練單元,用于基于所述源鄰接矩陣和所述目標鄰接矩陣,對所述訓(xùn)練用模型進行訓(xùn)練,直至所述訓(xùn)練用模型的目標損失函數(shù)收斂,根據(jù)訓(xùn)練完成后的所述訓(xùn)練用模型,得到所述單細胞藥物反應(yīng)預(yù)測模型。

32、另一方面,本發(fā)明還提供了一種計算設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如上述一種單細胞藥物反應(yīng)預(yù)測模型的訓(xùn)練方法所述的步驟。

33、另一方面,本發(fā)明還提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上述一種單細胞藥物反應(yīng)預(yù)測模型的訓(xùn)練方法所述的步驟。

34、本發(fā)明基于無監(jiān)督領(lǐng)域自適應(yīng)和圖轉(zhuǎn)換器,構(gòu)建單細胞藥物反應(yīng)預(yù)測模型的訓(xùn)練用模型,采用預(yù)設(shè)的數(shù)據(jù)預(yù)處理策略對源域數(shù)據(jù)集和目標域數(shù)據(jù)集分別進行預(yù)處理,得到源鄰接矩陣和目標鄰接矩陣,基于源鄰接矩陣和目標鄰接矩陣,對訓(xùn)練用模型進行訓(xùn)練,直至訓(xùn)練用模型的目標損失函數(shù)收斂,根據(jù)訓(xùn)練完成后的訓(xùn)練用模型,得到單細胞藥物反應(yīng)預(yù)測模型,從而使得模型不僅能減輕批次效應(yīng)的干擾,有效提升跨批次數(shù)據(jù)整合后的預(yù)測精度,還增強了模型的跨領(lǐng)域適應(yīng)能力,能夠靈活應(yīng)對來自不同領(lǐng)域數(shù)據(jù)的差異,保證了在不同實驗條件下的穩(wěn)定性和泛化能力。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 麦盖提县| 金山区| 永靖县| 剑川县| 洛南县| 滦南县| 崇信县| 维西| 安丘市| 湘乡市| 古丈县| 万宁市| 特克斯县| 揭西县| 巩留县| 临潭县| 昭平县| 宁陵县| 汉寿县| 如东县| 扬州市| 广灵县| 三江| 台东县| 陕西省| 津市市| 蓬溪县| 衡山县| 桃园县| 云南省| 澳门| 个旧市| 孙吴县| 呼图壁县| 永康市| 兰考县| 茶陵县| 河北省| 育儿| 和硕县| 澎湖县|