本發(fā)明涉及智能醫(yī)療領(lǐng)域,更具體地,涉及一種反映免疫治療反應(yīng)程度模型的構(gòu)建方法、設(shè)備、介質(zhì)和程序產(chǎn)品。
背景技術(shù):
1、近年來,免疫檢查點(diǎn)抑制劑(icis)大幅提高了癌癥患者的生存率。ici已用于治療多種癌癥,例如黑色素瘤,乳腺癌和食管鱗狀細(xì)胞。這些抑制劑可以增強(qiáng)患者的免疫系統(tǒng),使其能夠有效識別和攻擊癌細(xì)胞。然而,60%至80%的治療患者對免疫療法沒有表現(xiàn)出良好的反應(yīng)。這就使得迫切需要發(fā)現(xiàn)高度敏感和特異性的生物標(biāo)志物,且該生物標(biāo)志物可以在治療前預(yù)測反應(yīng)或促進(jìn)聯(lián)合療法的開發(fā)以克服對ici的耐藥性。
2、目前ici反應(yīng)的預(yù)測生物標(biāo)志物,例如程序性細(xì)胞死亡配體1(pd-l1)表達(dá),已經(jīng)過臨床驗(yàn)證,但不夠穩(wěn)健。由于這一限制,研究人員越來越關(guān)注基因組,這些基因組在預(yù)測ici反應(yīng)方面表現(xiàn)出更大的穩(wěn)健性和準(zhǔn)確性。例如,泛癌干性特征已成功用于預(yù)測多種癌癥類型對免疫治療的反應(yīng);也有利用多種生物途徑的表達(dá)水平作為生物標(biāo)志物,結(jié)合邏輯回歸模型來預(yù)測ici反應(yīng)。同樣也有研究人員證明了14種信號通路活性對ici的強(qiáng)大預(yù)測能力。然而,預(yù)測性能仍然有限,需要進(jìn)一步探索其他基因集以增強(qiáng)ici反應(yīng)的預(yù)測。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一。為此,本發(fā)明提供一種反映免疫治療反應(yīng)程度模型的構(gòu)建方法、設(shè)備、介質(zhì)和程序產(chǎn)品;本發(fā)明方法通過提出一種基于hallmark基因集精煉的預(yù)測免疫治療反應(yīng)的方法,即hapir,并利用多個(gè)隊(duì)列進(jìn)行驗(yàn)證得出hapir是預(yù)測ici反應(yīng)和指導(dǎo)新免疫治療策略開發(fā)的有效工具。
2、本申請第一方面公開一種反映免疫治療反應(yīng)程度模型的構(gòu)建方法,所述方法包括:
3、s101,獲取訓(xùn)練集樣本的轉(zhuǎn)錄組數(shù)據(jù)集和臨床分類信息;臨床分類信息包括敏感和耐藥;
4、s102,對所述轉(zhuǎn)錄組數(shù)據(jù)集進(jìn)行差異表達(dá)分析得到n個(gè)差異表達(dá)基因;
5、s103,基于所述差異表達(dá)基因進(jìn)行基因集富集分析,識別m個(gè)顯著富集的hallmark基因集;
6、s104,分別取單個(gè)hallmark基因集與所述差異表達(dá)基因的交集,得到m個(gè)精煉hallmark基因集;分別計(jì)算單個(gè)精煉hallmark基因集的活性值;
7、s105,將所述活性值輸入機(jī)器學(xué)習(xí)模型,得到預(yù)測分類結(jié)果,與臨床分類信息進(jìn)行比對,根據(jù)比對結(jié)果優(yōu)化模型,構(gòu)建反映免疫治療反應(yīng)程度模型。
8、在一些實(shí)施例中,所述活性值的計(jì)算方法包括:計(jì)算所述精煉hallmark基因集內(nèi)每個(gè)基因的表達(dá)量,根據(jù)其在基因集中的重要性進(jìn)行加權(quán);將基因集內(nèi)所有基因的加權(quán)表達(dá)量求和,得到對應(yīng)精煉hallmark基因集的活性值。
9、在一些實(shí)施例中,所述訓(xùn)練集樣本包括免疫治療敏感樣本和耐藥樣本;所述差異表達(dá)基因包括顯著上調(diào)和下調(diào)的差異表達(dá)基因。
10、在一些實(shí)施例中,所述機(jī)器學(xué)習(xí)模型使用的方法包括以下任一種或幾種:glm函數(shù)、lm函數(shù)、nls函數(shù)、glmnet函數(shù)、coxph函數(shù)、mgcv函數(shù)、randomforest函數(shù)、gbm函數(shù)、xgboost函數(shù)、neuralnet函數(shù)。
11、本申請第二方面公開一種基于hapir預(yù)測耐藥概率的方法,所述方法包括:
12、s201,獲取受試的轉(zhuǎn)錄組數(shù)據(jù);
13、s202,將所述轉(zhuǎn)錄組數(shù)據(jù)輸入本申請第一方面所述的反映免疫治療反應(yīng)程度模型中,輸出受試耐藥概率高或低的結(jié)果。
14、在一些實(shí)施例中,所述方法還包括:如果輸出耐藥概率高的結(jié)果,得到受試生存期較短的輔助預(yù)測結(jié)果;如果輸出耐藥概率低的結(jié)果,得到受試生存期較長的輔助預(yù)測結(jié)果。
15、本申請第三方面公開一種基于hapir預(yù)測耐藥概率的方法,所述方法包括:
16、s301,獲取受試的轉(zhuǎn)錄組數(shù)據(jù);所述轉(zhuǎn)錄組數(shù)據(jù)包括以下任一種或幾種基因:s100a1、tyr、serpine2、sgcd、phlda1;
17、s302,將所述轉(zhuǎn)錄組數(shù)據(jù)輸入本申請第一方面所述的反映免疫治療反應(yīng)程度模型中,輸出受試耐藥概率高或低的結(jié)果。
18、本申請第四方面公開一種計(jì)算機(jī)設(shè)備,所述設(shè)備包括:存儲器和處理器;所述存儲器用于存儲計(jì)算機(jī)程序;所述處理器執(zhí)行所述計(jì)算機(jī)程序以實(shí)現(xiàn)上述方法的步驟。
19、本申請第五方面公開一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的方法的步驟。
20、本申請第六方面公開一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的方法的步驟。
21、本申請具有以下有益效果:
22、1、本申請創(chuàng)新性的提出了一種基于hallmark基因集的改進(jìn)的預(yù)測免疫治療反應(yīng)的方法?(hapir)。我們首先提煉了七個(gè)?hallmark基因集,其中富含有反應(yīng)者和無反應(yīng)患者之間差異表達(dá)的基因。然后,根據(jù)七個(gè)基因集的活性訓(xùn)練機(jī)器學(xué)習(xí)模型。因此,hapir的表現(xiàn)優(yōu)于13種現(xiàn)有的ici反應(yīng)預(yù)測生物標(biāo)志物,包括基于pd-1和pd-l1的生物標(biāo)志物。此外,與基于基因的模型和其他基于基因集的模型相比,hapir還顯示出更高的準(zhǔn)確性。多種癌癥類型隊(duì)列的驗(yàn)證證實(shí)了其穩(wěn)健性以及與患者生存的顯著相關(guān)性。
23、2、本申請創(chuàng)新性的公開一種反映免疫治療反應(yīng)程度模型的構(gòu)建方法,以及利用該模型預(yù)測耐藥概率的方法,模型構(gòu)建過程中通過獲取對免疫治療敏感樣本和耐藥樣本的轉(zhuǎn)錄組數(shù)據(jù),先分析差異表達(dá)基因,再通過引入hallmark基因集,提煉出包含差異表達(dá)基因的7個(gè)精煉hallmark基因集,計(jì)算7個(gè)精煉hallmark基因集的活性值,利用算法對活性值和樣本對應(yīng)的敏感或耐藥的臨床分類信息機(jī)械能處理,構(gòu)建hapir模型。
24、3、本申請發(fā)現(xiàn)了能夠準(zhǔn)確預(yù)測耐藥概率的基因集,根據(jù)該基因集可以更準(zhǔn)確高效地預(yù)測患者的耐藥概率高低,具有很好的應(yīng)用前景。
1.一種反映免疫治療反應(yīng)程度模型的構(gòu)建方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的反映免疫治療反應(yīng)程度模型的構(gòu)建方法,其特征在于,所述活性值的計(jì)算方法包括:計(jì)算所述精煉hallmark基因集內(nèi)每個(gè)基因的表達(dá)量,根據(jù)其在基因集中的重要性進(jìn)行加權(quán);將基因集內(nèi)所有基因的加權(quán)表達(dá)量求和,得到對應(yīng)精煉hallmark基因集的活性值。
3.根據(jù)權(quán)利要求1所述的反映免疫治療反應(yīng)程度模型的構(gòu)建方法,其特征在于,所述訓(xùn)練集樣本包括免疫治療敏感樣本和耐藥樣本;所述差異表達(dá)基因包括顯著上調(diào)和下調(diào)的差異表達(dá)基因。
4.根據(jù)權(quán)利要求1所述的反映免疫治療反應(yīng)程度模型的構(gòu)建方法,其特征在于,所述機(jī)器學(xué)習(xí)模型使用的方法包括以下任一種或幾種:glm函數(shù)、lm函數(shù)、nls函數(shù)、glmnet函數(shù)、coxph函數(shù)、mgcv函數(shù)、randomforest函數(shù)、gbm函數(shù)、xgboost函數(shù)、neuralnet函數(shù)。
5.基于hapir預(yù)測耐藥概率的方法,其特征在于,所述方法包括:
6.根據(jù)權(quán)利要求5所述的基于hapir預(yù)測耐藥概率的方法,其特征在于,所述方法還包括:如果輸出耐藥概率高的結(jié)果,得到受試生存期較短的輔助預(yù)測結(jié)果;如果輸出耐藥概率低的結(jié)果,得到受試生存期較長的輔助預(yù)測結(jié)果。
7.基于hapir預(yù)測耐藥概率的方法,其特征在于,所述方法包括:
8.一種計(jì)算機(jī)設(shè)備,其特征在于,所述設(shè)備包括:存儲器和處理器;所述存儲器用于存儲計(jì)算機(jī)程序;所述處理器執(zhí)行所述計(jì)算機(jī)程序以實(shí)現(xiàn)權(quán)利要求1-7任一項(xiàng)所述的方法的步驟。
9.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,其上存儲有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7任意一項(xiàng)所述的方法的步驟。
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7任意一項(xiàng)所述的方法的步驟。