本發明涉及腫瘤檢測領域,特別涉及一種基于多模態的腔面型乳腺癌患者復發風險的預測裝置。
背景技術:
1、激素受體陽性(hr+)/人類表皮生長因子受體2陰性(her2,human?epidermalgrowth?factor?receptor?2)乳腺癌(又稱腔面型乳腺癌)是乳腺癌的主要亞型,其具有持續的復發風險,高達20%的腔面型乳腺癌患者會因標準內分泌治療抵抗機制而出現復發轉移;而生物標志物的發現、多組學技術和預后預測模型等方面的進步使得預測腫瘤治療耐藥性和復發風險成為可能。目前已有多種多基因檢測工具,提供了將患者分為低危和高危兩組的分級分類策略,并有助于識別可能從化療獲益的早期腔面型乳腺癌患者。
2、然而,現有的預測技術仍然存在一些問題和不足之處:目前預測腔面型乳腺癌預后的多基因表達檢測工具不能充分反應腫瘤的復雜生物學行為,適應人群也較為有限。既往檢測工具多只適用于乳腺癌早期病人,如oncotype?dx適用于i、ii或iiia期,淋巴結轉移陰性的新確診乳腺癌患者或絕經后、淋巴結陽性的浸潤型乳腺癌患者。mammaprint適用于淋巴結陰性或1-3枚陽性的早期乳腺癌患者。較窄的適用人群范圍限制了其臨床應用,如在預測淋巴結陽性腔面型乳腺癌患者預后時,其一致性指數(c-index,是一種常用于生存分析中的指標,用來評估模型在排序預測方面的準確性)僅為0.56到0.63,存在明顯的缺陷和不足。
3、為此,需要一種新的基于多模態的腔面型乳腺癌患者復發風險的預測裝置。
技術實現思路
1、根據本發明的一方面,提供了一種基于多模態的腔面型乳腺癌患者復發風險的預測裝置,所述裝置中包括預先訓練的一個或多個多模態模型,裝置適于:響應于接收到待預測患者的多模態信息,從一個或多個多模態模型中確定要使用的目標多模態模型;根據所述目標多模態模型在訓練時采用的訓練特征集從多模態信息中獲取預測特征集;將所述預測特征集輸入所述目標多模態模型,確定所述待預測患者的復發風險評分。
2、可選地,根據本發明的裝置中,多模態信息包括臨床信息,免疫組化信息,代謝組數據,病理組數據,轉錄組數據,基因組數據和拷貝數變異數據中的多個模態的信息。
3、可選地,根據本發明的裝置中,基于多模態的腔面型乳腺癌患者復發風險的預測裝置中預先訓練的多模態模型包括全模態模型,所述全模態模型的第一訓練特征集的確定步驟包括:對每個模態的特征進行組合,得到每個模態的特征對,所述特征對包括該模態的2個特征;對所述特征對的特征之間計算相關性系數;對相關性系數大于預設閾值的第一特征對中的特征計算單因素cox評分;將所述第一特征對中單因素cox評分最高的特征添加到該模態的篩選特征集,并將相關性系數小于預設閾值的第二特征對中的特征添加到該模態的篩選特征集;對每個篩選特征集中的特征計算單因素cox評分;對代謝組數據,病理組數據,轉錄組數據,基因組數據和拷貝數變異數據的篩選特征集進行合并,從其中確定第一預設數目個單因素cox評分最高的特征添加到所述全模態模型的第一訓練特征集,并將所述臨床信息和免疫組化信息中的所有特征添加到所述第一訓練特征集。
4、可選地,根據本發明的裝置中,基于多模態的腔面型乳腺癌患者復發風險的預測裝置中預先訓練的多模態模型還包括簡化模型,所述簡化模型的第二訓練特征集的確定步驟包括:確定所述第一訓練特征集中的每個特征的特征重要性評分;從第一訓練特征集的代謝組數據、轉錄組數據、基因組數據和拷貝數變異數據中分別確定第二預設數目個特征重要性評分最高的特征,添加到第二訓練特征集中,并將所述第二訓練特征集中臨床信息、免疫組化信息和病理組數據的所有特征添加到所述第二訓練特征集。
5、可選地,根據本發明的裝置中,確定所述第一訓練特征集中的每個特征的特征重要性評分包括:確定要計算特征重要性評分的目標特征,將所述目標特征從所述第一訓練特征集中取出,得到缺少目標特征的第一訓練特征集;根據所述缺少目標特征的第一訓練特征集構建缺少目標特征的全模態模型;計算所述全模態模型的第一一致性指數和缺少目標特征的全模態模型的第二一致性指數;將第二一致性指數與所述第一一致性指數的差值作為所述目標特診的特征重要性得分。
6、可選地,根據本發明的裝置中,多模態模型的訓練步驟包括:確定每個第一測試模型的訓練集特征,所述第一測試模型的訓練集特征包括一個或多個模態的特征;將每個第一測試模型的訓練集特征輸入cox比例風險模型、生存支持向量機模型、隨機生存森林模型、deepsurv非線性模型和梯度提升生存模型進行訓練,得到多個第二測試模型;對每個第二測試模型計算平均交叉驗證一致性指數,確定一個或多個平均交叉驗證一致性指數最大的第二測試模型作為所述裝置中訓練的一個或多個多模態模型。
7、可選地,根據本發明的裝置中,將每個第一測試模型的訓練集特征輸入cox比例風險模型、生存支持向量機模型、隨機生存森林模型、deepsurv非線性模型和梯度提升生存模型進行訓練,得到多個第二測試模型包括:將每個第一測試模型的訓練集特征輸入cox比例風險模型、生存支持向量機模型、隨機生存森林模型、deepsurv非線性模型和梯度提升生存模型,采用5折交叉驗證搜索確定模型超參數,使每個第二測試模型的平均交叉驗證一致性指數最大化。
8、可選地,根據本發明的裝置,還適于:根據所述待預測患者的復發風險評分對待預測患者進行分組,所述待預測患者的組別包括低分險組和高風險組
9、可選地,根據本發明的裝置,還適于:根據對所述多模態模型進行訓練的訓練集確定每個訓練樣本的復發風險評分;根據所述每個訓練樣本的復發風險評分確定復發風險評分閾值;若所述待預測患者的復發風險評分大于所述復發風險評分閾值,則所述患者的組別為高風險組;若所述待預測患者的復發風險評分小于所述復發風險評分閾值,則所述患者的組別為低風險組。
10、根據本發明的另一方面,提供了一種計算設備,包括:一個或多個處理器;存儲器;以及一種基于多模態的腔面型乳腺癌患者復發風險的預測裝置。
11、根據本發明的再一方面,提供了一種存儲一個或多個程序的計算機可讀存儲介質,一個或多個程序包括指令,該指令當由計算設備執行時,使得計算設備執行根據本發明的基于多模態的腔面型乳腺癌患者復發風險的預測裝置中所執行的方法。
12、本發明的多模態的腔面型乳腺癌患者復發風險的預測裝置通過整合多模態信息,結合機器學習的方法對患者確定復發風險評分,實現腔面型乳腺癌患者復發風險的預測,從而預測患者預后,提高預測的準確性和預測效率,采用多模態特征使預測裝置能夠適用更大范圍的患者,輔助臨床治療。
1.一種基于多模態的腔面型乳腺癌患者復發風險的預測裝置,所述裝置中包括預先訓練的一個或多個多模態模型,所述裝置適于:
2.如權利要求1所述的裝置,其中,所述多模態信息包括臨床信息,免疫組化信息,代謝組數據,病理組數據,轉錄組數據,基因組數據和拷貝數變異數據中的多個模態的信息。
3.如權利要求2所述的裝置,其中,所述基于多模態的腔面型乳腺癌患者復發風險的預測裝置中預先訓練的多模態模型包括全模態模型,所述全模態模型的第一訓練特征集的確定步驟包括:
4.如權利要求3所述的裝置,其中,所述基于多模態的腔面型乳腺癌患者復發風險的預測裝置中預先訓練的多模態模型還包括簡化模型,所述簡化模型的第二訓練特征集的確定步驟包括:
5.如權利要求4所述的裝置,其中,所述確定所述第一訓練特征集中的每個特征的特征重要性評分包括:
6.如權利要求1所述的裝置,其中,所述多模態模型的訓練步驟包括:
7.如權利要求6所述的裝置,其中,所述將每個第一測試模型的訓練集特征輸入cox比例風險模型、生存支持向量機模型、隨機生存森林模型、deepsurv非線性模型和梯度提升生存模型進行訓練,得到多個第二測試模型包括:
8.如權利要求1所述的裝置,還適于:
9.如權利要求8所述的裝置,還適于:
10.一種計算設備,包括:
11.一種存儲一個或多個程序的計算機可讀存儲介質,所述一個或多個程序包括指令,所述指令當由計算設備執行時,使得所述計算設備執行根據權利要求1至9所述的一種多癌輔助確定裝置中所執行的方法。