麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

基于多源生物信息和圖神經網絡的藥物重定位方法

文檔序號:41766626發布日期:2025-04-29 18:36閱讀:5來源:國知局
基于多源生物信息和圖神經網絡的藥物重定位方法

本發明涉及藥物重定位的,具體而言,涉及到基于多源生物信息和圖神經網絡的藥物重定位技術。


背景技術:

1、藥物重定位是一種創新的藥物開發策略,旨在發現現有藥物的新用途。這一過程顯著縮短了藥物開發周期,并降低了開發成本,研究表明,藥物重定位可節省高達85%的新藥開發費用,同時為制藥行業的年度收入貢獻了25%。隨著臨床案例的增加,如沙利度胺在麻風并發癥和多發性骨髓瘤治療中的成功應用,藥物重定位的臨床價值愈發突出。通過利用現有藥物的安全性和有效性,藥物重定位不僅提高了新的治療選擇的成功率,還為應對突發公共衛生事件,如covid-19疫情,提供了有效的應對方案,許多候選藥物快速進入臨床試驗階段。

2、盡管藥物重定位的研究取得了顯著進展,但在技術層面仍面臨諸多挑戰。當前,計算方法多分為機器學習和深度學習兩大類,機器學習模型依賴于大量高質量數據,并在特征選擇和處理上需大量人工干預,限制了其應用效果。此外,許多現有模型關注于局部特征的提取,未能全面反映藥物與疾病之間的復雜相互作用。深度學習模型雖然展現了更強的特征學習能力,但仍受到數據噪聲和特征學習局限性的影響。這些問題導致在藥物重定位的預測性能和泛化能力上存在不足。


技術實現思路

1、針對現有技術存在的缺陷,本發明提供了一種基于多源生物信息和圖神經網絡的藥物重定位方法。

2、為實現上述目的,本發明采用了如下技術方案:

3、本發明是基于多源生物信息和圖神經網絡的藥物重定位方法,包括以下步驟:

4、s1、數據處理階段:構造關系網絡,關系網絡涵蓋了三種不同的關系,分別為藥物與疾病之間的關聯關系、藥物與藥物之間的相似性關系以及疾病與疾病之間的相似性關系。

5、s2、信息聚合階段:根據步驟1構造的關系網絡,通過圖卷積操作分別得到藥物和疾病第一特征,通過殘差學習機制得到藥物和疾病第二特征,分別將藥物和疾病的第一、第二特征進行融合得到第三特征,同時放入多頭注意力機制進行處理得到第四特征。

6、s3、預測階段:將步驟2構造的藥物第四特征與疾病第四特征進行相乘,并使用點積解碼器,獲取藥物與疾病之間的關聯關系預測,對藥物進行重定位。

7、s4、方法性能評估:利用十折交叉驗證來全面評估所提方法的性能,具體評價指標包括accuracy(acc)、precision(pre)、recall(recall)、f1-score(f1)、auc和aupr,并與經典模型進行對比分析。

8、進一步的,所述步驟s1的具體子步驟如下:

9、s1-1、數據收集:藥物數據來自于drugbank數據庫,使用藥物的smiles序列,以獲取藥物的化學結構信息。疾病數據主要來自于omim數據庫,使用疾病的臨床表現與表型信息。二者之間的關聯關系來自于ctd數據庫。

10、s1-2、相似性計算:使用rdkit工具獲得藥物指紋相似性,得到藥物相似性矩陣,矩陣大小為rx×x,x代表藥物的總數。使用minminer工具計算疾病表型相似性,得到疾病相似性矩陣,矩陣大小為ry×y,y代表疾病的總數。由于需要對單一矩陣進行補全,引入高斯相互作用譜核相似性(gip)。

11、s1-3、相似性融合:為了解決藥物和疾病單一相似性矩陣過于稀疏的問題,將藥物的smiles序列相似性和gip相似性進行了融合。根據相似性矩陣每兩個節點之間的相似性,設置一個閾值,高于該閾值的代表有關聯,低于該閾值的代表沒關聯,由此構造關系網絡。

12、進一步的,所述步驟s2的具體子步驟如下:

13、s2-1、特征學習:首先,通過卷積操作處理步驟1-3得到的三種關系網絡,聚合每個節點的鄰居特征,以利用圖的拓撲結構增強節點表示能力。在特征更新過程中,不僅考慮鄰居節點信息,還引入自連接,以確保每個節點在特征傳播時保留自身特征。結合可學習的參數矩陣,最終得到藥物和疾病的第一特征。

14、s2-2、提升預測穩定性:引入深度殘差網絡的短路鏈接和殘差學習機制,得到藥物和疾病的第二特征。殘差學習機制有效捕捉了第一特征節點之間的復雜非線性關系,而多層特征提取能力顯著減少了高維稀疏數據處理中的信息損失,緩解了梯度消失和爆炸的風險,從而確保預測結果的穩定性和一致性。

15、s2-3、優化節點信息聚合:首先,將第一特征和第二特征等比例融合以得到第三特征。接著,通過線性變換將第三特征映射到新的表示空間,并使用激活函數leakrelu處理這些表示。通過可學習的參數向量計算注意力系數,以確定每個鄰居節點的權重。根據這些權重,對鄰居節點的特征進行加權求和,最終得到每個頭的輸出。最后,將所有頭的輸出通過連接或平均方式整合,得到藥物和疾病的第四特征表示。

16、進一步的,所述步驟s3的具體子步驟如下:

17、s3-1、關聯預測概率:將步驟2-3構造的藥物第四特征矩陣與疾病第四特征矩陣進行相乘,并使用點積解碼器,獲取藥物與疾病之間的預測概率y′ij。

18、s3-2、損失函數:本方法利用加權交叉熵損失函數l來量化預測值與真實標簽之間的差距。

19、進一步的,所述步驟s4的具體子步驟如下:

20、s4-1、特征導向下采樣:為有效解決數據分布不平衡導致的評估偏差,本發明采用特征導向下采樣的十折交叉驗證策略全面評估模型性能。具體而言,隨機選擇十倍于正樣本數量的負樣本,與正樣本結合形成小型數據集,然后將其劃分為十個互斥子集。在每次迭代中,使用九個子集作為訓練集,剩下一個子集作為驗證集,循環十次以獲得平均結果。

21、s4-2、評價指標:具體評價指標包括auc(roc產生的曲線下面積占總面積的百分比)、aupr(pr曲線下面積占總面積的百分比)、f1分數通過對整個樣本中的每個預測答案進行計數,能夠指示模型的性能,計算為:其中pre是樣本的精度,代表模型所有預測結果正確的百分比,計算為rec是樣本的回歸值,表示模型正確識別了所有標準標簽答案中的多少個,計算為acc準確率是常用的評估指標之一,計算為其中tp,tn,fp和fn分別表示真陽性率,真陰性率、假陽性率和假陰性率。

22、s4-3、案例研究:本方法對所有的藥物-疾病樣本設置為未知,然后利用此方法生成了阿爾茲海默癥、乳腺癌這兩種常見特定臨床表現的關聯評分,在生成的預測結果中,按降序對這些分數進行排序,并根據pubmed的文獻證明了這些藥物大部分都與疾病相關。

23、s4-4、分子對接:本方法針對阿爾茨海默病進行了分子對接實驗,以評估候選藥物與相關靶蛋白的相互作用。選擇了五個與阿爾茨海默病相關的靶蛋白,并利用autodockvina軟件進行分子對接分析,計算這些靶蛋白與前十名預測的潛在藥物之間的結合能。結果顯示,奧卡西平、利培酮和托卡普酮表現出較高的結合能值,表明它們與靶蛋白具有顯著的結合能力。

24、與現有技術相比,本發明具有以下有益效果:

25、1、雙圖特征提取:本發明利用雙圖編碼器從同質和異質網絡中提取特征,捕捉鄰居和全局嵌入,促進了對藥物和疾病相關的注意力感知表示的全面深入研究。

26、2、融合更多樣本信息:創新性地引入了一種“特征導向下采樣方法”來構建訓練和測試數據集,并結合加權交叉熵損失函數,以更全面地捕捉樣本特征。

27、3、殘差加速:本方法利用深度殘差神經網絡加速模型收斂,緩解梯度爆炸和梯度消失的風險,同時增強模型的預測性能。

28、4、可以更好地指導生物實驗和藥物研發:針對特定疾病的案例分析以及分子對接實驗表明,本方法不僅能夠揭示藥物與疾病之間的潛在關系,還能深入探討藥物的作用機制和毒性,這為新藥的臨床測試提供了更為重要的依據和參考。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 清流县| 平武县| 枝江市| 富宁县| 易门县| 抚州市| 玉龙| 九江县| 高阳县| 滁州市| 仙游县| 浏阳市| 永川市| 五峰| 武威市| 杭锦后旗| 噶尔县| 赣州市| 兴文县| 黄梅县| 德州市| 盐城市| 新安县| 张家界市| 会昌县| 尉犁县| 镇赉县| 两当县| 新闻| 措美县| 乌兰县| 黑山县| 昌邑市| 秦安县| 沁源县| 伊川县| 连南| 五华县| 马龙县| 麟游县| 林芝县|