麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種基于KAN網絡的lncRNA-疾病關聯預測方法

文檔序號:41775150發布日期:2025-04-29 18:49閱讀:12來源:國知局
一種基于KAN網絡的lncRNA-疾病關聯預測方法

本發明屬于lncrna與疾病關聯預測,尤其涉及一種基于kan網絡的lncrna-疾病關聯預測方法。


背景技術:

1、lncrna是一類不編碼蛋白質但具有重要調控功能的非編碼rna分子,廣泛參與基因轉錄、表觀遺傳調控和rna互作,它們在癌癥發生、發展及耐藥性中發揮關鍵作用;lncrna還能影響癌癥相關信號通路,并作為生物標志物用于癌癥診斷、預后評估和靶向治療,具有廣闊的應用前景。

2、相關技術中,如linc01608已被實驗確定為肝細胞癌可靠的預后生物標志物;lncrnacta-929c8在腦組織中的過表達可能有助于阿爾茨海默病的發展,因此,準確鑒定疾病相關的lncrna對于疾病的診斷和發病機制的揭示具有重要意義。另外,例如wmflda設計了一種加權矩陣分解方法來推斷疾病相關的lncrna,從而預測它們之間的關聯信息;mca-net提出了一種多特征編碼方法,結合6種相似性特征來構建lncrna與疾病之間的關聯特征,并利用卷積神經網絡推斷lncrna與疾病之間的潛在關聯。因此,基于圖神經網絡的方法成為解決lncrna-disease關聯預測問題的有效途徑。然而基于單個圖神經網絡的模型因過度平滑而導致性能表現受限的問題。

3、目前,傳統的lncrna-disease關聯預測方法主要包括基于實驗和基于計算生物學的方法。基于實驗的方法需要昂貴且耗時的實驗過程來測量lncrna與疾病之間的關聯性,而基于計算生物學的方法則利用已知的lncrna和疾病數據進行預測。然而,這些傳統方法存在數據不完整、特征表示有限以及預測模型局限性等問題;而且數據的可用性和質量有限,特征表示缺乏全面性,預測模型無法充分考慮lncrna與疾病的復雜關聯。因此,現有預測方法存在以下問題:

4、第一,現有方法主要基于lncrna序列相似性和疾病語義相似性,來提取節點特征,但并未充分挖掘lncrna和疾病的多源特征信息,限制了模型對復雜生物學關系的刻畫能力;

5、第二,現有方法的特征提取方式,不能有效的提取lncrna和疾病的信息,例如,卷積神經網絡主要擅長局部特征提取,無法有效捕捉異構網絡中的長距離依賴信息。


技術實現思路

1、本發明實施例的目的在于提供一種基于kan網絡的lncrna-疾病關聯預測方法,該方法結合transformer提取全局序列特征、graphsage挖掘異構網絡拓撲信息,并通過kan網絡建模非線性關系,充分挖掘lncrna和疾病的多層次信息,提高關聯預測的精準性。

2、為實現上述目的,本發明提供了如下的技術方案:

3、一種基于kan網絡的lncrna-疾病關聯預測方法,包括以下步驟:

4、s1、融合lncrna-disease關聯網絡信息、lncrna和疾病的多種相似性信息構建綜合的異構網絡;

5、s2、構建基于多頭注意力機制的transformer特征提取器,用于捕獲來自lncrna和disease節點的全局序列化特征;

6、s3、構建基于異構圖網絡的graphsage特征提取器,用于捕獲lncrna和disease節點的拓撲結構特征;

7、s4、融合全局序列化特征和拓撲結構特征得到綜合的lncrna-disease關聯對特征信息;構建一個用于預測lncrna和疾病之間關聯分數的kan網絡,kan網絡包括b-spline變換層和深度kan結構,使用變換層可學習的b-樣條插值來學習lncrna-disease關聯對特征信息的非線性映射關系,利用深度kan結構預測lncrna和疾病之間關聯分數。

8、進一步的,在步驟s1中,使用m×n的關聯網絡來表示lncrna-disease的關聯信息,其中,m表示lncrna的數量,n表示disease的數量,當lncrna?li和disease?dj有關聯時,相應位置的a(li,dj)為1,否則為0;

9、關聯網絡定義表示如下:

10、;

11、計算出lncrna和疾病的初步特征信息,初步特征信息包括lncrna序列相似性lsseq、lncrna功能相似性lsfunc和lncrna高斯相互作用譜核相似性lsgipk,疾病語義相似性dssem和疾病高斯相互作用譜核相似性dsgipk;

12、分別融合lncrna和疾病的初步特征信息,得到lncrna綜合相似性特征ls和疾病綜合相似性特征ds,其中,,;

13、最后,融合lncrna-disease關聯網絡信息、綜合相似性特征ls以及疾病綜合相似性特征ds,構建一個lncrna-disease異構網絡:,其中,ls和ds分別表示lncrna的綜合相似性特征矩陣和疾病的綜合相似性特征矩陣,而a表示它們的鄰接關系矩陣,at表示鄰接矩陣的轉置。

14、進一步的,lncrna序列相似性lsseq的計算過程中,使用smith-waterman序列比對算法來評估lncrna之間的序列相似性;計算序列相似性的公式如下:

15、;

16、其中,li和lj分別表示第i個lncrna和第j個lncrna,sw(li,lj)表示基于smith-waterman比對算法計算序列比對得分。

17、進一步的,lncrna功能相似性lsfunc的計算過程中,采用公式表示為:

18、;

19、其中,p和q分別代表與lncrna?l1和l2關聯的疾病的數量,de表示為一種疾病,de表示為一組疾病,de={de1,de2,...},s(de,de)用于計算疾病之間關系,表示為:。

20、進一步的,lncrna高斯相互作用譜核相似性lsgipk的計算過程中,lncrna之間的gipk核相似性計算公式如下:

21、;

22、其中,a(li,)和a(lj,)分別代表a的第i行向量和第j行向量;λn是核寬度系數,定義為:,其中,n代表總的lncrna數量,a(lk,)代表a的第k行向量。

23、進一步的,疾病語義相似性dssem的計算過程中,使用疾病本體do來衡量相關疾病之間的語義相似性,表示為有向無環圖,通過利用do中疾病的層次結構,基于有向無環圖計算語義相似性,計算公式表示為:

24、;

25、其中,di和dj分別表示第i個疾病和第j個疾病,ti和tj分別表示包含第i個和第j個疾病的一組集合,sdi(t)表示疾病t對第i種疾病的語義影響。

26、進一步的,疾病高斯相互作用譜核相似性dsgipk的計算過程中,計算公式表示為:

27、;

28、其中,a(,di)和a(,dj)分別代表a的第i列向量和第j列向量,λd表示為:,d表示總的疾病數量,a(,nl)表示a的第l列向量。

29、進一步的,在步驟s2中,transformer特征提取器包括三層編碼層,在其中一個編碼層的第h個注意頭中,包含三個線性變換矩陣:query矩陣、key矩陣和value矩陣,具體的線性變換為:

30、;

31、其中,表示query矩陣的權重矩陣;表示key矩陣的權重矩陣;表示value矩陣的權重矩陣;hl-1代表第l-1層的輸出;

32、計算注意力分數矩陣,通過歸一化注意力分數矩陣與value矩陣得到每層輸出,具體公式表示為:

33、;

34、其中,d表示和的矩陣維度;表示第h個注意頭中的第l層的輸出;

35、通過多個注意力頭拼接每個注意力頭的結果得到每層的最終結果;在經過三層的transformer編碼層的輸出后,提取到特征表示f1。

36、進一步的,在步驟s3中,graphsage特征提取器包括三層graphsage計算層組成,通過鄰居采樣和聚合機制實現特征提取;其中,對于每個lncrna和疾病節點,隨機采樣其鄰居節點集合,并計算其特征的均值,表示為:

37、;

38、其中,wk為權重矩陣,u為n(v)表示的節點v的相鄰節點集合,mean表示做平均操作,σ為非線性激活函數,采用relu;為第k層計算后的節點表示;

39、通過采用多層計算,每一層的輸出作為下一層的輸入,最終得到異構網絡的表示特征矩陣f2。

40、進一步的,在融合全局序列化特征和拓撲結構特征得到綜合的lncrna-disease關聯對特征信息的步驟中,其融合方式表示為:

41、;

42、其中,系數α1、α2表示特征的重要性程度;

43、b-spline變換層的計算方式表示為:y*=w·f(x)+b;其中,f(x)表示b-spline插值后的特征,w和b是可訓練的權重和偏置項;

44、損失函數表示如下:

45、;

46、其中,yi表示lncrna-disease關聯對的真實標簽,表示對lncrna-disease關聯對的預測標簽,n表示lncrna-disease關聯對的數量。

47、與現有技術相比,本發明基于kan網絡的lncrna-疾病關聯預測方法的技術優勢表現在以下幾個方面:

48、第一,本發明提出的lncrna-疾病關聯預測方法,用于識別潛在的lncrna-疾病關聯,該方法結合transformer提取全局序列特征、graphsage挖掘異構網絡拓撲信息,并通過kan網絡建模非線性關系,充分挖掘lncrna和疾病的多層次信息,提高關聯預測的精準性;

49、第二,本發明結合transformer和graphsage兩種特征學習提取器,分別用于捕獲lncrna和疾病的全局特征信息以及網絡拓撲結構信息;兩種模塊相互配合,使得transsage-kan-lda能夠更精確地刻畫lncrna與疾病之間的復雜關系,提升預測的準確性和泛化能力。

50、綜上所述,本發明結合transformer和graphsage兩種特征學習模塊,分別用于提取lncrna和疾病的全局特征信息以及捕獲異構網絡的拓撲結構信息;利用kan網絡進行特征關聯預測,充分融合多源信息,以更精準地識別lncrna-疾病的潛在關聯;通過transformer和graphsage的互補學習,本方法能夠有效刻畫lncrna與疾病之間的復雜關系,提升模型的預測能力和泛化性能。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 墨玉县| 贵溪市| 葫芦岛市| 扶风县| 浦北县| 馆陶县| 大余县| 红河县| 云安县| 阿克| 博白县| 诸城市| 个旧市| 和田县| 汉中市| 荔浦县| 南陵县| 聂拉木县| 宝丰县| 嘉黎县| 运城市| 三原县| 周宁县| 葵青区| 玛多县| 文化| 横峰县| 神农架林区| 保靖县| 封丘县| 顺义区| 社会| 汕尾市| 上杭县| 刚察县| 株洲县| 仲巴县| 五华县| 闸北区| 嘉善县| 海伦市|