1.一種預測多肽在不同血液環境中的穩定性的深度學習算法,其特征在于包括如下步驟:
2.如權利要求1所述的一種預測多肽在不同血液中穩定性的深度學習算法,其特征在于,步驟一的具體操作過程為從peplife、thpdb、drugbank和pubmed公共數據庫以“多肽”、“半衰期”、“血液”作為關鍵詞進行搜索并收集相關數據。
3.如權利要求2所述的一種預測多肽在不同環境血液中穩定的深度學習算法,其特征在于,步驟二采用基于python的數據清理代碼針對收集到的數據,進行不符合要求的肽在不同血液環境中的穩定性數據篩選。
4.如權利要求3所述的一種預測多肽在不同環境血液中穩定的深度學習算法,其特征在于,步驟三采用rdkit的自動化生成和chemdraw的人工繪圖獲得對應肽的smiles信息。
5.如權利要求4所述的一種預測多肽在不同環境血液中穩定的深度學習算法,其特征在于,步驟四對于僅含有天然氨基酸且不含修飾的線性多肽,使用alphafold2進行3d結構的生成;對于僅含有天然氨基酸且不含修飾的環狀多肽,使用highfold進行生成;對于含有復雜修飾的肽,使用rdkit生成了每個環肽的3d結構。
6.如權利要求5所述的一種預測多肽在不同環境血液中穩定的深度學習算法,其特征在于,步驟十采用acc、precision、recall,、f1-score、auc、mcc對模型的性能進行評估,具體計算公式如下所示: