本發明涉及材料科學和機器學習的,尤其涉及一種可用于機器學習的材料結構分割編碼方法。
背景技術:
1、材料設計的目的是通過系統地調整材料的結構、組成和性能,來實現特定功能或滿足特定需求。傳統的材料設計依賴于實驗和理論模擬,這一過程耗時且費力。隨著機器學習在材料科學中的應用興起,研究人員通過利用大量實驗數據和材料數據庫,結合機器學習算法,建立材料結構與性能之間的關系模型,進而加速材料發現和設計過程。建立此類模型的第一步是合理地分割和編碼材料的結構,以便從中提取出有意義的結構-性能關系。
2、在材料分割和編碼方面,現有方法主要依賴人工處理或基于規則的算法,效率低且缺乏通用性。此外,編碼通常是基于晶格參數、原子坐標等特定參數描述,但是對特定參數描述的高依賴性使得模型存在適應性差、信息表達不充分等問題。
3、因此,亟需一種能夠實現多維度材料信息處理,提高材料結構編碼的通用性和表征精度的材料結構分割編碼方法。
技術實現思路
1、基于此,有必要針對上述技術問題,提供一種可用于機器學習的材料結構分割編碼方法。
2、一種可用于機器學習的材料結構分割編碼方法,包括以下步驟:對材料結構的關鍵原子結構進行分析,提取材料結構的骨架單元,構建骨架模型;將所述骨架單元劃分為若干碎片單元,根據所述骨架單元和碎片單元進行唯一編碼,得到骨架編碼信息和碎片編碼信息;根據所述骨架編碼信息和碎片編碼信息,生成材料結構的編碼矩陣;采用所述編碼矩陣對機器學習模型進行訓練,得到目標機器學習模型,所述目標機器學習模型能夠進行材料性質預測。
3、在其中一個實施例中,所述對材料結構的關鍵原子結構進行分析,提取材料結構的骨架單元,構建骨架模型,包括:測量和分析材料結構中的原子空間排布,查找形成骨架的關鍵原子結構;基于所述關鍵原子結構形成骨架單元,并根據所述骨架單元構建材料的骨架模型。
4、在其中一個實施例中,所述將所述骨架單元劃分為若干碎片單元,根據所述骨架單元和碎片單元進行唯一編碼,得到骨架編碼信息和碎片編碼信息,包括:分析所述骨架單元的內部結構,將所述骨架單元內的關鍵原子結構劃分為若干碎片單元;分別對所述骨架單元和碎片單元進行唯一編碼,得到骨架編碼信息和碎片編碼信息,所述骨架編碼信息和碎片編碼信息分別對應不同的骨架種類和碎片種類。
5、在其中一個實施例中,所述根據所述骨架編碼信息和碎片編碼信息,生成材料結構的編碼矩陣,包括:將所述骨架編碼信息作為行元素,所述碎片編碼信息作為列元素,生成表示材料結構的編碼矩陣,所述編碼矩陣與材料結構的維度相同。
6、在其中一個實施例中,所述采用所述編碼矩陣對機器學習模型進行訓練,得到目標機器學習模型,包括:采用所述編碼矩陣作為輸入,對機器學習模型進行訓練;通過誤差反向傳播優化模型參數,直至模型的誤差達到設定閾值,通過測試集數據進行模型驗證,驗證通過得到目標機器學習模型,所述目標機器學習模型用于進行材料性質預測,所述材料性質包括物理性質和化學性質。
7、相比于現有技術,本發明的優點及有益效果在于:通過對材料結構的關鍵原子結構進行分析,提取材料結構的骨架單元,構建得到骨架模型,將骨架單元劃分為若干碎片單元,根據骨架單元和碎片單元進行唯一編碼,得到骨架編碼信息和碎片編碼信息,根據骨架編碼信息和碎片編碼信息,生成結構的編碼矩陣,通過(一種或多種)骨架-(一種或多種)碎片兩級分割和數據化編碼的方式,能夠更加高效地表征復雜的材料結構,適用于多種材料的設計場景,便于與機器學習模型進行集成,采用編碼矩陣對機器學習模型進行訓練,得到目標機器學習模型,通過目標機器學習模型能夠進行材料性質預測,通過多層次骨架和碎片編碼,能夠進行多維度材料信息處理,簡化了模型輸入數據的預處理流程,顯著提高了材料結構表征的精度和材料設計效率,提高材料結構編碼的通用性,適用于多種材料設計及優化場景。
1.一種可用于機器學習的材料結構分割編碼方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種可用于機器學習的材料結構分割編碼方法,其特征在于,所述對材料結構的關鍵原子結構進行分析,提取材料結構的骨架單元,構建骨架模型,包括:
3.根據權利要求2所述的一種可用于機器學習的材料結構分割編碼方法,其特征在于,所述將所述骨架單元劃分為若干碎片單元,根據所述骨架單元和碎片單元進行唯一編碼,得到骨架編碼信息和碎片編碼信息,包括:
4.根據權利要求1所述的一種可用于機器學習的材料結構分割編碼方法,其特征在于,所述根據所述骨架編碼信息和碎片編碼信息,生成材料結構的編碼矩陣,包括:
5.根據權利要求1所述的一種可用于機器學習的材料結構分割編碼方法,其特征在于,所述采用所述編碼矩陣對機器學習模型進行訓練,得到目標機器學習模型,包括: