本技術屬于資源勘探,尤其涉及一種基于元素地球化學異常的金礦靶區優選方法及設備。
背景技術:
1、利用計算機技術進行地質數據處理、地球化學異常檢測是尋找潛在金礦靶區的重要手段。然而,由于地球化學數據通常具有稀疏、復雜、非線性等特點,利用計算機技術進行處理時面臨諸多挑戰。
2、1.傳統的機器學習方法,如基于統計的異常檢測算法(包括均方差、概率圖等)以及聚類分析、因子分析等,在計算機中的實現主要基于簡單的數據統計和基礎數學模型構建。這些方法在處理地球化學數據時,需要人工進行大量的特征工程以適應模型輸入要求。在計算機系統中,面對高維且稀疏的地球化學數據,數據讀取、計算和存儲操作復雜且耗時,模型學習能力受限,容易受噪聲干擾,并且難以有效捕捉數據中的復雜空間關系,導致在金礦靶區優選時準確性較低,無法準確識別與金礦成礦相關的地球化學異常特征及其空間分布模式。
3、2.基于深度學習的檢測模型雖有一定進展,但仍存在諸多問題。例如卷積神經網絡(cnn)、圖卷積網絡、自編碼器、圖卷積自編碼器、稀疏自編碼器等,在計算機中利用其強大計算能力和并行處理能力進行自動特征學習。然而,cnn?在處理地球化學數據時,其卷積核參數設置限制了對長距離依賴關系的捕捉,難以獲取與金礦相關元素在較大空間范圍內的關聯信息。自編碼方法在計算機實現中,因側重于數據重構誤差最小化,忽視了地球化學數據的空間關系和分布特性,無法充分利用空間信息進行金礦靶區優選。
4、3.轉換器模型(transformer)架構在自然語言處理等領域表現出色,但應用于地球化學異常檢測及金礦靶區優選時困難重重。在計算機系統中,其訓練需要大量數據,而地球化學采樣數據相對稀疏,導致模型訓練難以收斂。且transformer模型結構復雜,計算過程中對計算資源(如中央處理器(cpu)、圖形處理器(gpu))和內存需求極高,例如計算多頭自注意力時的大量矩陣乘法運算。這使得訓練后的模型在金礦靶區優選場景下泛化性能受限,難以準確區分真正與金礦相關的區域。
5、綜上所述,現有技術在利用計算機技術進行金礦靶區優選時,存在對有限地球化學采樣數據利用不充分、模型訓練困難、泛化能力弱以及難以有效捕捉空間關系等問題,無法滿足金礦勘探中準確優選靶區的需求。
技術實現思路
1、本技術實施例提供了一種基于元素地球化學異常的金礦靶區優選方法及設備,可以解決傳統金礦靶區優選方法無法滿足金礦勘探中準確優選靶區的需求的問題。
2、第一方面,本技術實施例提供了一種基于元素地球化學異常的金礦靶區優選方法,包括:
3、獲取研究區域內多個采樣點的地球化學樣本數據;地球化學樣本數據包含多種元素的濃度值;
4、利用多個采樣點的地球化學樣本數據對轉換器模型進行訓練,得到訓練后的轉換器模型;轉換器模型用于對地球化學樣本數據進行處理并輸出重建地球化學數據;
5、對訓練后的轉換器模型的模型參數進行初始化,得到學生模型;
6、利用多個采樣點的地球化學樣本數據對學生模型進行自蒸餾訓練,得到地球化學數據重建模型;
7、將多個采樣點的地球化學樣本數據輸入地球化學數據重建模型進行處理,得到每個采樣點的重建地球化學數據;
8、基于每個采樣點的重建地球化學數據計算每個采樣點的地球化學異常分數,并基于多個采樣點的地球化學異常分數,確定研究區域內的金礦靶區。
9、可選的,獲取研究區域內多個采樣點的地球化學樣本數據,包括:
10、分別針對每個采樣點,利用位置編碼函數對采樣點的原始地球化學樣本數據進行位置編碼,對位置編碼結果和采樣點的原始地球化學樣本數據進行矢量相加操,得到采樣點的地球化學樣本數據。
11、可選的,在利用多個采樣點的地球化學樣本數據對學生模型進行自蒸餾訓練過程中的損失函數為:
12、
13、其中,表示自蒸餾訓練過程中第j次迭代得到的第j代模型的損失函數,表示自蒸餾訓練過程中第j次迭代的損失權重,與迭代次數相關,表示采樣點的數量,表示第j代模型在模型參數下對的輸出結果,表示第i個采樣點的地球化學樣本數據,表示多個采樣點中除第i個采樣點以外其他采樣點的地球化學樣本數據,表示第j-1代模型在模型參數下對的輸出結果。
14、可選的,損失權重的計算公式為:,,,表示初始權重。
15、可選的,每個采樣點的重建地球化學數據均包括多種元素的重建濃度值;
16、基于每個采樣點的重建地球化學數據計算每個采樣點的地球化學異常分數,包括:
17、通過公式計算第i個采樣點的地球化學異常分數;
18、其中,表示元素的數量,表示第i個采樣點的第k種元素的濃度值,表示第i個采樣點的第k種元素的重建濃度值。
19、可選的,基于多個采樣點的地球化學異常分數,確定研究區域內的金礦靶區,包括:
20、按照由大至小的順序對多個采樣點的地球化學異常分數進行排序;
21、將排序后的多個地球化學異常分數中前m個地球化學異常分數所屬采樣點對應的區域作為研究區域內的金礦靶區。
22、可選的,在利用多個采樣點的地球化學樣本數據對學生模型進行自蒸餾訓練,得到地球化學數據重建模型的步驟之后,金礦靶區優選方法還包括:
23、利用多個正樣本和多個負樣本的地球化學樣本數據計算地球化學數據重建模型的auc值;正樣本為已知金礦點,負樣本為已知非金礦點;
24、若auc值小于預設閾值,則對地球化學數據重建模型的模型參數進行調整,并將模型參數調整后的地球化學數據重建模型作為學生模型,返回執行利用多個采樣點的地球化學樣本數據對學生模型進行自蒸餾訓練,得到地球化學數據重建模型的步驟,直至auc值大于或等于預設閾值時,進入將多個采樣點的地球化學樣本數據輸入地球化學數據重建模型進行處理,得到每個采樣點的重建地球化學數據的步驟;
25、若auc值大于或等于預設閾值,則進入將多個采樣點的地球化學樣本數據輸入地球化學數據重建模型進行處理,得到每個采樣點的重建地球化學數據的步驟。
26、可選的,利用多個正樣本和多個負樣本的地球化學樣本數據計算地球化學數據重建模型的auc值,包括:
27、利用地球化學數據重建模型分別對每個正樣本和每個負樣本的地球化學樣本數據進行處理,得到每個正樣本和每個負樣本的重建地球化學數據;
28、基于每個正樣本和每個負樣本的重建地球化學數據獲取每個正樣本和每個負樣本的地球化學異常分數;
29、利用多個正樣本和多個負樣本的地球化學異常分數計算地球化學數據重建模型的auc值。
30、可選的,地球化學數據重建模型的auc值的計算公式為:
31、
32、其中,表示地球化學數據重建模型的auc值,表示正樣本的數量,表示負樣本的數量,表示指示函數,,表示第t個正樣本的地球化學異常分數,表示第q個負樣本的地球化學異常分數。
33、第二方面,本技術實施例提供了一種終端設備,包括存儲器、處理器以及存儲在存儲器中并可在處理器上運行的計算機程序,處理器執行計算機程序時實現上述的基于元素地球化學異常的金礦靶區優選方法。
34、本技術的上述方案有如下的有益效果:
35、在本技術的實施例中,通過在訓練后的轉換器模型的基礎上,應用漸進式重生機制,對訓練后的轉換器模型的模型參數進行初始化得到學生模型,促使學生模型在保留部分先前知識的基礎上重新學習,由于漸進式重生機制允許在稀疏地球化學數據條件下,通過不斷迭代優化,準確地識別與金礦成礦相關的地球化學異常,進而實現精確的金礦靶區優選,克服了傳統方法在利用有限數據進行靶區預測時準確性低的問題。其次,在知識傳遞與模型性能提升上,通過漸進式重生機制,模型能夠逐步積累和傳遞與金礦相關的知識,有效提升了模型對復雜地球化學模式的理解能力,從而提高了金礦靶區優選的精度和可靠性,能滿足金礦勘探中準確優選靶區的需求。
36、本技術的其它有益效果將在隨后的具體實施方式部分予以詳細說明。