本發明涉及機器學習,具體涉及一種基于機器學習的建筑結構識別方法及模型。
背景技術:
1、隨著城市化進程的加快,老舊建筑的數量日益增加,成為未來建筑改造和資源管理的重點對象。然而,這些建筑由于年代久遠,相關資料不全,結構信息不完整,為建筑結構的評估和管理帶來了極大的挑戰。科學地識別和分類建筑結構,不僅有助于提高老舊建筑改造的效率和精準性,還能為城市規劃、資源調度、建筑安全檢測及碳足跡分析等提供重要的基礎數據支持。
2、目前用于建筑結構識別的方法主要包括目視檢測、超聲波檢測、紅外熱成像、激光掃描及數字化建模等。目視檢測依賴人工經驗,雖成本低、操作簡單,但僅能發現表面可見的缺陷,無法有效識別深層次的結構問題。超聲波檢測、紅外熱成像和振動分析等技術,雖能識別某些內部結構問題,但通常需要專業設備和高技能操作人員,其檢測成本和時間投入較高,且受環境條件影響較大。數字化建模技術通過構建三維模型,整合多種檢測數據以直觀展示建筑結構狀況,但這一技術對硬件性能、建模標準及專業技能要求較高,難以在大規模應用中普及。此外,現有技術對老舊建筑尤其是歷史建筑的適用性有限。許多傳統方法依賴復雜的傳感器或激光雷達(lidar)數據,設備成本昂貴,數據獲取耗時耗力,尤其在城市尺度的大范圍應用中更顯不足。
3、盡管機器學習技術已被廣泛應用于建筑功能、年代和風格等特征分類,但針對建筑結構的分類研究仍然較少。與其他分類任務相比,建筑結構分類更加復雜,因其內在屬性更為隱性和多樣化。大多數現有研究依賴高維圖像或lidar數據,這些數據的獲取成本高昂,且對數據處理能力要求較高,限制了其在資源有限場景中的可行性。此外,目前針對建筑結構分類的機器學習算法和特征選擇方案也不夠全面,未能充分挖掘潛在的區分性特征,例如建筑幾何形狀與功能性數據的結合使用。更重要的是,目前的建筑結構識別技術尚未能充分利用現代數據分析工具,如機器學習和地理信息系統(gis),以提供更高效和低成本的解決方案。
4、綜上所述,當前的建筑結構識別技術在經濟性、適用性和操作便捷性方面存在顯著不足,特別是對于老舊建筑和城市范圍的應用場景,難以滿足高效、低成本的需求。
技術實現思路
1、本發明的目的在于提供一種基于機器學習的建筑結構識別方法及模型,能夠更好地整合建筑幾何數據、興趣點數據及其他相關信息,以低成本、高效率地實現老舊建筑結構的精準識別,為建筑改造和資源管理提供可靠的數據支撐。
2、為實現上述目的,本發明通過以下技術方案實現:
3、一種基于機器學習的建筑結構識別方法,包括以下步驟:
4、s1:通過地理信息系統gis獲取建筑物的幾何輪廓數據,并從網絡地圖獲取所述建筑物的興趣點poi數據;
5、s2:處理所述gis數據,對建筑物進行人工標注得到訓練數據集,并將所述poi數據與建筑物匹配,生成完整的shp格式數據集;
6、s3:基于所述訓練數據集,提取建筑物的特征值,所述特征值包括幾何特征、形狀特征和poi特征;
7、s4:采用預聚類主動學習方法對所述訓練數據集進行分類訓練,得到建筑結構預測模型;
8、s5:基于所述建筑結構預測模型,構建城市尺度的建筑結構信息資源數據庫。
9、進一步地:所述步驟s2中,人工標注包括將建筑物標注為以下結構類型中的一種:磚石結構、混凝土框架、混凝土框架-剪力墻、混凝土剪力墻和鋼結構。
10、進一步地:所述幾何特征包括:建筑面積、周長、樓層數、樓層高度、長寬比和高寬比。
11、進一步地:所述形狀特征包括:形狀不規則性和輪廓頂點數,其中所述形狀不規則性通過以下公式計算:si=ab/ambr其中,si為建筑輪廓的形狀不規則性,ab為建筑輪廓面積,ambr為包圍建筑輪廓的最小邊界矩形面積。
12、進一步地:所述poi特征包括:poi數量、poi類型數量和主要poi類型。
13、進一步地:所述步驟s4具體包括:
14、s401:采用dbscan方法對訓練數據進行聚類,區分噪聲樣本、核心樣本和非核心樣本;
15、s402:對核心樣本進行分層采樣,構建初始訓練樣本集和無標簽樣本池;
16、s403:選擇機器學習算法對初始訓練樣本集進行訓練;
17、s404:通過主動學習方法迭代訓練分類器,查詢并標注最有價值的樣本。
18、進一步地,所述機器學習算法包括以下一種或多種:梯度提升決策樹gbdt、決策樹dt、隨機森林rf、支持向量機svm、k近鄰knn和多層感知機mlp。
19、進一步地,所述步驟s4還包括:
20、s405:采用特征優化技術對特征進行選擇,所述特征優化技術包括篩選方法、包裝方法和嵌入方法;
21、s406:計算宏平均精度、宏平均召回率和宏平均f1值,評估分類結果。
22、本發明還提供一種基于機器學習的建筑結構識別模型,包括:
23、數據獲取模塊,用于通過地理信息系統gis獲取建筑物的幾何輪廓數據,并從網絡地圖獲取所述建筑物的興趣點poi數據;
24、數據處理模塊,用于處理所述gis數據,對建筑物進行人工標注得到訓練數據集,并將所述poi數據與建筑物匹配,生成完整的shp格式數據集;
25、特征提取模塊,用于從所述訓練數據集中提取建筑物的特征值,所述特征值包括幾何特征、形狀特征和poi特征;
26、預測建模模塊,用于采用預聚類主動學習方法對所述訓練數據集進行分類訓練,得到建筑結構預測模型;
27、數據庫構建模塊,用于基于所述建筑結構預測模型,構建城市尺度的建筑結構信息資源數據庫
28、進一步地:所述預測建模模塊包括:
29、聚類單元,用于采用dbscan方法對訓練數據進行聚類,區分噪聲樣本、核心樣本和非核心樣本;
30、采樣單元,用于對核心樣本進行分層采樣,構建初始訓練樣本集和無標簽樣本池;
31、訓練單元,用于選擇機器學習算法對初始訓練樣本集進行訓練;
32、迭代優化單元,用于通過主動學習方法迭代訓練分類器,查詢并標注最有價值的樣本。
33、相對現有技術,本發明具有以下有益效果:
34、一、本方法顯著提高了建筑結構分類的準確性。通過引入包含幾何特征、形狀特征和poi特征的多維特征體系,結合預聚類主動學習模型,能夠充分捕捉建筑結構的區分性特征,使得建筑結構分類的宏平均f1值達到90%以上,為建筑改造和資源管理提供了可靠的數據支撐。
35、二、本發明有效降低了建筑結構識別的成本。采用地理信息系統和網絡地圖api獲取建筑數據,避免了傳統方法中對昂貴設備和專業人員的依賴;同時,通過預聚類主動學習方法,在保證分類精度的前提下顯著減少了所需的標注樣本數量,大幅降低了人工標注成本。
36、三、本方法實現了城市尺度建筑結構識別的自動化。通過多源數據融合和機器學習技術,本發明能夠高效構建和更新城市尺度的建筑結構信息資源數據庫,克服了傳統技術在大規模應用中的局限性,特別適用于包含大量老舊建筑的城市環境。