麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種高處墜落領域知識圖譜構建方法、裝置及介質

文檔序號:41757818發布日期:2025-04-29 18:26閱讀:4來源:國知局
一種高處墜落領域知識圖譜構建方法、裝置及介質

本發明屬于計算機,具體涉及一種高處墜落領域知識圖譜構建方法、裝置及介質。


背景技術:

1、高空作業在建筑、電力、通信等行業中普遍存在,伴隨著高處墜落風險的增加,有效的墜落防護系統和裝備對保障工人安全至關重要。然而,墜落防護系統的設計和選型復雜,依賴于實際施工環境和經驗。歷史事故數據和事故調查報告為設計提供寶貴參考,但信息分散,難以整合利用。知識圖譜通過整合和結構化表示知識,提高信息檢索效率,但在墜落防護領域,現有知識圖譜尚不能滿足需求,缺乏對墜落防護裝備標準和事故經驗的系統整合。因此,開發一個集成墜落防護裝備標準和事故調查報告兩種異構文件的高處墜落知識圖譜,整合相關標準和實際經驗,對于提高墜落防護系統設計的科學性和實用性,增強高空作業人員的安全意識和技能,減少事故具有重要意義。


技術實現思路

1、發明目的:本發明提出一種高處墜落領域知識圖譜構建方法、裝置及介質,顯著提升高空作業墜落防護系統設計的效率和安全性。

2、
技術實現要素:
本發明所述的一種高處墜落領域知識圖譜構建方法,包括以下步驟:

3、數據收集:收集整合墜落防護裝備標準文件和高處墜落事故調查報告,并對數據進行預處理;

4、模式層構建:定義知識圖譜中的概念、屬性和關系,確保了數據的一致性和可擴展性;

5、數據層構建:自動從標準文件和事故調查報告中提取關鍵信息:針對墜落防護裝備標準文件采用人工提取實體信息;針對高處墜落事故調查報告,基于自訓練領域命名實體識別工具進行實體抽取,基于觸發詞對文本進行分割,基于無監督聚類和大語言模型提取短語,基于規則進行關系抽?。?/p>

6、知識圖譜應用層:根據fps設計要求滿足檢索需求,包括通過ffh-ars實體進行查詢、通過fpe-s實體進行查詢以及通過多屬性組合進行查詢。

7、進一步地,所述對數據進行預處理包括格式統一、文本分詞、去除停用詞和亂碼信息清理。

8、進一步地,所述關鍵信息包括fpe的具體要求、事故報告的實際案例經驗、高空作業場景和高處墜落類型。

9、進一步地,所述基于自訓練領域命名實體識別工具進行實體抽取實現過程如下:

10、ner訓練語料準備,準備領域內高質量的訓練語料;

11、高處墜落領域實體詞典構建,使用領域特定實體詞典增強模型的領域適應性;

12、基于弱監督的bio編碼自動標注,自動識別和標記文本中的實體;

13、基于bi-lstm-crf的ner訓練,結合深度表示能力和序列標注能力;

14、高處墜落領域ner模型評估,使用精確度、召回率和f1值評估模型性能;

15、高處墜落領域ner模型應用,抽取特定類別的實體并存儲到知識圖譜中。

16、進一步地,所述高處墜落領域實體詞典構建實現過程如下:

17、從墜落防護裝備標準文件和高處墜落事故報告中提取專業術語和實體;

18、構建包含特定實體和術語的領域詞典,增強ner模型對高處墜落領域語言的理解和適應性。

19、進一步地,所述基于弱監督的bio編碼自動標注實現過程如下:

20、利用領域特定詞典和啟發式規則,自動匹配文本中的實體詞;

21、使用bio編碼格式對實體詞進行標記,以指示實體的開始、內部和外部。

22、進一步地,所述基于無監督聚類和大語言模型提取短語實現過程如下:

23、利用tf-idf算法將預處理后的文本轉化為數值型特征向量;使用umap算法對特征向量進行降維;通過肘部法則和k-means聚類方法確定最佳聚類數量;所述最佳聚類數量為26;

24、根據確定的最佳聚類數量,使用大語言模型kimi來分析事故報告中的文本內容,完成高處墜落事故類型的分類;

25、基于大語言模型的高空作業場景與墜落原因提煉;輸入已劃分文本模塊的高處墜落事故報告;通過關鍵文本內容引導大語言模型kimi提煉出高空作業場景和墜落原因的精煉信息;采取嚴格的人工審核和校對流程,對kimi模型的輸出結果進行全面審查,并對比領域專家的知識和經驗;對模型輸出中的任何偏差或錯誤進行細致的校正,以提升數據的可靠性。

26、本發明所述的一種存儲介質,所述存儲介質上存儲有計算機程序,所述計算機程序被至少一個處理器執行時實現如上所述的一種高處墜落領域知識圖譜構建方法的步驟。

27、本發明所述的一種裝置設備,包括存儲器和處理器,其中:

28、存儲器,用于存儲能夠在處理器上運行的計算機程序;

29、處理器,用于在運行所述計算機程序時,執行如上所述的一種高處墜落領域知識圖譜構建方法的步驟。

30、有益效果:與現有技術相比,本發明的有益效果:本發明能夠顯著提升高空作業墜落防護系統設計的效率和安全性;通過整合國家標準文件中的技術要求與歷史事故調查報告中的實際經驗,為設計人員提供了一個結構化、可視化的數據庫,使得設計過程中能夠直接借鑒和應用過往事故的教訓和解決方案;本發明能夠更加精準地確定需要關注的關鍵事項;這種結合理論與實踐的方法,不僅提高了設計的科學性和系統性,也為高空作業安全提供了更為堅實的保障,為高空作業墜落防護系統設計領域帶來了革命性的進步,極大地增強了設計的可靠性和實用性。



技術特征:

1.一種高處墜落領域知識圖譜構建方法,其特征在于,實現過程如下:

2.根據權利要求1所述的一種高處墜落領域知識圖譜構建方法,其特征在于,所述對數據進行預處理包括格式統一、文本分詞、去除停用詞和亂碼信息清理。

3.根據權利要求1所述的一種高處墜落領域知識圖譜構建方法,其特征在于,所述關鍵信息包括fpe的具體要求、事故報告的實際案例經驗、高空作業場景和高處墜落類型。

4.根據權利要求1所述的一種高處墜落領域知識圖譜構建方法,其特征在于,所述基于自訓練領域命名實體識別工具進行實體抽取實現過程如下:

5.根據權利要求4所述的一種高處墜落領域知識圖譜構建方法,其特征在于,所述高處墜落領域實體詞典構建實現過程如下:

6.根據權利要求4所述的一種高處墜落領域知識圖譜構建方法,其特征在于,所述基于弱監督的bio編碼自動標注實現過程如下:

7.根據權利要求1所述的一種高處墜落領域知識圖譜構建方法,其特征在于,所述基于無監督聚類和大語言模型提取短語實現過程如下:

8.根據權利要求7所述的一種高處墜落領域知識圖譜構建方法,其特征在于,所述最佳聚類數量為26。

9.一種存儲介質,其特征在于,所述存儲介質上存儲有計算機程序,所述計算機程序被至少一個處理器執行時實現如權利要求1至8任一項所述的一種高處墜落領域知識圖譜構建方法的步驟。

10.一種裝置設備,其特征在于,包括存儲器和處理器,其中:


技術總結
本發明公開了一種高處墜落領域知識圖譜構建方法、裝置及介質,所述方法包括:收集整合墜落防護裝備標準文件和高處墜落事故調查報告,并對數據進行預處理;定義知識圖譜中的概念、屬性和關系,確保了數據的一致性和可擴展性;針對墜落防護裝備標準文件采用人工提取實體信息;針對高處墜落事故調查報告,基于自訓練領域命名實體識別工具進行實體抽取,基于觸發詞對文本進行分割,基于無監督聚類和大語言模型提取短語,基于規則進行關系抽?。桓鶕﨔PS設計要求滿足檢索需求,包括通過FFH?ARs實體進行查詢、通過FPE?S實體進行查詢以及通過多屬性組合進行查詢。本發明能夠從多角度展示每個事故的特點和細節,優化墜落防護系統設計,提升高空作業安全性。

技術研發人員:周志鵬,余鑫慧,錢玲飛
受保護的技術使用者:南京航空航天大學
技術研發日:
技術公布日:2025/4/28
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 留坝县| 二连浩特市| 河源市| 大城县| 库车县| 罗甸县| 广德县| 灵台县| 全南县| 宣威市| 新民市| 南岸区| 静宁县| 沁水县| 澄迈县| 黄大仙区| 乌兰浩特市| 洞口县| 彰化市| 五寨县| 五莲县| 通海县| 西青区| 凌源市| 湖北省| 且末县| 梅河口市| 团风县| 湘潭市| 镇康县| 汉阴县| 门源| 本溪市| 徐州市| 湘潭市| 大悟县| 凌云县| 中江县| 筠连县| 临颍县| 沅江市|