本發(fā)明屬于安全管理與事故預(yù)防,尤其涉及一種基于中間索引的隱患事故關(guān)聯(lián)度評估方法。
背景技術(shù):
1、在現(xiàn)有技術(shù)中,隱患事故的關(guān)聯(lián)度評估方法通常依賴于專家經(jīng)驗或簡單的統(tǒng)計分析來確定隱患與事故之間的關(guān)聯(lián)度。這些傳統(tǒng)方法具有一定的局限性,難以系統(tǒng)化地處理復(fù)雜的隱患和事故數(shù)據(jù),尤其是在大規(guī)模隱患庫或事故庫的情況下,難以實現(xiàn)對隱患和事故之間復(fù)雜關(guān)系的有效挖掘和量化。此外,現(xiàn)有方法往往缺乏對隱患文本的深層次語義理解和分析,無法準(zhǔn)確捕捉隱患描述的細(xì)微差異,從而導(dǎo)致隱患關(guān)聯(lián)度評估的準(zhǔn)確性不高。
2、一些現(xiàn)有技術(shù)嘗試使用事故樹分析法來分析事故原因及其關(guān)聯(lián)的隱患,但此類方法僅能針對具體事故樹中的隱患進行權(quán)重分配,難以在更大范圍的隱患數(shù)據(jù)中尋找隱患與事故之間的關(guān)聯(lián)性。此外,現(xiàn)有的聚類算法在處理隱患文本時,常常依賴人工設(shè)定的特征或簡單的文本匹配方法,無法充分利用隱患描述中的語義信息,導(dǎo)致在隱患文本的聚類和相似度計算上準(zhǔn)確性不足。
3、因此,現(xiàn)有技術(shù)在隱患事故關(guān)聯(lián)度評估方面仍面臨以下主要問題:1)缺乏有效的隱患和事故關(guān)聯(lián)權(quán)重評估機制;2)對大規(guī)模事故庫和隱患庫的管理和分析能力不足,無法提供精確的隱患關(guān)聯(lián)度等級評定。針對上述問題,亟需一種基于深度學(xué)習(xí)和自然語言處理技術(shù)的新方法,能夠有效地構(gòu)建隱患文本樹模型并通過生成模型實現(xiàn)隱患相似度的計算,從而更加精準(zhǔn)地評估隱患與事故之間的關(guān)聯(lián)度。
技術(shù)實現(xiàn)思路
1、針對相關(guān)技術(shù)中存在的不足之處,本發(fā)明提供了一種基于中間索引的隱患事故關(guān)聯(lián)度評估方法,實現(xiàn)了隱患文本的深度語義分析與隱患事故關(guān)聯(lián)度的精確評估,解決了現(xiàn)有評估方法在準(zhǔn)確性不足的問題。
2、在一種可能的實施方式中,提供了一種基于中間索引的隱患事故關(guān)聯(lián)度評估方法,包括以下步驟:
3、s10、事故庫構(gòu)建:收集事故案例,采用事故樹分析方法識別每個事故案例的直接原因和間接原因,分析事故樹中的隱患與事故結(jié)果之間的關(guān)系,為每條隱患確定事故權(quán)重,將所有事故樹中的隱患及其對應(yīng)的權(quán)重整合起來,構(gòu)建事故數(shù)據(jù)庫;
4、s20、隱患文本句向量提取:對隱患描述進行文本預(yù)處理,使用預(yù)訓(xùn)練的bert模型提取每條隱患描述的句向量;
5、s30、隱患文本樹構(gòu)建:逐級建立隱患文本樹,進行k-means聚類,將隱患描述按相似性分組,構(gòu)建層次化的隱患文本樹,并生成隱患文本-索引序列數(shù)據(jù)集;
6、s40、隱患索引序列生成模型構(gòu)建及訓(xùn)練:選擇transformer生成式模型框架構(gòu)建隱患索引序列生成模型,使用準(zhǔn)備好的數(shù)據(jù)集對模型進行訓(xùn)練,基于隱患文本的語義信息預(yù)測其在隱患文本樹中的索引序列;
7、s50、隱患相似度計算:將預(yù)處理后的隱患文本輸入訓(xùn)練好的生成式模型中,生成對應(yīng)的索引序列,根據(jù)索引序列在隱患文本樹中定位相應(yīng)的隱患節(jié)點,計算與事故隱患的文本相似度;
8、s60、隱患事故關(guān)聯(lián)度評估:根據(jù)當(dāng)前隱患與事故庫隱患的相似度及其相應(yīng)事故權(quán)重,計算當(dāng)前隱患導(dǎo)致事故發(fā)生的關(guān)聯(lián)度權(quán)重,并評定其關(guān)聯(lián)度等級。
9、在一種可能的實施方式中,在s20中,對隱患描述進行文本預(yù)處理,包括去除停用詞和標(biāo)點符號,進行詞干提取和詞形還原;
10、隱患文本句向量提取還包括:使用預(yù)訓(xùn)練的bert模型提取每條隱患描述的句向量,捕捉文本中的深層語義信息。
11、在一種可能的實施方式中,在s30中,隱患文本樹構(gòu)建,包括:
12、按照設(shè)定的每級n個節(jié)點,其中,n為20,每個節(jié)點最多包含m條隱患規(guī)則,其中,m為50,對隱患描述進行k-means聚類;
13、如果某個聚類中的隱患數(shù)量超過m條,則繼續(xù)將該聚類分為n個子聚類,每個子聚類中最多包含m條隱患,直到所有聚類都少于m條隱患時停止。
14、在一種可能的實施方式中,在s50中,計算與事故隱患的文本相似度,包括:計算當(dāng)前隱患節(jié)點在隱患文本樹中距離最近的事故隱患節(jié)點,然后根據(jù)兩節(jié)點的最近祖先節(jié)點距離的倒數(shù)計算相似度。
15、在一種可能的實施方式中,在s50中,
16、使用lca算法求兩葉子節(jié)點u和v和最近公共祖先w的深度;
17、使用如下公式來計算兩節(jié)點的最近祖先節(jié)點距離:
18、distance(u,v)=depth(u)+depth(v)-2×depth(w),取倒數(shù)即為相似度;
19、depth(u)和depth(v)分別表示節(jié)點u和v在樹中的深度,depth(w)表示最近公共祖先w的深度;
20、距離distance(u,v)越小,相似度越高。
21、在一種可能的實施方式中,在s10,事故庫構(gòu)建中,從安全事故報告、行業(yè)數(shù)據(jù)庫和政府發(fā)布的事故數(shù)據(jù)中收集事故案例。
22、在一種可能的實施方式中,在s10中,構(gòu)建數(shù)據(jù)庫包含了每一條隱患的描述和權(quán)重,以及隱患之間的關(guān)系以及它們與事故結(jié)果之間的聯(lián)系:
23、
24、其中,d(t)隱患在事故樹中的深度,dmax事故樹最大深度,f(di,t)隱患在事故樹中的權(quán)重。
25、基于上述技術(shù)方案,本發(fā)明的基于中間索引的隱患事故關(guān)聯(lián)度評估方法,本發(fā)明的基于中間索引的隱患事故關(guān)聯(lián)度評估方法,通過以下步驟解決了隱患與事故關(guān)聯(lián)度評估的難題:首先,通過收集事故案例并使用事故樹分析方法,識別事故的直接原因和間接原因,構(gòu)建了包含隱患及其權(quán)重的事故庫;接著,使用bert模型對隱患描述進行文本處理,提取深層語義信息,并通過k-means聚類構(gòu)建層次化的隱患文本樹,生成隱患索引序列;在此基礎(chǔ)上,利用transformer生成模型預(yù)測隱患在文本樹中的索引位置,計算當(dāng)前隱患與事故庫中隱患的相似度;最后,結(jié)合隱患的相似度和事故庫中的隱患權(quán)重,計算當(dāng)前隱患導(dǎo)致事故的關(guān)聯(lián)度,并根據(jù)關(guān)聯(lián)度等級評估風(fēng)險。本發(fā)明提供了一種系統(tǒng)化、結(jié)構(gòu)化的隱患關(guān)聯(lián)度評估方法,能夠有效解決隱患與事故關(guān)聯(lián)度評估難度大的問題,提升事故預(yù)防和隱患管理的準(zhǔn)確性與效率。
1.一種基于中間索引的隱患事故關(guān)聯(lián)度評估方法,其特征在于,該方法包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于中間索引的隱患事故關(guān)聯(lián)度評估方法,其特征在于,在s20中,對隱患描述進行文本預(yù)處理,包括去除停用詞和標(biāo)點符號,進行詞干提取和詞形還原;
3.根據(jù)權(quán)利要求2所述的基于中間索引的隱患事故關(guān)聯(lián)度評估方法,其特征在于,在s30中,隱患文本樹構(gòu)建,包括:
4.根據(jù)權(quán)利要求3所述的基于中間索引的隱患事故關(guān)聯(lián)度評估方法,其特征在于,在s50中,計算與事故隱患的文本相似度,包括:計算當(dāng)前隱患節(jié)點在隱患文本樹中距離最近的事故隱患節(jié)點,然后根據(jù)兩節(jié)點的最近祖先節(jié)點距離的倒數(shù)計算相似度。
5.根據(jù)權(quán)利要求4所述的基于中間索引的隱患事故關(guān)聯(lián)度評估方法,其特征在于,在s50中,
6.根據(jù)權(quán)利要求5所述的基于中間索引的隱患事故關(guān)聯(lián)度評估方法,其特征在于,在s10,事故庫構(gòu)建中,從安全事故報告、行業(yè)數(shù)據(jù)庫和政府發(fā)布的事故數(shù)據(jù)中收集事故案例。
7.根據(jù)權(quán)利要求5所述的基于中間索引的隱患事故關(guān)聯(lián)度評估方法,其特征在于,在s10中,構(gòu)建數(shù)據(jù)庫包含了每一條隱患的描述和權(quán)重,以及隱患之間的關(guān)系以及它們與事故結(jié)果之間的聯(lián)系: