本發(fā)明涉及水上交通領(lǐng)域,特別涉及一種水上交通事故調(diào)查報(bào)告處理分析方法及系統(tǒng)。
背景技術(shù):
1、在水上交通領(lǐng)域,以往對(duì)事故調(diào)查報(bào)告的分析主要依賴人工方式,由專家組進(jìn)行解讀和評(píng)估。這種傳統(tǒng)方法存在諸多弊端,如耗費(fèi)大量人力和時(shí)間成本,且分析結(jié)果易受專家主觀因素影響,缺乏客觀性和一致性。隨著信息技術(shù)的發(fā)展,部分研究開始嘗試采用一些簡(jiǎn)單的數(shù)據(jù)統(tǒng)計(jì)和分析方法,但對(duì)于非結(jié)構(gòu)化的事故報(bào)告文本數(shù)據(jù),這些方法難以深入挖掘其中的關(guān)鍵信息和潛在關(guān)聯(lián)。
2、近年來,人工智能技術(shù)在各領(lǐng)域逐漸得到應(yīng)用,但在水上交通事故調(diào)查報(bào)告處理方面,仍處于探索階段。一些相關(guān)研究雖嘗試?yán)脵C(jī)器學(xué)習(xí)算法,但在模型的準(zhǔn)確性和適應(yīng)性上存在不足,未能充分滿足實(shí)際需求。例如,某些早期的文本分析模型在處理專業(yè)術(shù)語繁多、文本結(jié)構(gòu)復(fù)雜的事故報(bào)告時(shí),往往無法準(zhǔn)確提取事故致因和風(fēng)險(xiǎn)點(diǎn),也難以對(duì)事故場(chǎng)景進(jìn)行有效分類和分析。
3、現(xiàn)有技術(shù)的主要缺陷在于:人工分析效率低下,無法快速處理大量事故報(bào)告;定性分析居多,缺乏精準(zhǔn)的定量分析,難以準(zhǔn)確衡量風(fēng)險(xiǎn)程度;對(duì)事故報(bào)告中的復(fù)雜語義和隱含信息挖掘能力有限,導(dǎo)致事故致因和風(fēng)險(xiǎn)點(diǎn)識(shí)別不全面;不同分析方法和人員得出的結(jié)果差異較大,缺乏可靠性和穩(wěn)定性。
4、因此,如何提供一種水上交通事故調(diào)查報(bào)告處理分析方法及系統(tǒng),是目前亟待解決的問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明實(shí)施例提供了一種水上交通事故調(diào)查報(bào)告處理分析方法及系統(tǒng),以解決現(xiàn)有技術(shù)中人工分析效率低下、缺乏精準(zhǔn)的定量分析、事故致因和風(fēng)險(xiǎn)點(diǎn)識(shí)別不全面及缺乏可靠性和穩(wěn)定性的問題。
2、為了對(duì)披露的實(shí)施例的一些方面有一個(gè)基本的理解,下面給出了簡(jiǎn)單的概括。該概括部分不是泛泛評(píng)述,也不是要確定關(guān)鍵/重要組成元素或描繪這些實(shí)施例的保護(hù)范圍。其唯一目的是用簡(jiǎn)單的形式呈現(xiàn)一些概念,以此作為后面的詳細(xì)說明的序言。
3、根據(jù)本發(fā)明實(shí)施例的第一方面,提供了一種水上交通事故調(diào)查報(bào)告處理分析方法。
4、在一個(gè)實(shí)施例中,一種水上交通事故調(diào)查報(bào)告處理分析方法,包括:
5、利用水上交通事故文本數(shù)據(jù)對(duì)語言模型進(jìn)行預(yù)訓(xùn)練,以使語言模型獲取水上交通事故文本數(shù)據(jù)中的語義特征和語言模式,并得到關(guān)鍵詞提取模型;利用條件隨機(jī)場(chǎng)對(duì)關(guān)鍵詞提取模型的輸出進(jìn)行標(biāo)注;
6、基于關(guān)鍵詞提取模型,對(duì)待分析的水上交通事故報(bào)告進(jìn)行事故致因和風(fēng)險(xiǎn)點(diǎn)的提??;利用相似度算法,計(jì)算各事故致因之間以及各風(fēng)險(xiǎn)點(diǎn)之間的關(guān)聯(lián)程度,并構(gòu)建耦合關(guān)系矩陣;利用耦合關(guān)系矩陣和耦合度閾值,篩選出事故致因強(qiáng)耦合關(guān)系對(duì)和風(fēng)險(xiǎn)點(diǎn)強(qiáng)耦合關(guān)系對(duì);
7、根據(jù)詞頻統(tǒng)計(jì)分析技術(shù),對(duì)事故致因和風(fēng)險(xiǎn)點(diǎn)進(jìn)行詞頻分析,得到事故致因和風(fēng)險(xiǎn)點(diǎn)的重要度;
8、利用主題模型,并結(jié)合事故致因,對(duì)待分析的水上交通事故報(bào)告進(jìn)行場(chǎng)景分類,并構(gòu)建事故場(chǎng)景集。
9、在一個(gè)實(shí)施例中,利用水上交通事故文本數(shù)據(jù)對(duì)語言模型進(jìn)行預(yù)訓(xùn)練之前還包括:
10、收集水上交通事故調(diào)查報(bào)告,并將水上交通事故調(diào)查報(bào)告轉(zhuǎn)換為統(tǒng)一格式的文本數(shù)據(jù);
11、對(duì)水上交通事故調(diào)查報(bào)告中的文本數(shù)據(jù),進(jìn)行清洗操作,并去除噪聲數(shù)據(jù)、無關(guān)符號(hào)和重復(fù)信息;
12、對(duì)水上交通事故調(diào)查報(bào)告中的文本數(shù)據(jù),進(jìn)行詞法和句法分析,并對(duì)專業(yè)術(shù)語進(jìn)行標(biāo)準(zhǔn)化處理,得到水上交通事故文本數(shù)據(jù)。
13、在一個(gè)實(shí)施例中,利用條件隨機(jī)場(chǎng)對(duì)關(guān)鍵詞提取模型的輸出進(jìn)行標(biāo)注包括:
14、構(gòu)建條件隨機(jī)場(chǎng)的特征函數(shù)和轉(zhuǎn)移函數(shù);利用條件隨機(jī)場(chǎng),并結(jié)合專家經(jīng)驗(yàn),對(duì)關(guān)鍵詞提取模型的輸出進(jìn)行標(biāo)注。
15、在一個(gè)實(shí)施例中,利用相似度算法,計(jì)算各事故致因之間以及各風(fēng)險(xiǎn)點(diǎn)之間的關(guān)聯(lián)程度,并構(gòu)建耦合關(guān)系矩陣包括:
16、通過余弦相似度計(jì)算公式,計(jì)算各事故致因之間以及各風(fēng)險(xiǎn)點(diǎn)之間的耦合度,并將耦合度通過矩陣的形式保存。
17、在一個(gè)實(shí)施例中,利用耦合關(guān)系矩陣和耦合度閾值,篩選出事故致因強(qiáng)耦合關(guān)系對(duì)和風(fēng)險(xiǎn)點(diǎn)強(qiáng)耦合關(guān)系對(duì)包括:
18、預(yù)先設(shè)置耦合度閾值,將超過耦合度閾值的兩個(gè)關(guān)鍵詞之間建立耦合連接,并利用和弦圖展示耦合連接情況,并統(tǒng)計(jì)得到每個(gè)關(guān)鍵詞的耦合連接數(shù),且關(guān)鍵詞包括事故致因和風(fēng)險(xiǎn)點(diǎn);
19、根據(jù)關(guān)鍵詞之間建立的耦合連接,得到事故致因強(qiáng)耦合關(guān)系對(duì)和風(fēng)險(xiǎn)點(diǎn)強(qiáng)耦合關(guān)系對(duì)。
20、在一個(gè)實(shí)施例中,根據(jù)詞頻統(tǒng)計(jì)分析技術(shù),對(duì)事故致因和風(fēng)險(xiǎn)點(diǎn)進(jìn)行詞頻分析,得到事故致因和風(fēng)險(xiǎn)點(diǎn)的重要度包括:
21、通過事故致因列表和風(fēng)險(xiǎn)點(diǎn)列表,進(jìn)行事故致因和風(fēng)險(xiǎn)點(diǎn)的詞頻統(tǒng)計(jì),得到每個(gè)事故致因和風(fēng)險(xiǎn)點(diǎn)的詞頻參數(shù);
22、根據(jù)詞頻參數(shù)降序排列,并通過柱狀圖展示;根據(jù)統(tǒng)計(jì)的每個(gè)關(guān)鍵詞的耦合連接數(shù),確定對(duì)應(yīng)關(guān)鍵詞在散點(diǎn)圖中的坐標(biāo),基于每個(gè)關(guān)鍵詞在散點(diǎn)圖中的坐標(biāo),確定相應(yīng)事故致因和風(fēng)險(xiǎn)點(diǎn)的重要度。
23、在一個(gè)實(shí)施例中,利用主題模型,并結(jié)合事故致因,對(duì)待分析的水上交通事故報(bào)告進(jìn)行場(chǎng)景分類,并構(gòu)建事故場(chǎng)景集包括:
24、確定主題模型的訓(xùn)練的參數(shù),包括詞頻放大系數(shù)、訓(xùn)練主題數(shù)及主題詞展示數(shù);對(duì)事故致因進(jìn)行詞頻放大,并將停用詞去除;
25、通過困惑度實(shí)驗(yàn),并觀察選取所需的場(chǎng)景數(shù)和放大系數(shù);利用語料庫(kù)對(duì)主題模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的主題模型;
26、結(jié)合場(chǎng)景數(shù)、放大系數(shù)及訓(xùn)練好的主題模型,得到事故場(chǎng)景集。
27、在一個(gè)實(shí)施例中,對(duì)事故致因進(jìn)行詞頻放大時(shí),詞頻放大公式為:;
28、式中,表示更新后的詞的詞頻,表示其原始詞頻;
29、表示某一個(gè)詞的詞頻增大系數(shù),表示事故致因集,k表示事故報(bào)告中的詞。
30、在一個(gè)實(shí)施例中,構(gòu)建事故場(chǎng)景集之后包括:
31、分類命名事故場(chǎng)景集中的每個(gè)場(chǎng)景;通過場(chǎng)景、事故致因、風(fēng)險(xiǎn)點(diǎn)關(guān)聯(lián)性分析,計(jì)算某個(gè)場(chǎng)景中事故致因和風(fēng)險(xiǎn)點(diǎn)之間的耦合度,通過預(yù)設(shè)閾值來建立耦合連接,并通過桑基圖進(jìn)行展示。
32、根據(jù)本發(fā)明實(shí)施例的第二方面,提供了一種水上交通事故調(diào)查報(bào)告處理分析系統(tǒng)。
33、在一個(gè)實(shí)施例中,所述水上交通事故調(diào)查報(bào)告處理分析系統(tǒng)包括:
34、關(guān)鍵詞提取模型訓(xùn)練模塊,用于利用水上交通事故文本數(shù)據(jù)對(duì)語言模型進(jìn)行預(yù)訓(xùn)練,以使語言模型獲取水上交通事故文本數(shù)據(jù)中的語義特征和語言模式,并得到關(guān)鍵詞提取模型;利用條件隨機(jī)場(chǎng)對(duì)關(guān)鍵詞提取模型的輸出進(jìn)行標(biāo)注;
35、耦合分析模塊,用于基于關(guān)鍵詞提取模型,對(duì)待分析的水上交通事故報(bào)告進(jìn)行事故致因和風(fēng)險(xiǎn)點(diǎn)的提取;利用相似度算法,計(jì)算各事故致因之間以及各風(fēng)險(xiǎn)點(diǎn)之間的關(guān)聯(lián)程度,并構(gòu)建耦合關(guān)系矩陣;利用耦合關(guān)系矩陣和耦合度閾值,篩選出事故致因強(qiáng)耦合關(guān)系對(duì)和風(fēng)險(xiǎn)點(diǎn)強(qiáng)耦合關(guān)系對(duì);
36、重要度分析模塊,用于根據(jù)詞頻統(tǒng)計(jì)分析技術(shù),對(duì)事故致因和風(fēng)險(xiǎn)點(diǎn)進(jìn)行詞頻分析,得到事故致因和風(fēng)險(xiǎn)點(diǎn)的重要度;
37、場(chǎng)景分類模塊,用于利用主題模型,并結(jié)合事故致因,對(duì)待分析的水上交通事故報(bào)告進(jìn)行場(chǎng)景分類,并構(gòu)建事故場(chǎng)景集。
38、根據(jù)本發(fā)明實(shí)施例的第三方面,提供了一種計(jì)算機(jī)設(shè)備。
39、在一些實(shí)施例中,所述計(jì)算機(jī)設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述方法的步驟。
40、根據(jù)本發(fā)明實(shí)施例的第四方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
41、在一個(gè)實(shí)施例中,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述方法的步驟。
42、本發(fā)明實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
43、(1)分析效率大幅提升:本發(fā)明設(shè)備通過自動(dòng)化的數(shù)據(jù)采集和智能分析算法,能夠快速處理大量事故報(bào)告,相比人工分析極大地縮短了分析周期,提高了水上交通安全管理的及時(shí)性和響應(yīng)速度。
44、(2)準(zhǔn)確性顯著增強(qiáng):借助先進(jìn)的大語言模型和優(yōu)化的算法,對(duì)事故致因和風(fēng)險(xiǎn)點(diǎn)的識(shí)別更加準(zhǔn)確全面,減少了遺漏和誤判,能夠更精準(zhǔn)地挖掘事故報(bào)告中的關(guān)鍵信息,為風(fēng)險(xiǎn)評(píng)估提供可靠依據(jù)。例如,在對(duì)復(fù)雜事故場(chǎng)景的分析中,能夠準(zhǔn)確識(shí)別出多種因素的耦合作用,而現(xiàn)有技術(shù)可能僅能發(fā)現(xiàn)部分明顯因素。
45、(3)定量分析更精確:通過余弦相似度等定量分析方法,不僅能確定事故致因和風(fēng)險(xiǎn)點(diǎn)之間的關(guān)聯(lián)關(guān)系,還能精確衡量其耦合程度和風(fēng)險(xiǎn)重要度,為水上交通風(fēng)險(xiǎn)的量化評(píng)估提供了有效手段,彌補(bǔ)了現(xiàn)有技術(shù)在定量分析方面的不足。
46、(4)結(jié)果可靠性高:本發(fā)明基于大量的事故數(shù)據(jù)和科學(xué)的算法模型,分析結(jié)果具有良好的穩(wěn)定性和一致性,不受人工主觀因素的影響,能夠?yàn)樗辖煌ò踩芾聿块T和航運(yùn)企業(yè)提供可信的決策支持,相較于傳統(tǒng)方法和部分簡(jiǎn)單的數(shù)據(jù)分析技術(shù),可靠性有了質(zhì)的飛躍。
47、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本發(fā)明。