本發明涉及事故致因分析,具體涉及一種自動駕駛與人工駕駛混行的事故嚴重程度預測方法。
背景技術:
1、在自動駕駛系統完全普及之前,自動駕駛與人工駕駛車輛混合行駛的交通狀況仍然是道路上的典型特征。然而,自動駕駛車輛在實際混行環境的運行中也暴露出諸多問題。針對歷年事故數據進行交通安全分析,構建事故嚴重程度預測模型,定量研究混行環境下的事故嚴重程度影響因素、評估自動駕駛車輛的安全效果,有助于制定針對性的改善策略,建立有效完備的事故預警機制,對于改善自動駕駛車輛上路條件,提高混合交通環境中的安全性,降低事故損失具有重要意義。
2、從數據角度來看,道路交通系統由“人、車、道路、環境”四大要素構成,交通事故通常是這些要素的故障而導致的隨機事件。這些要素的相互作用作用決定了事故的發生、發展及其后果。因此,在構建混行環境下的事故嚴重程度預測模型時,需要以自動駕駛車輛和人工駕駛車輛為出發點,研究其在行駛過程中的行為變化,追溯其成因,并分析影響車輛行為的道路特征和建成環境等因素,以實現對事故嚴重程度的精準預測。然而,現有的自動駕駛事故數據存在關鍵變量缺失的問題,導致無法全面挖掘影響事故嚴重程度的因素。此外,現有數據集的樣本量較少,且存在數據缺失或未經驗證的問題,從而導致現有模型的泛化能力較差,難以反應真實場景中的性能。
3、在方法層面來看,現有的交通安全分析方法通常將自動駕駛事故與人工駕駛事故的嚴重程度作為獨立的分析單元,采用logit和probit回歸模型,以及它們的擴展模型進行事故預測,分析事故嚴重程度與各個影響因素之間的關系。然而,在混行環境中,某些因素可能同時影響自動駕駛車輛事故與人工駕駛車輛事故的嚴重程度,現有單一模型往往忽略了這兩類車輛之間事故嚴重程度的相互關系。此外,現實中的事故背景因素復雜多樣,無法完全收集并量化所有可能影響事故嚴重程度的因素,進而引入了未觀察到的異質性。現有的混合環境下事故嚴重程度預測方法忽略了不同類型車輛之間的相互關系及數據集中的未觀察到異質性,導致模型參數估計存在偏差。
技術實現思路
1、針對現有技術中的上述不足,本發明提供了一種自動駕駛與人工駕駛混行的事故嚴重程度預測方法。
2、為了達到上述發明目的,本發明采用的技術方案為:
3、一種自動駕駛與人工駕駛混行的事故嚴重程度預測方法,包括以下步驟:
4、獲取自動駕駛與人工駕駛混行環境下的交通事故數據;
5、根據交通事故數據中的事故位置,提取事故位置點的道路交通特征和建成環境特征;
6、將交通事故數據與事故位置點的道路交通特征和建成環境特征進行匹配,建立自動駕駛與人工駕駛交通事故特征變量數據集;
7、根據自動駕駛與人工駕駛交通事故特征變量數據集,基于機器學習篩選交通事故嚴重程度影響特征變量;
8、根據交通事故嚴重程度影響特征變量,構建混行環境下自動駕駛與人工駕駛事故嚴重程度的聯合預測模型進行事故嚴重程度預測。
9、進一步地,獲取自動駕駛與人工駕駛混行環境下的交通事故數據包括:
10、根據歷史自動駕駛事故數據提取自動駕駛事故特征信息,并為每起自動駕駛事故設置一個獨立的事故編碼;其中事故特征包括事故時間、事故地點、碰撞類型、車輛特征、自然環境條件以及事故詳情描述;
11、根據事故地點和事故詳情描述定位事故位置,并轉換為地球坐標系下的經緯度坐標;
12、根據歷史人工駕駛事故數據提取人工駕駛事故特征信息;
13、根據自動駕駛事故特征信息和人工駕駛事故特征信息在設定的第一緩沖區內篩選所有與自動駕駛事故具有相同道路特征和建成環境特征的人工駕駛事故,并選擇與自動駕駛事故最近的人工駕駛事故進行配對,生成自動駕駛與人工駕駛混行環境下的交通事故數據。
14、進一步地,根據交通事故數據中的事故位置,提取事故位置點的道路交通特征和建成環境特征,包括:
15、根據交通事故數據中的事故位置,提取事故位置點的道路特征信息;其中道路特征包括交叉口類型、交通控制設施類型、中央分隔設施類型、車道數量、人行橫道及路邊停車位;
16、根據交通事故數據中的事故位置,提取事故位置點的道路屬性信息;其中道路屬性包括道路名稱、道路等級、限速、車道數量及單向道路;
17、根據交通事故數據中的事故位置,提取事故位置點在設定的第二緩沖區內的建成環境信息;其中建成環境包括土地利用類型、公園、餐廳、學校、公交站和地鐵站、醫院及購物中心。
18、進一步地,將交通事故數據與事故位置點的道路交通特征和建成環境特征進行匹配,建立自動駕駛與人工駕駛交通事故特征變量數據集,包括:
19、根據事故編碼和經緯度坐標,將自動駕駛事故特征信息、人工駕駛事故特征信息、道路特征信息、道路屬性信息和建成環境信息進行匹配,建立自動駕駛與人工駕駛交通事故特征變量數據集。
20、進一步地,根據自動駕駛與人工駕駛交通事故特征變量數據集,基于機器學習篩選交通事故嚴重程度影響特征變量,包括:
21、根據自動駕駛與人工駕駛交通事故特征變量數據集,以自動駕駛事故與人工駕駛事故的嚴重程度為目標變量,以事故特征、道路特征和建成環境特征為特征變量,構建隨機森林模型;
22、在隨機森林的每棵決策樹中,使用基尼指數衡量特征變量在節點分裂時對事故嚴重程度的分類貢獻,通過特征變量將節點樣本分裂為兩個子集,并計算分裂后節點基尼指數的變化量;
23、遍歷隨機森林中的所有決策樹,累加特征變量在每個節點分裂中引起的基尼指數變化量,得到特征變量在隨機森林中對于事故嚴重程度分類效果的特征變量重要性;
24、將所有特征變量重要性進行標準化,得到各個特征變量對于事故嚴重程度的相對重要性;
25、對特征變量按照相對重要性從高到低進行排序,根據排名在前第一數量的特征變量計算累計貢獻比例,并根據特征變量的累計貢獻比例和設定閾值確定交通事故嚴重程度影響特征變量。
26、進一步地,分裂后節點基尼指數的變化量的計算方式為:
27、
28、其中,δgini(xj)為分裂后節點基尼指數的變化量,gini(d)為節點樣本d的基尼指數,|dl|為分裂后子節點數據集dl的大小,|dr|為分裂后子節點數據集dr的大小,|d|為當前節點數據集d的大小,gini(dl)為子節點數據集dl的基尼指數,gini(dr)為子節點數據集dr的基尼指數,xj為第j個特征變量。
29、進一步地,特征變量的累計貢獻比例的計算方式為:
30、累加排名在前第一數量的特征變量,并計算累加特征變量之和與所有特征變量之和的比值,得到特征變量的累計貢獻比例。
31、進一步地,根據交通事故嚴重程度影響特征變量,構建混行環境下自動駕駛與人工駕駛事故嚴重程度的聯合預測模型進行事故嚴重程度預測,包括:
32、以自動駕駛事故與人工駕駛事故的嚴重程度為因變量,以交通事故嚴重程度影響特征變量為自變量,構建隨機參數雙變量probit模型;
33、假定模型中自變量的回歸系數在不同的事故樣本之間隨機變化,設定新的自變量回歸系數;
34、根據自變量和新的自變量回歸系數建立所有事故數據的聯合概率密度函數,并轉化為對數似然函數;
35、采用準蒙特卡羅方法近似計算對數似然函數中的積分;
36、基于近似的對數似然函數,使用梯度下降法迭代估計參數;
37、通過多次迭代優化,直到對數似然函數收斂,得到最終每個特征變量對于事故嚴重程度分類的系數值。
38、進一步地,采用準蒙特卡羅方法近似計算對數似然函數中的積分具體為:
39、
40、其中,為聯合概率密度函數,yi1為第i個樣本中與自動駕駛事故嚴重程度分類結果相關的目標隨機變量,yi2為第i個樣本中與人動駕駛事故嚴重程度分類結果相關的目標隨機變量,xi為與第i個樣本嚴重程度相關的事故特征、道路特征和建成環境變量,表示第i個樣本中與自動駕駛事故嚴重程度相關的隨機參數,是表示i個樣本中與人工駕駛事故嚴重程度相關的隨機參數,σ為自動駕駛與人工駕駛事故嚴重程度之間的協方差矩陣,m為模擬抽樣次數。
41、進一步地,基于近似的對數似然函數,使用梯度下降法迭代估計參數,具體為:
42、
43、其中,和分別為第t+1輪迭代時隨機參數βi′,1的均值和方差,和分別為第t輪迭代時隨機參數βi′,1的均值和方差,η為學習率,為對數似然函數的梯度。
44、本發明具有以下有益效果:
45、(1)本發明從多個數據源獲取自動駕駛與人工駕駛混行環境下的交通事故數據,并對事故發生位置的道路特征和建成環境特征進行匹配,構建完整的事故特征數據集,以解決現有數據量不足、缺少關鍵特征變量的問題。
46、(2)本發明結合自動駕駛與人工駕駛混行環境,構建一個聯合的事故嚴重程度預測模型。該模型能夠分析事故特征、道路特征和建成環境特征對事故嚴重程度的影響機理,并通過克服現有模型忽略因變量之間相關性和數據集中未觀察到的異質性問題,提升預測精度和模型的擬合優度。