麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種卡口運行狀態量化評估方法及系統的制作方法

文檔序號:10688309閱讀:513來源:國知局
一種卡口運行狀態量化評估方法及系統的制作方法
【專利摘要】本發明涉及一種卡口運行狀態量化評估方法及系統,通過對卡口系統產生的過車記錄數據質量進行全面、量化的評估,將卡口運行狀態直觀化;同時實現了卡口運行狀態可視化展示系統,為使用者提供簡單直觀的結果展現,為卡口數據的使用提供數據化的參考依據。
【專利說明】
一種卡口運行狀態量化評估方法及系統
技術領域
[0001] 本發明涉及智慧交通領域,尤其涉及一種卡口運行狀態量化評估方法及系統。
【背景技術】
[0002] 車輛智能監測記錄系統又稱為卡口系統(以下簡稱卡口系統),是能夠對受監控路 面的車輛信息進行自動采集和處理的設備,主要以機動車圖片抓拍、車牌號牌識別等車輛 特征數據采集,布控比對報警,查報站出警攔截為主要目的,對道路運行車輛的構成、流量 分布,違章情況進行常年不間斷的自動記錄,為交通違法、交通事故、交通管理、交通規劃、 道路養護提供重要的技術手段和基礎的運行數據。然而,在實際交通信息采集過程中,由于 卡口系統的故障、檢測環境的變化、人為操作不當等種種因素的影響,往往獲取的卡口數據 存在數據丟失、識別錯誤等質量問題。若直接使用這些問題數據推斷當前交通流運行狀態 和違法行為,必然會引起與實際情形存在差距的誤判。這樣不僅不能為快速緩解交通流量 分布、快速糾正交通違法行為、快速偵破交通事故等提供重要的技術手段和證據,達不到決 策支持的預期效果,反而可能導致路網更嚴重的交通擁堵以及滋生更多的交通違法行為。
[0003] 目前大多數研究主要集中在基于卡口數據挖掘的研究與應用方面,如緝查防控應 用、涉案車輛排查、旅行時間計算、交通流量分析、圖像分析等。而真正對于卡口系統本身運 行狀態的研究與應用相關的文獻資料涉及較少。同時,由于卡口系統相關的標準滯后,各地 建設與驗收過程中對卡口系統的交通數據的采集與上傳,缺乏較全面的具有可操作性的質 量要求與質量管控,在大規模的卡口數據應用過程中暴露出很多質量問題。因此,本發明提 出一種卡口運行狀態量化評估方法及系統,以實際卡口系統在運行過程中輸出的過車記錄 數據為研究基礎,從數據的缺失性和錯誤性兩大關鍵指標分析卡口數據質量問題,并將分 析結果可視化展示。

【發明內容】

[0004] 本發明為克服上述的不足之處,目的在于提供一種卡口運行狀態量化評估方法, 通過對過車記錄數據質量進行全面、量化的評估,將卡口運行狀態直觀化;同時實現了卡口 運行狀態可視化展示系統,為使用者提供簡單直觀的結果展現,為卡口數據的使用提供數 據化的參考依據。
[0005] 本發明另一目的在于提供一種卡口運行狀態量化評估系統,包括數據采集單元、 數據存儲單元、數據分析單元、結果存儲單元、應用服務器單元、Web端展現單元;本系統結 構簡單,易于實施。
[0006] 本發明是通過以下技術方案達到上述目的:一種卡口運行狀態量化評估方法,包 括如下步驟:
[0007] (1)設置卡口數據的統計周期;
[0008] (2)以統計周期為時間單位計算得到卡口數據的缺失性指標與錯誤性指標;其中, 所述缺失性指標衡量數據的缺失程度,并通過數據量分布的均衡度表示數據的缺失性,均 衡度采用信息熵來計算;所述錯誤性指標是基于卡口的識別錯誤率與識別正確率表征得 到;
[0009] (3)根據卡口數據的缺失性指標與錯誤性指標分析卡口數據質量,輸出卡口評估 結果。
[0010] 作為優選,所述缺失性指標的計算方法如下:
[0011] 1)篩選出統計周期內無任何過車記錄的卡口,將此類卡口的缺失性指標設為1;
[0012] 2)采用信息熵計算有過車記錄的卡口數據量均衡度U1、最大均衡度Umax_ 1;
[0013] 3)以實際的卡口數據量均衡度均值除以該卡口數據量最大均衡度定義得到歸一 化均衡度U in;
[0014] 4)將卡口的歸一化均衡度1^的計算結果轉化為該卡口的數據缺失性指標Iiack_i, 對卡口的缺失性指標進行降序排列,取排名前Kl的卡口。
[0015] 作為優選,所述卡口數據量均衡度仏的計算方法如下:
[0016] I)將一天劃分為η個時間槽,設Nijk為卡口 i在第j天第k個時間槽卡口數據記錄數 量,卡口 i在統計周期內第k個時間槽卡口數據總量為Sunuk,則該卡口在第j天第k個時間槽 卡口數據量在統計周期內的占比為
[0017] II)以Uik表示卡口 i統計周期內第k個時間槽卡口數據量的均衡度,采用信息熵計 算均衡度:
[0018]
[0019] III)由步驟II)均衡度計算結果得到η個時間槽的通行卡口數據量均衡度的均值 表達式如下:
[0020]
[0021 ]通過表達式計算得到卡口數據量均衡度Ui。
[0022]作為優選,所述卡口 i在統計周期內的某一相同時間槽卡口數據量平均分布,則采 用最大信息熵Umax_i表達卡口數據量的最大均衡度Umax_i,表達式為:Umax_i = log T,其中T為 統計周期天數。
[0023]作為優選,所述歸一化均衡度Uin的計算公式如下:
[0024]
[0025] 其中,Uin的取值范圍為(0,1]。
[0026] 作為優選,所述將卡口的歸一化均衡度Uin的計算結果轉化為該卡口的數據缺失性 指標Ikkj的轉化公式如下:
[0027] IlacM = I-Uin
[0028] 其中,Ilac^i值越大表示卡口數據缺失程度越大。
[0029] 作為優選,所述錯誤性指標的計算方法如下:
[0030] i)定義卡口號牌識別錯誤率為卡口 i過車記錄中號牌號碼與車輛注冊信息表中號 牌號碼不一致的記錄數Sumer^1除以該卡口過車總記錄數Sum1,則統計周期內卡口號牌識別 錯誤率計算公式如下:
[0031]
[0032] 計算后將得到的每個卡口數據錯誤率降序排列,取錯誤率最高的前K2個卡口;
[0033] ii)根據步驟(1)的計算結果計算統計周期內所有卡口號牌綜合識別準確率,所有 卡口號牌綜合識別準確率Ra?表達式如下:
[0034
[0035] 其中,m為卡口總數量;
[0036] iii)將卡口的工作時間段分為白天與夜間,計算統計周期內所有卡口白天與夜間 過車記錄數分別為Sum day,Sumnight;所有卡口白天與夜間號牌識別錯誤記錄數分別為 Sumerr_d ay,Sumerr_night;得到所有卡口號牌白天識別準確率R ac;u_day表達式為:
聽有卡口號牌夜間識別準確表達式為 ;i V)由步驟i i i)表達式計算得到統計周期內所有卡口號牌 白天識別準確率和夜間號牌識別準確率。
[0037] 作為優選,所述的輸出卡口評估結果包括各卡口數據缺失性排名,各卡口各時間 段的過車記錄數,各卡口數據錯誤率排名,各卡口車牌識別錯誤率排名,所有卡口號牌綜合 識別準確率、白天識別準確率、夜間識別準確率及同比與環比分析信息。
[0038] -種卡口運行狀態量化評估系統,包括:數據采集單元、數據存儲單元、數據分析 單元、結果存儲單元、應用服務器單元、Web端展現單元;數據采集單元、數據存儲單元、數據 分析單元、結果存儲單元、應用服務器單元、Web端展現單元依次連接。
[0039] 作為優選,所述數據分析單元包括周期設置子單元和指標計算子單元,該單元用 于完成對卡口運行狀態的量化評估,從缺失性和錯誤性兩個指標對卡口過車記錄數據進行 分析,得到卡口的運行狀態量化評估結果。
[0040] 本發明的有益效果在于:1)結果直觀、簡明,本發明系統采用可視化展現方式,將 評估結果轉換為圖形圖像顯示,可以直觀地了解影響問題卡口設備的關鍵指標,提示用戶 有針對性地干預,從而降低卡口系統運維風險;且運算方便、快捷;2)可靠性強,本發明系統 分別提供卡口數據識別錯誤率和缺失性指標排名;3)新穎和靈活,本發明方法采用信息熵 評價卡口數據量均衡度,并對計算參數歸一化處理,從而得到卡口數據缺失性。該方法實現 上比較新穎。同時,在評估系統中支持靈活的統計周期查詢,在一定程度上滿足用戶對卡口 設備運行狀態檢測。
【附圖說明】
[0041 ]圖1是本發明評估系統原理圖;
[0042] 圖2是本發明評估方法流程圖;
[0043] 圖3是本發明實施例的卡口運行狀態量化評估結果可視化展示圖。
【具體實施方式】
[0044]下面結合具體實施例對本發明進行進一步描述,但本發明的保護范圍并不僅限于 此:
[0045]實施例:如圖1所示,一種卡口運行狀態量化評估系統,包括數據采集單元、數據存 儲單元、數據分析單元、結果存儲單元、應用服務器單元、Web端展現單元具體內容如下: [0046]數據采集單元:從卡口數據原始存放位置采集杭州市2014年9月到2015年9月的卡 口過車記錄數據及過車圖片,過車記錄包括卡口編號、卡口方向、過車時間、車牌號碼、車牌 類型等信息。
[0047]數據存儲單元:存儲采集的卡口過車記錄數據和過車圖片,本發明采用HBase的非 結構化數據存儲模式保存海量的卡口元數據,為后續的數據質量分析單元提供數據來源。
[0048] 數據分析單元:包括周期設置子單元和指標計算子單元。該單元完成對卡口運行 狀態的量化評估,主要從缺失性和錯誤性兩個指標對卡口過車記錄數據進行分析,得到卡 口的運行狀態量化評估結果。
[0049] 結果存儲單元:用于存儲數據分析單元輸出的分析結果,實現源數據與分析結果 分開存儲;本發明采用Orac Ie數據庫存儲。
[0050] 應用服務器單元:用于用戶通過Web服務器對相關分析結果的查詢、統計、分析與 打印等工作。
[0051] WEB端展現單元:實現評估結果可視化展現和圖片驗證功能。
[0052] 一種卡口運行狀態量化評估方法如圖2所示,包括如下步驟:
[0053] 步驟1:周期設置。設置統計周期為1個月,選用杭州市2015年9月份卡口過車記錄 作為待分析數據。進一步說明,在步驟2中,采用2015年9月24日早上8點到9點(即第9個時間 槽)的卡口數據具體說明。
[0054]步驟2:計算缺失性指標
[0055] (1)篩選統計周期內未工作的卡口
[0056] 篩選出統計周期內無任何過車記錄的卡口設備,將未工作卡口缺失性指標設為1。
[0057] (2)計算數據均衡度
[0058]在統計周期30天,按照1個小時為時間粒度,每天可劃分為24個時間槽。若車輛通 行時間顯示0:00-1:00時刻得到的一條卡口數據,即將這時間段卡口數據定義為第一個時 間槽得到的數據。其他時間槽的時間段劃分以此類推,具體如表1所示: LUUOU」 衣丄
[0061 ] 例如,統計卡口(編號310003000017)在9月24日第8個時間槽卡口數據量為3268 條,統計該卡口在本年9月每天第8個時間槽通過的卡口數據總數量為36087條。則該卡口在 9月24日第8個時間槽采集到的數據量在統計周期內的占比為== ().0()1.此按照以上 計算方法,可依次計算整個統計月份在每個時間槽內的占比。
[0062] 30天內8點到9點的卡口數據量為:
[0063] [2744,2919,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,3078,2608,2209,3083,2738, 3060,3268,3160,2439,1731,3050,0]
[0064] 考慮到后續對數計算中的數值問題,即對數函數的輸入不能為0,將總卡口數量加 一個微小的常數〇. 00003,同時將每天的時間槽數據占比加0.000001。于是30天內該卡口在 第9個時間槽的數據量每天占比分別為:
[0065] [0·076,0·081,2·77e-9,2·77e-9,2·77e-9,2·77e-9,2·77e-9,2·77e-9,2·77e-9, 2·77e-9,2·77e-9,2·77e-9,2·77e-9,2·77e-9,2·77e-9,2·77e-9,2·77e-9,0·085,0·072, 0.061,0.085,0.076,0.084,0.091,0.088,0.068,0.048,0.085,2.77e-9]
[0066] 采用以2為底的對數函數,可得到目標卡口在第9個時間槽的數據均衡度為:
[0067] 按照上述步驟,依次得到該卡口所有時間槽內數據均衡度分別為:
[0068] [3.8378,3.8545,3.7781,3.8711,3.850,3.8211,3.745,3.8110,3.6824,3.6892, 3.6623,3.6988,3.7953,3.6882,3.6532,3.654,3.9921,3.8762,3.693,3.8968,3.6685, 3.6542,3.6624,3.8354]
[0069] 因此,計算得到卡口數據量均衡度的均僅
[0070] (3)計算最大均衡度 [0071]采用以2為底的對數函數:
[0072] Umax-i = Iog N= log(30)=4.9069
[0073] (4)計算歸一化均衡度
[0074] 卡口(編號310003000017)數據量歸一化均衡度:
[0075]
[0076] (5)計算卡口缺失性指標
[0077] 卡口(編號310003000017)數據量的缺失性指標Iiack_i:
[0078] IiacM = I-Uin= 1-0 · 7674 = 0.2326
[0079] (6)卡口數據缺失性指標排序
[0080] 根據上述步驟,可得到所有卡口數據缺失性指標,將其卡口數據缺失性指標按從 高到低排列。排名越靠前的卡口缺失性指標越高,越值得關注。前排名前Kl的卡口,本發明 Kl 取 15。
[0081 ]步驟3:計算錯誤性指標
[0082] (1)計算統計周期內卡口號牌識別錯誤率
[0083] 統計卡口(編號310003000017)30天的過車總記錄數為696354條,而卡口過車記錄 中識別的車牌號牌與杭州市車輛信息注冊表中號牌不一致的記錄數為:以"浙A"開頭的車 牌識別錯誤的記錄數為564條,車牌號碼出現"未識別"的記錄數為19884條,則該卡口號牌 識別錯誤記錄數Sumerr_iS20448條。
[0084] 閔此,得剞該卡口號牌iR別錯誤鑾為,
[0085]
[0086] 按照上述步驟可得到所有卡口數據錯誤率,對其進行降序排列。排名越靠前的卡 口缺失率越高,越值得關注。取排名前K2的卡口,本發明K2取15。
[0087] (2)計算統計周期內所有卡口號牌綜合識別準確率
[0088] 根據步驟(1)計算結果,得到所有卡口號牌綜合識別準確率為
[0089] (3)計算統計周期內所有卡口號牌白天識別準確率和夜間號牌識別準確率
[0090] 在本發明實施例中,白天時間段指6點到18點,夜間時間段指18點到第二天6點。經 統計,白天卡口數據記錄數Sumday為58696466條,白天號牌識別錯誤記錄數N err_day為 2101333條;夜間卡口數據記錄數Sumnight為23910429條,夜間號牌識別錯誤記錄數Nerr_ night 為 1119008條。
[0091] 則所有卡口號牌白天識別準毎
;所有卡口號 牌夜間識別錯誤」
[0092]以卡口識別錯誤率和識別正確率表征卡口的錯誤性指標。
[0093]步驟4:根據卡口數據的缺失性指標與錯誤性指標分析卡口數據質量,輸出卡口評 估結果。
[0094]其中,輸出卡口評估結果包括:
[0095] 1、以統計周期定時更新推送評估結果,以文本框形式顯示統計周期號牌綜合識別 準確率、白天識別準確率、夜間識別準確率及同比與環比分析;其中同比為與一年前相同統 計周期計算結果對比值,環比為與上一統計周期計算結果對比值。
[0096] 2、以進度條形式顯示卡口號牌識別錯誤率排名,降序排列,點擊排名中某行可定 位到左邊的地圖上該卡口,并支持圖片驗證功能;
[0097] 3、以地圖標識各卡口位置,以圓圈大小和顏色深淺標識車牌識別錯誤率排名前15 的卡口;
[0098] 4、以進度條形式降序顯示卡口號牌綜合識別缺失性排名前15的卡口,點擊排名中 某行可在左邊顯示該卡口過車記錄數情況;
[0099] 5、以像素圖表示統計周期內每天各時段的卡口過車記錄數情況,結合卡口缺失性 排名直觀展示卡口數據量異常變化情況。
[0100]以上的所述乃是本發明的具體實施例及所運用的技術原理,若依本發明的構想所 作的改變,其所產生的功能作用仍未超出說明書及附圖所涵蓋的精神時,仍應屬本發明的 保護范圍。
【主權項】
1. 一種卡口運行狀態量化評估方法,其特征在于包括如下步驟: (1) 設置卡口數據的統計周期; (2) 以統計周期為時間單位計算得到卡口數據的缺失性指標與錯誤性指標;其中,所述 缺失性指標衡量數據的缺失程度,并通過數據量分布的均衡度表示數據的缺失性,均衡度 采用信息熵來計算;所述錯誤性指標是基于卡口的識別錯誤率與識別正確率表征得到; (3) 根據卡口數據的缺失性指標與錯誤性指標分析卡口數據質量,輸出卡口評估結果。2. 根據權利要求1所述的一種卡口運行狀態量化評估方法,其特征在于:所述缺失性指 標的計算方法如下: 1) 篩選出統計周期內無任何過車記錄的卡口,將此類卡口的缺失性指標設為1; 2) 采用信息熵計算有過車記錄的卡口數據量均衡度U、最大均衡度; 3) 以實際的卡口數據量均衡度均值除以該卡口數據量最大均衡度定義得到歸一化均 衡度Uin; 4 )將卡口的歸一化均衡度Uin的計算結果轉化為該卡口的數據缺失性指標11 ac;k_i,對卡 口的缺失性指標進行降序排列,取排名前K1的卡口。3. 根據權利要求2所述的一種卡口運行狀態量化評估方法,其特征在于:所述卡口數據 量均衡度仏的計算方法如下: I) 將一天劃分為η個時間槽,設Nijk為卡口 i在第j天第k個時間槽卡口數據記錄數量,卡 口 i在統計周期內第k個時間槽卡口數據總量為Sunuk,則該卡口在第j天第k個時間槽卡口數 據量在統計周期內的占比II) 以Ulk表示卡口 i統計周期內第k個時間槽卡口數據量的均衡度,采用信息熵計算均 衡度:III) 由步驟II)均衡度計算結果得到η個時間槽的通行卡口數據量均衡度的均值表達 式如下:通過表達式計算得到卡口數據量均衡度U。4. 根據權利要求2所述的一種卡口運行狀態量化評估方法,其特征在于:所述卡口 i在 統計周期內的某一相同時間槽卡口數據量平均分布,則采用最大信息熵表達卡口數據 量的最大均衡度Umax_i,表達式為:U max_i = logT,其中T為統計周期天數。5. 根據權利要求2所述的一種卡口運行狀態量化評估方法,其特征在于:所述歸一化均 衡度Uin的計算公式如下:其中,Uin的取值范圍為(0,1]。6. 根據權利要求2所述的一種卡口運行狀態量化評估方法,其特征在于:所述將卡口的 歸一化均衡度υιη的計算結果轉化為該卡口的數據缺失性指標的轉化公式如下: I lacki- 1-Uin 其中,Iiac;k_i值越大表示卡口數據缺失程度越大。7. 根據權利要求1所述的一種卡口運行狀態量化評估方法,其特征在于:所述錯誤性指 標的計算方法如下: i)定義卡口號牌識別錯誤率為卡口 i過車記錄中號牌號碼與車輛注冊信息表中號牌號 碼不一致的記錄數Sumerrj除以該卡口過車總記錄數Sunn,則統計周期內卡口號牌識別錯誤 率計算公式如下:計算后將得到的每個卡口數據錯誤率降序排列,取錯誤率最高的前K2個卡口; i i)根據步驟(1)的計算結果計算統計周期內所有卡口號牌綜合識別準確率,所有卡口 號牌綜合識別準確率R_表達式如下:其中,m為卡口總數量; i i i)將卡口的工作時間段分為白天與夜間,計算統計周期內所有卡口白天與夜間過車 記錄數分別為Sumday,Sumnight;所有卡□白天與夜間號牌識別錯誤記錄數分別為Sumerr_day, S u m e r r _ n i g h t ;得到所有卡口號牌白天識別準確率R a。u _ d a y表達式為:所有卡口號牌夜間識別準確表達式為i v)由步驟i i i)表達式計算得到統計周期內所有卡口號牌 白天識別準確率和夜間號牌識別準確率。8. 根據權利要求1所述的一種卡口運行狀態量化評估方法,其特征在于:所述的輸出卡 口評估結果包括各卡口數據缺失性排名,各卡口各時間段的過車記錄數,各卡口數據錯誤 率排名,各卡口車牌識別錯誤率排名,所有卡口號牌綜合識別準確率、白天識別準確率、夜 間識別準確率及同比與環比分析信息。9. 一種卡口運行狀態量化評估系統,其特征在于包括:數據采集單元、數據存儲單元、 數據分析單元、結果存儲單元、應用服務器單元、Web端展現單元;數據采集單元、數據存儲 單元、數據分析單元、結果存儲單元、應用服務器單元、Web端展現單元依次連接。10. 根據權利要求9所述的一種卡口運行狀態量化評估系統,其特征在于:所述數據分 析單元包括周期設置子單元和指標計算子單元,該單元用于完成對卡口運行狀態的量化評 估,從缺失性和錯誤性兩個指標對卡口過車記錄數據進行分析,得到卡口的運行狀態量化 評估結果。
【文檔編號】G08G1/01GK106056912SQ201610619736
【公開日】2016年10月26日
【申請日】2016年7月29日
【發明人】李建元, 張云云, 李丹, 應康平, 陳濤
【申請人】浙江銀江研究院有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 建瓯市| 惠东县| 普定县| 德阳市| 乡城县| 瓮安县| 汉寿县| 桦甸市| 富蕴县| 疏附县| 东方市| 丰县| 武威市| 中方县| 建宁县| 出国| 广宁县| 石景山区| 临桂县| 固镇县| 红河县| 进贤县| 永平县| 海城市| 营山县| 宁德市| 永胜县| 准格尔旗| 景泰县| 延津县| 高台县| 图木舒克市| 乐东| 广昌县| 靖西县| 平凉市| 潞西市| 错那县| 石渠县| 阳春市| 武隆县|