本發明涉及計算機應用技術領域,尤其涉及一種應用于國土資源視頻監控系統中對特定違章建筑的識別預警方法。
技術背景
作為現有成熟網絡視頻監控技術的一種行業應用,國土資源的視頻監控體系一般也包含了前端視頻信息采集,視頻編碼網絡傳輸,信息中心的操控管理與數據處理,其體系如附圖1所示。在實際的項目建設中,隨著監控點的數量迅速增多,對于人工值守盯看將面臨海量的視頻或抓拍圖像信息,監管人員面臨數量眾多的監控圖像難免會疏忽遺漏重要的信息,視覺疲勞也會使得監管效果不如人意。
基于圖像分析與處理的智能監控是未來視頻監控的發展方向,可以早發現、早預警,同時可實現大范圍監控的無人值守。對于國土資源的視頻監控系統而言,視頻監控及圖像抓拍系統的主要功能之一就是要對監控范圍內出現的一些違法行為或違章建筑進行及時的發現及預警,便于工作人員及時作出相應的處理。反應到系統中的核心技術問題就是要對特定監控點抓拍到的圖像進行特定物體的識別。基于圖像處理的物體識別基本上都使用了機器學習方法。為了改善這些方法的性能,通常需要收集更大的數據集,并構建強有力的模型以及防止過擬合。但是現實環境中的同一類物體通常也會表現出復雜的形態,因此要達到好的識別效果就必須使用龐大而準確的訓練集。
卷積神經網絡cnn是深度學習中經典而常用的模型之一,r-cnn(regionswithconvolutionalneuralnetworkfeatures)是基于深度學習的物體檢測領域中一種經典算法,alexnet網絡模型是2012年以來最成功的卷積神經網絡模型之一,其在公開的pascol_voc數據集上取得了優異的檢測效果。alexnet中包含一些既新鮮而又不同尋常的特征,它們提高了網絡的性能,并減少了網絡的訓練時間。alexnet網絡包含五個卷積層和三個全連接層(見附圖2)。
技術實現要素:
本發明的目的是針對現有視頻監控系統在國土資源監測中的應用,提供一種基于快速r-cnn物體識別的方法,用于國土資源視頻監控系統中早期發現特定的違章建筑,從而達到及時預警的效果。
本發明所采用的技術方案是:一種國土資源視頻監控系統中基于特定違章建筑識別預警方法,其特征在于,包括以下步驟:
步驟1:基于國土資源監控視頻,對每一張視頻圖像,劃分需要預警的區域并記錄區域左上角的坐標(m,n)和右下角的坐標(x,y),將劃分需要預警的區域作為檢測樣本;
步驟2:構建包括若干建筑物圖片的訓練集,利用訓練集基于alexnet卷積神經網絡訓練關于建筑的cnn模型,并使用cnn模型的對于訓練集的輸出訓練softmax分類器;
步驟3:對檢測樣本進行去霧化處理;
步驟4:使用selectivesearch算法在檢測樣本中提取若干個候選區域,將每個候選區域歸一化到m×m×l,其中m的取值范圍為100-250,l為r/g/b三通道;然后在步驟2中訓練好的cnn模型中正向傳播,提取最后一層的特征向量;
步驟5:使用步驟2中訓練好的softmax分類器對步驟4中提取的特征向量進行打分,得到步驟4中提取的候選區域對于建筑的分數s,若該分數s大于閾值t的話,則標記該候選區域為建筑物;
步驟6:對標記出的候選區域使用非極大值抑制nms法去除交叉多余的框,若一段連續時間該候選區域未標記出建筑而當前圖片檢測出建筑,則判定該建筑為違章建筑并預警。
相對于現有技術,本發明的技術效果是:
1.相比于傳統的網絡視頻監控,本發明可以有效的降低網絡流量所帶來的費用。同時本發明實現了自動化、智能化的違章建筑預警,可實現大范圍監控的無人值守;
2.本發明對回傳的圖片做了去霧化的處理,可以有效的增加識別的準確率。
附圖說明
圖1為本發明實施例的應用系統架構模型;
圖2為本發明實施例中alexnet網絡架構模型;
圖3為本發明的流程圖。
具體實施方式
為了便于本領域普通技術人員理解和實施本發明,下面結合附圖及實施例對本發明作進一步的詳細描述,應當理解,此處所描述的實施示例僅用于說明和解釋本發明,并不用于限定本發明。
本發明為針對國土視頻監測系統,采用特定的圖像采集策略獲取相應的圖片集以后,再基于快速r-cnn訓練出違章建筑模型,對各個監控點做建筑識別,若連續一段時間該地區無建筑而當前照片識別出建筑,則判定該建筑為違章建筑。
一種基于快速r-cnn物體識別的國土資源監控預警方法,通過在前端對監控云臺進行設定,每天在固定的角度,以固定的攝像參數在預設的特定時間點進行圖片抓拍回傳。在連續采集定點抓拍圖片之后,系統將針對此圖片序列進行基于以下算法的物體識別,在所有圖片序列中找出可能有違章建筑的圖片進行標記,作為系統輸出,形成預警依據,同時將標記處的違章建筑加入訓練集。
輸入:在某個待識別的固定預置位,在預定時間點(如6:00、14:00、22:00)依次抓拍圖片回傳(也可錄制一段視頻,然后對視頻流按一定的間隔頻率,如每隔5幀截取一幀,進行截取,并對各個前端監控點的來源分配唯一的id號作為分組依據,同時加蓋時間戳以區分同一id下不同時間節點的視頻幀組),輸入回傳的圖片。
輸出:在訓練好的cnn網絡上識別圖片中的違章建筑,并標記出來作為算法的輸出。
請見圖3,本發明提供的一種國土資源視頻監控系統中基于特定違章建筑識別預警方法,包括以下步驟:
步驟1:基于國土資源監控視頻,對每一張視頻圖像,劃分需要預警的區域并記錄區域左上角的坐標(m,n)和右下角的坐標(x,y),將劃分需要預警的區域作為檢測樣本;
步驟2:構建包括1000-2000張建筑物的訓練集,利用訓練集基于alexnet卷積神經網絡訓練關于建筑的cnn模型,并使用cnn模型的對于訓練集的輸出訓練softmax分類器;
具體實現包括以下子步驟:
步驟2.1:cnn網絡結構設計階段:使用alexnet網絡架構,alexnet網絡架構見附圖2。
步驟2.2:cnn網絡有監督預訓練階段:直接用imagenet數據庫訓練好的的alexnet網絡初始化參數,然后在下一步fine-tuing階段進行有監督的參數微調。
步驟2.3:fine-tuning階段;
選取1000-2000張圖片作為訓練集,標記出圖片中違章建筑的左上方和右下方坐標,將alexnet卷積神經網絡的最后一層替換成違章建筑輸出元和1個背景,使用selectivesearch算法在步驟1中劃分的檢測樣本中提取若干個候選區域,若提取出的候選區域與標記的坐標重疊度大于閾值t,則標記為正樣本,否則為負樣本;
步驟2.4:對1000-2000張圖片選取出的預選框分組(batch-size),輸入至alexnt卷積神經網絡網絡中,網絡優化求解時采用隨機梯度下降法,學習率大小為0.001。
其中,batch-size的取值為120,其中正樣本為90個,負樣本為30個。
步驟3:對檢測樣本進行去霧化處理;
所需檢測的圖片均為戶外拍攝,故易受霧霾天氣影響。基于暗通道的去霧算法公式如下:
其中j(x)為去霧后的圖片,i(x)為原圖,a為全球大氣光成分,t(x)為透射率,t0為閾值,當t(x)小于t0時防止j(x)過大而使得圖像向白場過渡;
ω(x)表示以像素x為中心的一個窗口,ω為模擬因子來模擬正常天氣情況,其所計算的均為r/g/b三通道。參數ω的取值為0.90,參數t0的取值為0.15。
全球大氣光成分a的求取過程是,首先從暗通道圖中按照亮度的大小取前0.2%的像素;然后在這0.2%的像素在原始有霧視頻圖像i(x)對應位置中尋找具有最高亮度的點的值,作為a值。
步驟4:使用selectivesearch算法在檢測樣本中提取若干個候選區域,將每個候選區域歸一化到m×m×l;然后在步驟2中訓練好的cnn模型中正向傳播,提取最后一層的特征向量。其中m的取值范圍約為100-250,不同的尺寸需要相應的修改alexnet網絡中相應的參數,l為r/g/b三通道。
步驟5:使用步驟2中訓練好的softmax分類器對步驟4中提取的特征向量進行打分,得到步驟4中提取的候選區域對于建筑的分數s,若該分數s大于某個閾值t的話,則標記該候選區域為建筑物;
步驟6:對步驟5中標記的候選區域使用非極大值抑制(nms)法去除交叉多余的框。若一段連續時間步驟1中劃分的監控區域中未標記出建筑而當前圖片檢測出建筑,則判定該建筑為違章建筑并預警并提交人工審核。若為違章建筑,則加入違章建筑訓練集。
對得到的某站點的所有圖片數組分別進行特征識別處理,并返回識別結果作為預警依據;識別的算法流程如圖3所示。
本發明設計的方法適合于大規模部署的監控系統應用場景。大規模監控的效果僅靠人眼觀察視頻來判斷,不僅效率低下,而且收效甚微。本發明所設計的方法通過對傳回的圖片序列進行智能化比對分析,針對國土監測的業務需求,通過智能識別算法將回傳圖片中的疑似違章建筑進行標注,實現早期預警,將管理人員中海量的圖片信息中解放出來,大大提升了系統的運營效能。
應當理解的是,本說明書未詳細闡述的部分均屬于現有技術。
應當理解的是,上述針對較佳實施例的描述較為詳細,并不能因此而認為是對本發明專利保護范圍的限制,本領域的普通技術人員在本發明的啟示下,在不脫離本發明權利要求所保護的范圍情況下,還可以做出替換或變形,均落入本發明的保護范圍之內,本發明的請求保護范圍應以所附權利要求為準。