專利名稱:基于時頻域分析的異常人聲檢測方法
技術領域:
本發明主要涉及ー種基于時頻域分析的異常人聲檢測方法。
背景技術:
安全防控越來越成為公眾關注的焦點,視頻監視系統得到了普遍的推廣應用,我國絕大多數縣級以上城市以及鄉鎮重點場所均已依法建立視頻監視體系,實現多方位全天候的視頻監視和存儲。目前絕大多數視頻監視系統沒有對聲音進行監控,或者僅做簡單的錄制,缺少對聲音信息的實時分析處理。當發生不安 全事件時,現場往往存在呼救、尖叫、大喊等異常人聲,現有視頻監視系統不能對異常人聲做出及時反應,智能化預警程度不高,不能更有效地保護人民群眾的人身、財物安全。
發明內容
針對視頻監視系統中人聲監控的空白,本發明提供一種基于時頻域分析的異常人聲檢測方法,該方法包括基于時域的背景聲音強度實時更新方法、異常聲音片段提取方法,基于頻域的異常聲音片段均值濾波MFCC參數提取方法、引入時間相關性的HMM模型訓練及異常人聲檢測方法。本發明的異常人聲檢測方法主要針對道路、街面等公共場所或其它重點位置的聲音信息進行自動監控,包括時域處理和頻域處理,首先在時域處理階段,計算實時更新的監控場景背景聲音強度,檢測并提取聲音強度突變片段;然后進入頻域處理階段,對異常聲音片段提取經過均值濾波的梅爾頻率倒譜系數(Mel-Frequency Cepstrum Coefficients,MFCC),將提取到的異常片段聲音MFCC作為觀測序列,輸入訓練好的改進隱馬爾科夫過程(Hidden Markov Model, HMM)模型,根據人聲頻率特征,分析該異常片段是否為異常人聲;其中HMM模型引入時序相關性加以改進;本發明完整處理流程如圖I所示,下面對本發明中的技術方案闡述如下I、計算監控場景實時背景聲音強度首先在初始化過程中計算一定時長的背景聲音能量作為初始背景強度,然后在處理過程中不斷加入當前聲音片段,刪除舊的聲音片段,實現背景強度的實時更新。具體流程為Stepl. I :背景聲音強度初始化連續獲取L段等長度短時聲音片段,計算每段聲音片段強度并做平均,求得平均聲音強度,作為背景聲音初始強度
權利要求
1.一種基于時頻域分析的異常人聲檢測方法,其特征在于該方法包括時域處理和頻域處理,在時域處理階段,通過計算短時聲音強度來獲取并實時更新監控場景背景聲音強度,提取存在聲音強度突變的異常聲音片段;在頻域處理階段,首先對異常聲音片段提取經過均值濾波的梅爾頻率倒譜系數(Mel-Frequency Cepstrum Coefficients,MFCC),將提取到的異常片段聲音MFCC作為觀測序列,輸入訓練好的改進隱馬爾科夫過程(Hidden MarkovModel, HMM)模型,分析該異常片段是否為異常人聲,包括如下步驟 步驟I、計算監控場景實時背景聲音強度,具體過程如下 Stepl. I :背景聲音強度初始化 連續獲取L段等長度短時聲音片段,計算每段聲音片段強度并做平均,求得平均聲音強度⑥,作為背景聲音初始強度
2.根據權利要求I所述的基于時頻域分析的異常人聲檢測方法,其特征在于,改進的HMM模型訓練方法是首先采集異常人聲樣本,包括呼救、尖叫、大喊典型異常人聲,提取其MFCC參數;然后將異常人聲樣本MFCC參數作為輸入參數,訓練該改進的HMM過程。
全文摘要
本發明涉及一種基于時頻域分析的異常人聲檢測方法。該方法首先計算實時更新的監控場景背景聲音強度,檢測并提取聲音強度突變片段;然后提取異常片段的均值濾波梅爾頻率倒譜系數;最后將提取到的異常片段聲音梅爾頻率倒譜系數參數作為觀測序列,輸入訓練好的改進隱馬爾科夫過程模型,根據人聲頻率特征,分析該異常片段是否為異常人聲。其中隱馬爾科夫過程模型加入時序相關性進行改進。該方法結合時域提取能量突變幀和頻域范圍驗證,可有效檢測到異常人聲,實時性好,抗噪聲性能強,魯棒性較好。
文檔編號G10L15/10GK102664006SQ20121010909
公開日2012年9月12日 申請日期2012年4月14日 優先權日2012年4月14日
發明者劉通, 唐朝京, 李沛秦, 謝劍斌, 謝昌頤, 閆瑋 申請人:中國人民解放軍國防科學技術大學