麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種基于特征選擇的視覺映射方法與流程

文檔序號:11143326閱讀:477來源:國知局
一種基于特征選擇的視覺映射方法與制造工藝

本發明屬于計算機視覺技術領域,涉及視覺映射技術,主要應用于頭部姿態估計,視線跟蹤和年齡估計等視覺估計問題中。



背景技術:

在計算機視覺中,視覺映射是指學習輸入圖像特征與輸出變量之間映射函數的過程,以便在輸入新圖像時,估計該輸入圖像對應的目標輸出值。具體來講,視覺映射包括:人體姿態估計、頭部姿態估計、視線估計和物體跟蹤等。詳見參考文獻:O.Williams,A.Blake,and R.Cipolla,Sparse and Semi-Supervised Visual Mapping with the S3GP,in IEEE Conference Computer on Computer Vision and Pattern Recognition,pp.230-237,2006.

作為計算機視覺的一個重要分支,視覺映射改變了許多場合下由人逐一根據圖像內容估計目標輸出的情況。取而代之,由計算機根據輸入圖像內容,通過已有視覺映射函數預測輸出,從而實現由攝像機和電腦代替人眼和大腦對圖像進行全自動分析和估計。目前,該技術已開始被應用于與人們生活密切相關的多個產業。其中,頭部姿態估計被應用于汽車安全駕駛產業,視線估計和人體姿態估計被應用于智能人機接口及游戲產業,物體跟蹤被應用于智能交通等產業,人體姿態估計被應用于人機交互領域。相信隨著計算機硬件處理能力的不斷提高和視覺映射中關鍵技術問題的逐步解決,其應用前景將更加廣闊。

在用于視覺映射問題的模型中,由于輸入特征與輸出目標值之間存在的關系常常是高度非線性的,因此利用非線性模型進行擬合是一種普遍接受的方法。混合回歸模型由于不需要假設具體核函數實現非線性映射,因此被廣泛的應用于該問題中。而現有的混合回歸方法,通常需要對原始圖像特征進行降維,再在此基礎上實現混合回歸建模,這樣導致了提取的特征不是最適合目標值估計的特征。參見文獻:A.Agarwal and B.Triggs,Monocular Human Motion Capture with a Mixture of Regressors,in IEEE Workshop on Vision for Human Computer Interaction in Conjunction with IEEE Conference on Computer Vision and Pattern Recognition,pp.72-80,2005。

為了方便地描述本

技術實現要素:
,首先對一些術語進行定義。

定義1:視覺映射。對圖像提取視覺特征,并將視覺特征映射到對應的目標值(見圖1)。例如:頭部姿態估計是一個視覺映射問題,對包含頭部的圖像提取梯度方向直方圖特征,并將該特征映射到姿態角度。

定義2:梯度方向直方圖特征。利用像素強度梯度或邊緣的方向分布描述一幅圖像中的物體的表象和形狀的視覺特征提取方法。其實現方法先將圖像分成小的叫做方格單元的連通區域;然后采集方格單元中各像素點的梯度方向或邊緣方向直方圖;最后把這些直方圖組合起來就可以構成特征描述子。為了提高精確度,還可以把這些局部直方圖在圖像的更大的區間(block)中進行對比度歸一化(contrast-normalized),此方法通過先計算各直方圖在這個區間(block)中的密度,然后根據這個密度值對區間中的各個方格單元做歸一化。通過該歸一化能對光照變化和陰影有更強的魯棒性。

定義3:高斯分布。又名正態分布,是一個在數學、物理及工程等領域都非常重要的概率分布。具體是指:對于任意隨機變量x,若其概率密度函數滿足其中μ為正態分布的中心,σ為正態分布的方差,則稱其滿足高斯分布,常用符號表示。若隨機變量為向量x,則對應高維高斯分布μ為高維正態分布的中心,∑為高維正態分布的協方差,或記為

定義4:混合高斯分布。是指隨機變量服從由多個高斯函數混合組成的分布函數,即:其中K為高斯分布的個數,z為指示變量x屬于哪一個高斯分布的隱變量。z為一個K維的狀態向量,該向量只有一個元素為1,其余元素為0,當第k個元素zk為1時,則表示x屬于第k個高斯分布。p(z)表示隱變量z的出現概率,該概率通常用符號πk表示,即:p(zk=1)=πk

定義5:隱變量。無法被觀測到的變量,例如在混合高斯分布中,z指示變量x屬于哪一個高斯分布,無法被觀測即為隱變量。

定義6:混合系數。在混合高斯分布中代表變量x屬于某一高斯分布的概率,即πk為混合系數。

定義7:線性回歸。是指輸出變量(向量)y和輸入變量(向量)x之間存在線性映射關系,即:y=ATx+b,其中AT代表回歸矩陣,b代表偏差向量。

定義8:混合回歸關系。是指輸出變量(向量)y和輸入變量(向量)x之間存在非線性映射關系,即:其中代表第k個回歸矩陣,bk代表第k個偏差向量。πk(x)表示x屬于某一線性回歸模型的概率。

定義9:似然函數。似然函數是一種關于統計模型中的參數的函數,表示模型參數的似然性或可能性。

定義10:期望最大值算法。一種求解混合高斯分布參數似然函數最大值的優化方法,它通常包含兩個基本的步驟,即:期望步驟(E步)和最大化步驟(M步)。

定義11:Q函數。在求解混合高斯分布似然函數最大值的期望最大值算法中,Q函數為似然函數的下界函數。

定義12:對角矩陣。是一個主對角線之外的元素皆為0的矩陣。對角線上的元素可以為0或其他值。diag{}是對角矩陣的符號,花括號中的元素代表對角矩陣對角線上的元素。

定義13:Nesterov梯度法。是一種加速梯度算法,常被應用于非光滑凸函數求極值問題中。

本發明詳細技術方案如下:一種基于特征選擇的視覺映射方法,該方法包括:

步驟1:采集針對某視覺映射問題的N幅圖像,同時記錄目標值下標n表示第n幅圖像對應的姿態;以頭部姿態估計為例,采集的N幅圖像為不同姿態的頭部圖像,目標值yn為對應的頭部姿態角度,H表示目標值的維數;

步驟2:對采集的圖像進行彩色圖像轉灰度圖像的處理,若采集圖像已經為灰度圖像則無需在進行轉化處理;

步驟3:將輸入圖像的頭部區域圖像歸一化為固定大小的圖像,對每一幅輸入圖像提取梯度方向直方圖特征;

步驟4:將所有的N幅圖像對應的梯度方向直方圖特征向量在列方向上,按順序排列可以得到輸入數據矩陣X,即X=[x1,x2,…,xN];

步驟5:將N幅圖像對應的目標值向量在列方向上按順序排列為數據矩陣Y,即Y=[y1,y2,…,yN];

步驟6:假設在視覺映射問題中,所有輸入特征和輸出姿態聯合服從混合高斯分布p(xn,yn|Θ),各高斯分布中心、協方差和混合系數,分別用符號μk,∑k和πk表示,其中下角標k表示第k個高斯分布,k=1,2,...K;

同時,假設在已知{xn,yn}屬于某一高斯的條件下,它們之間存在線性回歸關系,回歸關系由回歸矩陣Ak,偏差bk,和噪聲方差水平γ決定,

其中為隱變量,決定第n個觀測樣本{xn,yn}屬于哪一個高斯;根據上述假設,可以輸入數據和輸出數據之間存在混合回歸關系,IH表示有H個對角線元素的單位矩陣,該關系的示意圖見圖2(a);用符號Θ表示此混合回歸模型中的所有參數,即:Θ={μk,∑k,πk,Akbk,γ}

由上述假設可以推斷輸入梯度方向直方圖特征也分別服從混合高斯分布,即:

其中表示輸入特征的各高斯分布中心和協方差;由輸入和輸出之間的線性關系,可知:

步驟7:為了在進行高混合回歸的同時進行輸入圖像特征選擇,假設第k個回歸參數矩陣向量化為可以構成總體回歸參數矩陣表示回歸參數矩陣的維數;回歸矩陣的每一行用符號表示,其中i=1,...,HD;假設ai服從均值為0方差水平為τ的先驗正態分布,得到:

步驟8:根據步驟6和步驟7對回歸參數Θ的先驗假設,給定輸入數據矩陣X和輸出數據矩陣Y時的聯合后驗概率分布為:

混合特征選擇回歸模型對應的圖模型見圖2。將參數步驟7中的先驗分布p(Θ)和步驟6中的似然函數lnp(X,Y|Θ)的具體表達式代入到上式中,可以得到參數Θ的后驗分布為:

τIK代表協方差矩陣;

步驟9:為了求解步驟8中的參數Θ,我們采用EM算法進行參數優化;

步驟10:計算步驟9中的EM算法,直到收斂;

步驟11:計算輸入圖像特征xt屬于某一高斯分布的條件下,對應的目標值并利用步驟8中求得的概率加權平均,得到最后目標估計值,

進一步的,所述步驟3中在梯度方向直方圖特征計算的過程中,區域個數的參數設置為2×2,每一區域中圖像單元的個數參數設置為8×8,方向柱的個數設置為9,最后得到任意一幅圖像對應的梯度方向直方圖特征,并記第n幅圖像對應的梯度方向直方圖特征向量xn

進一步的,所述步驟9中EM算法包括E步驟和M步驟;

E步驟:在E步中利用上一步的參數估計結果Θold計算任意第n個樣本屬于第k個聚類的后驗概率

上標old表示上一步的參數估計結果;同時建立關于參數Θ的Q函數,

其中為隱含變量矩陣,其第k行n列的元素為zkn

M步驟:最大化Q函數Q(Θ,Θold)來更新參數Θ,根據上式的第一行得到關于回歸參數的優化目標函數

λ為回歸噪聲方差水平γ和參數τ之間的比值,wkn=p(zkn|xn,yn,Θold);令每一個樣本的目標值yn構成矩陣其中其中為上一次迭代時向量bk的值;根據A=[vec(A1),...,vec(AK)],上式可以化簡為:

利用Nesterov梯度法進行優化得到回歸參數矩陣A的最佳解;偏差項bk的計算方法如下:

這里

根據Q函數第二行可以得到關于聚類參數{πk}的目標函數

最后得到解為:

本專利針對此問題提出了一種基于特征選擇的混合回歸方法,該方法直接對輸入圖像特征進行選擇,并且選擇的特征是最適合后續目標值估計的,這樣有助于提高視覺映射的總體估計性能。

附圖說明

圖1是視覺映射示意圖:頭部姿態估計、身體姿態估計和視線估計。

圖2是基于特征選擇的混合回歸模型示意圖。(a)混為合回歸的基本原理,(b)為回歸系數矩陣的特征選擇性

具體實施方式

實現語言:Matlab,C/C++

硬件平臺:Intel core2E7400+4G DDR RAM

軟件平臺:Matlab2012a,VisualStdio2010

根據本發明的方法,首先采集一定數量的圖像并記錄這些圖像對應的目標值,根據本發明專利,利用Matlab或者C語言編寫基于特征選擇的混合回歸模型程序,并在采集數據上訓練本發明對應模型的參數;接著在各種應用場景安裝攝像頭采集原始圖像;接著提取采集到的圖像的梯度方向直方圖特征;根據之前訓練的參數可以估計該圖像對應的輸出目標值。本發明的方法,可以用于各種場景下的視覺映射問題。

一種基于特征選擇的視覺映射方法,該方法包括:

步驟1:采集針對某視覺映射問題的N幅圖像,同時記錄目標值下標n表示第n幅圖像對應的姿態;以頭部姿態估計為例,采集的N幅圖像為不同姿態的頭部圖像,目標值yn為對應的頭部姿態角度,H表示目標值的維數;

步驟2:對采集的圖像進行彩色圖像轉灰度圖像的處理,若采集圖像已經為灰度圖像則無需在進行轉化處理;

步驟3:將輸入圖像的頭部區域圖像歸一化為固定大小的圖像,對每一幅輸入圖像提取梯度方向直方圖特征;

步驟4:將所有的N幅圖像對應的梯度方向直方圖特征向量在列方向上,按順序排列可以得到輸入數據矩陣X,即X=[x1,x2,...,xN];

步驟5:將N幅圖像對應的目標值向量在列方向上按順序排列為數據矩陣Y,即Y=[y1,y2,...,yN];

步驟6:假設在視覺映射問題中,所有輸入特征和輸出姿態聯合服從混合高斯分布p(xn,yn|Θ),各高斯分布中心、協方差和混合系數,分別用符號μk,∑k和πk表示,其中下角標k表示第k個高斯分布,k=1,2,...K;

同時,假設在已知{xn,yn}屬于某一高斯的條件下,它們之間存在線性回歸關系,回歸關系由回歸矩陣Ak,偏差bk,和噪聲方差水平γ決定,

其中為隱變量,決定第n個觀測樣本{xn,yn}屬于哪一個高斯;根據上述假設,可以輸入數據和輸出數據之間存在混合回歸關系,IH表示有H個對角線元素的單位矩陣,該關系的示意圖見圖2(a);用符號Θ表示此混合回歸模型中的所有參數,即:Θ={μk,∑k,πk,Ak,bk,γ}

由上述假設可以推斷輸入梯度方向直方圖特征也分別服從混合高斯分布,即:

其中表示輸入特征的各高斯分布中心和協方差;由輸入和輸出之間的線性關系,可知:

步驟7:為了在進行高混合回歸的同時進行輸入圖像特征選擇,假設第k個回歸參數矩陣向量化為可以構成總體回歸參數矩陣D×H表示回歸參數矩陣的維數;回歸矩陣的每一行用符號表示,其中i=1,...,HD;假設ai服從均值為0方差水平為τ的先驗正態分布,得到:

步驟8:根據步驟6和步驟7對回歸參數Θ的先驗假設,給定輸入數據矩陣X和輸出數據矩陣Y時的聯合后驗概率分布為:

混合特征選擇回歸模型對應的圖模型見圖2。將參數步驟7中的先驗分布p(Θ)和步驟6中的似然函數lnp(X,Y|Θ)的具體表達式代入到上式中,可以得到參數Θ的后驗分布為:

τIK代表協方差矩陣;

步驟9:為了求解步驟8中的參數Θ,我們采用EM算法進行參數優化;EM算法包括E步驟和M步驟;

E步驟:在E步中利用上一步的參數估計結果Θold計算任意第n個樣本屬于第k個聚類的后驗概率

上標old表示上一步的參數估計結果;同時建立關于參數Θ的Q函數,

其中為隱含變量矩陣,其第k行n列的元素為zkn

M步驟:最大化Q函數Q(Θ,Θold)來更新參數Θ,根據上式的第一行得到關于回歸參數的優化目標函數

λ為回歸噪聲方差水平γ和參數τ之間的比值,Wkn=p(zkn|xn,yn,Θold);令每一個樣本的目標值yn構成矩陣其中其中為上一次迭代時向量bk的值;根據A=[vec(A1),...,vec(AK)],上式可以化簡為:

利用Nesterov梯度法進行優化得到回歸參數矩陣A的最佳解;偏差項bk的計算方法如下:

這里

根據Q函數第二行可以得到關于聚類參數{πk}的目標函數

最后得到解為:

步驟10:一直重復步驟9中的E步和M步,直到收斂,即:前后兩次參數的值不再改變;

步驟11:計算輸入圖像特征xt屬于某一高斯分布的條件下,對應的目標值并利用步驟8中求得的概率加權平均,得到最后目標估計值,

當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 东海县| 渑池县| 图们市| 梁平县| 通城县| 涪陵区| 旬阳县| 措勤县| 聂拉木县| 手机| 云林县| 平遥县| 镇宁| 柳江县| 霍邱县| 阜平县| 萨嘎县| 泸定县| 宜春市| 寻甸| 沅江市| 临夏县| 来宾市| 株洲县| 辽阳市| 兖州市| 台北县| 绥德县| 长海县| 阜宁县| 阳谷县| 和田县| 乳源| 金秀| 图木舒克市| 灵丘县| 浦江县| 温州市| 永新县| 蓬莱市| 永城市|