麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

基于字典學習模型的人臉識別方法

文檔序號:6363023閱讀:376來源:國知局
專利名稱:基于字典學習模型的人臉識別方法
技術領域
本發明屬于人臉識別技術領域,具體涉及一種基于字典學習模型的人臉識別方法。
背景技術
基于過完備字典(overcomplete dictionary)的稀疏表達技術是計算機視覺、模式識別、和機器學習領域中的一大熱門問題,已經在圖像去噪和修補、人臉識別、圖像分類、 視頻異常行為檢測等研究領域有過許多成功應用。在給定一個由K個基信號列向量{元f=1按列排列組成的過完備字典D e
為實數集,n為基信號列向量的維數,K為基信號列向量的個數)時,對于n維空間中的輸入信號列向量,稀疏表達問題可以表示為min || x ||0 > s.t. \\ y — Dx ||2< 8 (s-1.表不 subject to,下同)其中,為得到的稀疏(列)向量,£為重建誤差,是可以預設的閾值參數, |x Itl表示向量X的0范數即非零元素的個數,14表示向量V各元素的平方和,I I v| I2表
示向量V的I2范數(即歐氏空間中的向量長度)。除非特殊說明,本發明所述向量均為列向量。在稀疏表達的基礎上,字典學習方法(如K-SVD算法[1])對于不同的輸入信號集Y 學習適合于它的字典,在很多應用領域可以得到比使用預設字典更好的結果。對于分類問題,通過學習得到的字典的優勢更加明顯。對于人臉識別和圖像分類問題,在某種程度上,稀疏表達可以被視為一個特征提取的過程對于每個輸入信號,一對一地得到其對應的稀疏向量,將稀疏向量作為分類器的輸入,就可以得到分類結果。從這種角度來看,在字典學習的同時如果適當考慮分類誤差, 則計算得到的稀疏向量能擁有更強的判別能力,對于新來的未知測試數據會有更好的泛化 (generalization)能力。而特征提取結果的效果如何,與使用的字典D是否能夠很好地表達輸入信號集Y有很大的關系。這也是對于此類分類問題,使用基于輸入信號集學習得到的字典比使用固定的預設字典能取得更好的效果,這在圖像去噪、圖像修復等應用中也有相似的體現。。如果字典D中的基信號dk線性張成的子空間維數與輸入信號y所處的空間維數相差過大的話,使用這樣的字典,即使它對于訓練數據有很好的重建能力,對于新來的測試數據也很難有好的泛化性能。研究結果表明,字典中基信號的不相關程度對于提升稀疏表達重建精度與算法運算速度都有很大的幫助,,但現階段的稀疏表達和字典學習模型大多只關注于字典作為一個整體的重建性能和判別性能,忽略了其中的基信號的不相關程度這一重要因素
發明內容
本發明的目的在于提出一種人臉識別方法,針對于人臉識別問題的字典學習模型,著重關注現在已有的字典學習方法所忽視的字典中基信號的不相關程度。在保持字典的重建性能和判別性能的前提下,得到不相關程度更高的字典,以提高人臉識別問題中的分類正確率。本發明提供的技術方案如下一種基于字典學習模型的人臉識別方法,包括如下步驟(流程參見圖I):步驟I :將訓練和測試的人臉圖像映射至低維空間,得到訓練信號集矩陣Y ;步驟2 :建立字典學習模型,包括不相關的字典學習模型IDL和無約束的不相關字典學習模型U-IDL ;所述兩種字典學習模型中包括字典的相關度,所述字典的相關度用公
式coKD) =表示,其中I為單位矩陣,|A|丨表示矩陣A的F范數,即矩陣A中各元
素的平方和;步驟3 :將訓練信號集矩陣Y輸入到IDL及U-IDL模型中,然后對模型進行求解, 得到適應于該訓練集的字典D、訓練集的稀疏向量矩陣X、線性分類器W ;步驟4 :對屬于測試樣本的每幅人臉圖片y,基于步驟3中得到的字典D利用稀疏表達算法得到其相應的稀疏向量X ;步驟5 :將稀疏向量X輸入到步驟3中得到的線性分類器W中,計算W與X的乘積得到測試樣本圖片的類別標簽列向量h( = Wx),列向量h中的第i個元素表示測試樣本y 屬于第i類的分類置信度,將人臉圖片y判定屬于置信度最高的一類。所述的人臉識別方法,其特征是,步驟I中,將所有樣本隨機等分為訓練樣本和測試樣本兩部分,并將每幅樣本圖片拉伸為列向量后進行歸一化處理,化為長度為I的單位向量,再用PCAtt]將所有的樣本降維到低維特征空間中。所述的人臉識別方法,其特征是,步驟2中,(A)在字典學習模型D-KSVDm中加入上述字典相關度指標,得到不相關的字典學習模型IDL如下rnin ||F - DXfF + l\Dr D -/|[, +r/\\H-WX ||J. +J3\\W ||J. (I)s.t. ||dk||2 = l k = I, . . . , K |xj I0^T i = I, . . . , N其中X為學習得到的稀疏列向量所組成的矩陣,W為學習得到的線性分類器矩陣, 入,n,P為人工設置的權重參數,可以根據實際問題進行調整,dk為D中的第k列基信號列向量,K為基信號列向量的個數,T為預設的稀疏系數閾值,表示稀疏向量Xi中非零元素的最大個數;I IxiI Io表示列向量范數(即非零元素的個數),I |dk| |2表示列向量 4的12范數(即歐氏空間中的向量長度);矩陣H的每一列為僅有一個非零元素的列向量
T,這里非零元素的位置對應訓練樣本的類別標簽真實答案 (ground-truth);(B)由于在本發明的模型中加入了字典的相關度,它會引導字典中的基信號盡量正交,因此另一種選擇是把上述IDL模型中關于基信號的單位范數約束舍去,得到無約束的不相關字典學習模型U-IDL如下min \\Y - DXfp + A \dt D - /|+ 7] \\H - WX \\2F +P\\W
s. t. I I Xi I 10 < T, i = I, , N (2)所述的人臉識別方法,其特征是,步驟3中所述對模型進行求解,指將K-SVD算法 [1]中得到的字典和稀疏向量矩陣作為D和X的初始值,在此基礎上輸入訓練數據Y,然后對模型進行求解。所述的人臉識別方法,其特征是,步驟3中,求解不相關的字典學習模型IDL的方法為對于建立的模型采用循環迭代的方式進行求解,對于不相關字典學習模型中的三個變量D、X、W,在固定其中兩個變量的前提下對剩余一個變量進行求解,并反復迭代,最終達到每次迭代的目標函數值都收斂,或者達到預設的最大迭代次數。所述的人臉識別方法,其特征是,步驟3中,求解無約束的不相關字典學習模型 U-IDL的方法與IDL模型的求解過程唯一不同之處在于在字典D的更新階段,U-IDL模型沒有I I dk| |2 = I此單位范數約束條件,因此通過對dk求導可直接得到其最優解。本發明的有益效果本發明對稀疏表達中的字典學習問題提出了新的模型和方法,可以應用于一般情況下的模式識別和圖像分類問題;特別是針對人臉識別應用,本發明提出的字典學習方法,能達到較高的人臉識別準確度。


圖I是本發明的流程圖;其中,(a)訓練過程,(b)測試過程。圖2是Extended YaleB數據庫中的人臉樣本示意圖;圖3是-在Extended YaleB數據庫上,本發明提出的不相關字典學習方法與其他字典學習方法所獲得字典的不相關程度的對比結果圖;圖4是CAS-PEAL-R1人臉數據庫中的人臉樣本示意圖。
具體實施例方式下面參照附圖,對本發明的實施例進行具體描述。實施例一步驟I :將訓練和測試的人臉圖像映射至低維空間,得到訓練信號集矩陣Y。輸入樣本為Extended Yale B數據庫中的人臉樣本圖片,該數據庫包含38個人在不同光照條件下的共計2414張圖片,所有圖片均經過標準化處理,大小為168X192像素, 如圖2所示。將每個人的樣本隨機等分為訓練樣本和測試樣本兩部分,并將每幅樣本圖片拉伸為向量后進行歸一化處理為單位向量,再用PCA[4]將所有的樣本降至504維空間。步驟2 :建立字典學習模型,將Y輸入到字典學習模型中,得到適應于該訓練集的字典D、訓練集的稀疏向量矩陣X、線性分類器W。在本實施例中學習到的字典包含570個基信號,稀疏系數閾值T= 16。(2. I)提出用下面的公式表示字典D的相關度概念cor(D)= DtD-I ^其中I為單位矩陣,|A|丨表示矩陣的F范數,即各元素的平方和。COT(D)度量的是字典D與正交矩陣之間的差異,如果cor (D)值為0,則字典D中列向量完全不相關;如果 cor (D)值非常大,則說明字典D中列向量具有很高的相關度。我們希望得到的字典D中的基信號dk是盡量正交的(即非常不相關),這樣這些基信號就可以對空間中其他信號有很好的表達能力。(2. 2)建立字典學習模型(a)不相關的字典學習模型(IDL)將字典的相關度加入監督的字典學習模型D-KSVDm中,可以得到不相關的字典學習模型(IDL)如下rnin ||7 - DX\fF + l\DrD -/|[, +t]\\H-WX \\2F +P\\W\fFs.t. Il dk ||2 = 1 k=l,...,K|| Xi ||0<T i = I, , N其中X,W為學習得到的稀疏向量矩陣和線性分類器,入,n,@為模型中的參數, 可以根據實際問題調整。dk為D中的基信號列向量,K為基信號列向量的個數,T為預設的稀疏系數閾值,表示稀疏向量Xi中非零元素的個數。H的每一列為僅有一個非零元素的列向量Iii=
T,這里非零元素位置表示樣本的類標簽標準答案,如第j 個位置值為I,則表示此樣本Xi屬于第j類。(b)無約束的不相關字典學習模型(U-IDL)IDL模型中關于字典中基信號的約束I |dk| |2 = I在許多現有的字典學習模型中出現過,其目的在于避免求得的稀疏向量的范數過小。但這個約束也導致了字典學習模型的字典更新階段需要求解一個有約束的優化問題,使得求解字典D的時間代價很大。由于在本發明的模型中加入了字典的相關度cor(D),它會引導字典中的基信號盡量正交,因此可以把IDL模型中關于基信號的單位長度約束舍去,得到無約束的不相關字典學習模型(U-IDL)如下 rnin ||7 - DX\fF + l\Dr D - /!:' +r/\\H-WX ||J. +J3\\W ||J.s. t. I I Xi I I o ^ T i = I, , N步驟3 :將步驟I中由人臉圖片組成的輸入信號集矩陣Y輸入到IDL及U-IDL模型中,并以將Y輸入K-SVDtl]中得到的字典和稀疏向量矩陣作為D和X的初始值,對模型進行求解。得到適應于該訓練集的字典D、訓練集的稀疏向量矩陣X、線性分類器W。A.求解不相關的字典學習模型(IDL)對于建立的模型采用循環迭代的方式進行求解。對于不相關字典學習模型中的三個變量D、X、W,在固定其他兩個變量的前提下對另一個進行求解,并反復迭代這一過程,最終達到每次迭代的目標函數值都收斂,或者達到預設的最大迭代次數。(3. I)將輸入信號集矩陣Y輸入K-SVDtl]算法,得到初始化的字典Dtl及稀疏向量矩陣Xtlt5
(3. 2)重復下列a)、b)、c)三步直到滿足上述兩條迭代停止條件時,迭代停止
a)固定D、X,求解W。
當D、X固定時,關于W的目標函數為
權利要求
1.一種基于字典學習模型的人臉識別方法,包括如下步驟步驟I :將訓練和測試的人臉圖像映射至低維空間,得到訓練信號集矩陣Y ;步驟2:建立字典學習模型,包括不相關的字典學習模型IDL和無約束的不相關字典學習模型U-IDL ;所述兩種字典學習模型中包括字典的相關度,所述字典D的相關度用公式cor(D) = _/|表示,其中I為對角矩陣,|A|丨表示矩陣A的F范數,即矩陣A中各元素的平方和;步驟3 :將訓練信號集矩陣Y輸入到IDL及U-IDL模型中,然后對模型進行求解,得到適應于該訓練集的字典D、訓練集的稀疏向量矩陣X、線性分類器W ;步驟4 :對屬于測試樣本的每幅人臉圖片y,基于步驟3中得到的字典D利用稀疏表達算法得到其相應的稀疏向量X ;步驟5 :將稀疏向量X輸入到步驟3中得到的線性分類器W中,計算W與X的乘積得到測試樣本圖片的類別標簽列向量h,列向量h中的第i個元素表示測試樣本y屬于第i類的分類置信度,將人臉圖片y判定屬于置信度最高的一類。
2.如權利要求I所述的人臉識別方法,其特征是,步驟I中,將所有樣本隨機等分為訓練樣本和測試樣本兩部分,并將每幅樣本圖片拉伸為列向量后進行歸一化處理,化為長度為I的單位向量,再用PCA將所有的樣本降維到低維特征空間中。
3.如權利要求I所述的人臉識別方法,其特征是,步驟2中,(A)在字典學習模型D-KSVD中加入所述字典相關度指標,得到不相關的字典學習模型 IDL如下mm |r - DXfF +4^1 D -/||' +I1WH-WXg +p || W g's. t. I I dk| I2 = I k = 1,...,K| I Xi I I0^T i = I, . . . , N其中X為學習得到的稀疏列向量所組成的矩陣,W為學習得到的線性分類器矩陣,入, n,^為人工設置的的權重參數,dk為D中的第k個基信號列向量,K為基信號列向量的個數,T為預設的稀疏系數閾值,表示稀疏向量Xi中非零元素的最大個數;I IxiI IC1表示列向量 Xi的0范數,I I dk| I2表示列向量dk的I2范數;矩陣H的每一列為僅有一個非零元素的列向量比=
T,這里非零元素的位置對應訓練樣本的類別標簽真實答案;(B)把上述IDL模型中關于基信號的單位范數約束舍去,得到無約束的不相關字典學習模型U-IDL如下rnin ||7 - DX\fF + l\DrD -/|[, +t]\\H-WX \\2F +P\\W\fFs. t. I I Xi I I o ^ T i = I, , N
4.如權利要求3所述的人臉識別方法,其特征是,步驟3中所述對模型進行求解,指將 K-SVD算法中得到的字典和稀疏向量矩陣作為D和X的初始值,在此基礎上輸入訓練數據 Y,然后對模型進行求解。
5.如權利要求4所述的人臉識別方法,其特征是,步驟3中,求解不相關的字典學習模型IDL的方法為對于建立的模型采用循環迭代的方式進行求解,對于不相關字典學習模型中的三個變量D、X、W,在固定其中兩個變量的前提下對剩余一個變量進行求解,并反復迭代,最終達到每次迭代的目標函數值都收斂,或者達到預設的最大迭代次數。
6.如權利要求5所述的人臉識別方法,其特征是,步驟3中,求解無約束的不相關字典學習模型U-IDL的方法為=U-IDL模型與IDL模型的求解過程的唯一不同之處在于字典D的更新階段,即U-IDL模型沒有約束條件I I dk| |2 = 1,因此可通過對dk求導直接得到其最優解。
全文摘要
一種基于字典學習模型的人臉識別方法。將訓練和測試的人臉圖像映射至低維空間,得到訓練信號集矩陣;建立字典學習模型,包括不相關的字典學習模型IDL和無約束的不相關字典學習模型U-IDL;將訓練信號集矩陣輸入到IDL及U-IDL模型中并對模型進行求解,可獲得不相關字典和線性分類器;對屬于測試樣本的每幅圖片,基于上一步中得到的字典利用稀疏表達算法得到其相應的稀疏向量;將稀疏向量輸入至線性分類器中,得到測試樣本圖片的類別標簽,以類別標簽表示的結果作為人臉識別的結果。本發明對稀疏表達中的字典學習問題提出了新的模型和方法,可以應用于一般情況下的模式識別和圖像分類問題;特別是針對人臉識別應用,本發明提出的字典學習方法,能達到較高的人臉識別準確度。
文檔編號G06K9/00GK102609681SQ201210008299
公開日2012年7月25日 申請日期2012年1月12日 優先權日2012年1月12日
發明者劉詩, 林通, 査紅彬 申請人:北京大學
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 景泰县| 上思县| 抚宁县| 龙江县| 湾仔区| 天峨县| 卓资县| 自治县| 营口市| 芦山县| 清苑县| 湖北省| 绿春县| 阿克陶县| 邵武市| 桂平市| 大竹县| 吴忠市| 兴城市| 平原县| 常德市| 年辖:市辖区| 贵港市| 安乡县| 雷州市| 贡觉县| 报价| 陵川县| 苏尼特右旗| 呼图壁县| 迭部县| 民勤县| 通江县| 邻水| 阳信县| 平和县| 梅河口市| 利辛县| 长春市| 伊通| 白城市|