本發明涉及計算機視覺術領域,尤其涉及一種基于多視角相似度聚合的對比學習無監督行人重識別方法。
背景技術:
1、無監督行人重識別技術利用計算機視覺技術,在不確定的場景中通過穿著、體態、發型等特征識別特定行人,其核心在于無需人工標注數據即可實現行人身份的自動識別和匹配。其中,該技術依賴于高效的特征匹配算法,通過比較不同幀間行人的特征,實現跨幀的行人身份連續確認,進而提取出行人的行走速度、行動軌跡以及行進方向等關鍵信息,該技術旨在彌補固定攝像頭的視覺局限,并可與行人檢測、行人跟蹤等技術相結合,廣泛應用于智能視頻監控、智能安保等領域。然而,無監督行人重識別面臨著諸多挑戰,如行人間的相互遮擋、外觀特征的相似性混淆以及行人移動速度過快導致的圖像模糊等問題。在實際應用場景中,這些復雜因素往往導致重識別性能的降低,出現身份誤判和身份標識混淆等難題。因此,開發一種能在復雜環境中穩定工作且具有高度魯棒性的無監督行人重識別技術顯得尤為重要。
技術實現思路
1、有鑒于此,本發明的目的在于提出一種基于多視角相似度聚合的對比學習無監督行人重識別方法,以解決休閑游方法識別準確率不足的問題。
2、基于上述目的,本發明提供了一種基于多視角相似度聚合的對比學習無監督行人重識別方法,包括以下步驟:
3、s1、獲取行人視頻,對行人進行跟蹤并裁剪圖片,得到行人多角度圖像;
4、s2、使用resnet50作為骨干網絡,提取所有行人多角度圖像的全局特征;
5、s3、使用dbscan聚類算法為全局所有訓練實例分配偽標簽;
6、s4、利用多級對比學習模塊獲取實例之間的關系;
7、s5、計算對比損失,監督網絡的學習,得出得到行人重識別結果。
8、優選的,步驟s1具體包括:
9、將未標記的行人數據集記為其中xi為第i張圖像,n為圖像數;行人樣本經resnet50的layer4后得到粗略的共享全局特征,表示為fθ(xi)∈rc×h×w,其中c、h、w分別表示通道的大小、特征圖的高度和寬度;
10、網絡分為兩路,由全局特征分支f-g和包含的三個局部特征分支f-pn,n=1,2,3,聯合構建,其中n為分支總數,用于學習豐富且多樣化的行人表示,在全局分支中,通過對輸出特征f應用可學習的廣義均值(gem)池化作為一種細粒度的實例檢索,得到全局特征
11、在局部分支中,將輸出特征f劃分為三個水平條帶,同樣應用gem得到局部細化的特征最終得到全局和局部實例特征集,表示為下式,t為訓練周期:
12、
13、優選的,步驟s2具體包括:
14、re-id多視角特征圖進行切分,構建多視角外觀特征提取模塊中的局部細化的多分支網絡獲取多樣化的特征表示;
15、針對多視角特征圖分支結構,嵌入多通道感知注意力網絡聚合不同尺度的外觀特征信息,以豐富多視角行人特征所包含的高層語義信息。
16、優選的,步驟s3具體包括:
17、通過memory?k(k=1,2,3,4)來存儲所有樣本的實例特征,并在訓練過程中通過相應分支的輸出特征進行更新;
18、融合分層聚類模塊對提取的圖像特征進行融合聚類,多視角分支特征共享相同的偽標簽。
19、優選的,在訓練過程中通過相應分支的輸出特征進行更新包括:
20、通過下式進行更新;
21、
22、其中,m∈rn×d,d是特征維數;和分別表示不同分支的輸出特征;和分別表示存儲在各自memory中、累積不同輸出特征后的聚類特征;α∈[0,1]為更新速率。
23、優選的,步驟s4具體包括:
24、特征提取與正負樣本對構建;
25、使用歐氏距離計算特征向量之間的距離,衡量特征向量之間的相似性和差異性;余弦距離越接近1,表示兩個特征向量越相似;越接近-1,表示兩個特征向量越不相似;
26、定義對比損失函數,計算實例特征向量f與其所屬聚類簇質心c之間的內積,度量它們之間的相似性;
27、計算實例特征向量f與第k個聚類簇質心ck之間的內積,比較f與不屬于其聚類簇的質心之間的相似性;
28、利用統一的對比損失來監督網絡的學習。
29、優選的,步驟s4進一步包括:
30、將全局特征水平分割并分別計算全局分支與局部分支的對比損失,為了平衡各分支中的損失權重,利用公式下式作為模型損失,其中,表示全局分支部分的損失,表示局部分支部分的損失(n=3),1/3為權重因子;
31、
32、在分配一個偽標簽后,利用實例特征來構造統一的對比損失來監督網絡的學習,其中統一對比損失函數定義為下式:
33、
34、其中,f表示實例特征,代表全局特征和局部分支特征c+表示f所屬聚類簇的質心特征中心,ck表示ck所屬聚類簇的質心,k是聚類簇的數量,τ為超參數,<,>用來計算兩個特征向量之間的內積來度量它們的相似性。
35、本發明的有益效果:該方法可廣泛應用于智能安防、視頻監控、人機交互等領域,為行人追蹤、行為分析等提供有力支持。
36、本發明通過融合多視角圖像特征和對比學習策略,有效減少了視角變化和光照條件對行人重識別的影響,顯著提高了識別精度。同時,無監督方法避免了對大量標注數據的依賴,使得模型能夠更好地適應不同場景和條件,增強了泛化能力。
1.一種基于多視角相似度聚合的對比學習無監督行人重識別方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的基于多視角相似度聚合的對比學習無監督行人重識別方法,其特征在于,步驟s1具體包括:
3.根據權利要求1所述的基于多視角相似度聚合的對比學習無監督行人重識別方法,其特征在于,步驟s2具體包括:
4.根據權利要求1所述的基于多視角相似度聚合的對比學習無監督行人重識別方法,其特征在于,步驟s3具體包括:
5.根據權利要求4所述的基于多視角相似度聚合的對比學習無監督行人重識別方法,其特征在于,所述在訓練過程中通過相應分支的輸出特征進行更新包括:
6.根據權利要求1所述的基于多視角相似度聚合的對比學習無監督行人重識別方法,其特征在于,步驟s4具體包括:
7.根據權利要求6所述的基于多視角相似度聚合的對比學習無監督行人重識別方法,其特征在于,步驟s4進一步包括: