本發(fā)明涉及一種基于差異信息融合的水下陰暗環(huán)境目標檢測方法及裝置,屬于圖像處理和計算機視覺。
背景技術(shù):
1、由于水體對光線的吸收以及散射等效應(yīng),獲得的水下圖像中目標與背景之間顏色對比度低、邊界模糊且噪聲嚴重,給水下作業(yè)帶來了極大的困難。水下陰暗環(huán)境目標檢測就是針對水下光照條件惡劣、色彩失真、水波紋干擾等挑戰(zhàn),旨在準確地將水下拍攝的圖像中的目標從背景中分離的計算機視覺任務(wù)。
2、目前,常用的目標檢測方法主要有基于傳統(tǒng)方法的目標檢測方法和基于深度學習的目標檢測方法。基于傳統(tǒng)方法的目標檢測方法通常依賴于手工提取的特征,例如顏色、紋理、邊界和亮度等。這種方法在面對復(fù)雜場景時,由于依賴手工特征,往往表現(xiàn)出適應(yīng)能力不足,特別是在水下陰暗環(huán)境中,其檢測性能可能受到較大影響。此外,手工特征提取過程耗時且需要專業(yè)知識,這在實際應(yīng)用過程中是一個顯著的局限性。另一方面,基于深度學習的目標檢測方法通過神經(jīng)網(wǎng)絡(luò)自動提取圖像特征,并通過端到端的訓練實現(xiàn)目標檢測。盡管這種方法在很大程度上提高了對復(fù)雜場景的適應(yīng)能力并減少了人工干預(yù),但在水下陰暗環(huán)境下,由于光照條件差和水下環(huán)境噪聲的影響,現(xiàn)有的深度學習目標檢測模型的特征提取能力和目標檢測性能不可避免地會下降。這限制了現(xiàn)有技術(shù)在復(fù)雜水下環(huán)境中的應(yīng)用。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的不足,提供一種基于差異信息融合的水下陰暗環(huán)境目標檢測方法及裝置,采用跨層迭代結(jié)構(gòu)整合多級特征,更好地利用了不同級別特征之間的互補性,采用多尺度條狀卷積減法模塊提取不同層級特征之間的差異信息,突出了有用的信息,有效抑制了冗余背景對目標檢測的干擾,提高目標檢測準確性。
2、為達到上述目的,本發(fā)明是采用下述技術(shù)方案實現(xiàn)的:
3、第一方面,本發(fā)明提供了一種基于差異信息融合的水下陰暗環(huán)境目標檢測方法,包括:
4、獲取水下陰暗環(huán)境下原始圖像;所述原始圖像中包括水下環(huán)境中需要檢測和識別的具體目標,以及構(gòu)成干擾的背景圖像;
5、將獲取的所述原始圖像輸入預(yù)訓練的pvt-v2模型,提取輸入圖像的多個尺度的特征;
6、采用跨層迭代方式融合多層級特征,提取不同層級融合特征之間的差異信息,得到差異性特征圖;
7、融合處于同一層級的多個差異性特征圖,得到增強的差異性特征圖;
8、基于所述增強的差異性特征圖進行解碼,輸出目標檢測結(jié)果;所述檢測結(jié)果為輸入圖像的像素級分割掩碼,指示圖像中的每個像素屬于目標還是背景。
9、優(yōu)選的,所述將獲取的所述原始圖像輸入預(yù)訓練的pvt-v2模型,提取輸入圖像的多個尺度的特征,包括:
10、提取四個尺度的特征,從低到高依次命名為、、、。
11、優(yōu)選的,所述采用跨層迭代方式融合多層級特征,提取不同層級融合特征之間的差異信息,得到差異性特征圖,包括:
12、將特征圖分別與融合,得到差異性特征圖;
13、將特征圖分別與融合,得到差異性特征圖;
14、將特征圖與融合,得到差異性特征圖。
15、優(yōu)選的,所述差異性特征圖計算如下:
16、;
17、其中,和分別代表高層級融合特征與低層級融合特征,如果計算,則指,指,如果計算,則指,指,如果計算,則指,指,如果計算,則指,指,指采用雙線性插值的上采樣操作,代表卷積核大小為?的條形卷積,|·|指對已得結(jié)果取絕對值操作。
18、優(yōu)選的,所述融合處于同一層級的多個差異性特征圖,得到增強的差異性特征圖,包括:
19、、、為同一層級,、為同一層級、為一層級;
20、通過逐元素加法操作融合處于同一層級的差異性特征圖,并使用卷積核大小為3×3的卷積增強特征表示,得到增強的差異性特征圖,,其中對于僅進行3×3的卷積增強。
21、優(yōu)選的,所述基于所述增強的差異性特征圖進行解碼,輸出目標檢測結(jié)果,包括:
22、通過引導注意力模塊解碼所述增強的差異性特征圖,以層級i+1的解碼特征圖和層級i的增強的差異性特征圖作為輸入,對特征圖進行層歸一化操作,之后分別應(yīng)用1×5、5×1和3×3卷積操作并將其結(jié)果相加,得到矩陣;
23、基于層歸一化操作后的;
24、對特征圖進行層歸一化操作,之后分別應(yīng)用1×5、5×1、3×3卷積操作并將其結(jié)果相加,得到矩陣;
25、對和進行拼接,得到增強的矩陣;
26、計算矩陣的轉(zhuǎn)置矩陣與增強矩陣的點積得到注意力得分矩陣,將注意力得分矩陣的每個元素除以矩陣的維度的平方根,之后將結(jié)果送入softmax激活函數(shù)中得到權(quán)重矩陣,將權(quán)重矩陣與矩陣相乘再與相加得到解碼特征圖;
27、將得到的解碼特征圖上采樣恢復(fù)到原始圖像大小,并使用1×1卷積輸出最終的目標分割結(jié)果。
28、第二方面,本發(fā)明提供一種基于差異信息融合的水下陰暗環(huán)境目標檢測裝置,用于實現(xiàn)上述的基于差異信息融合的水下陰暗環(huán)境目標檢測方法,所述裝置包括:
29、數(shù)據(jù)獲取模塊,用于獲取水下陰暗環(huán)境下原始圖像;所述原始圖像中包括水下環(huán)境中需要檢測和識別的具體目標,以及構(gòu)成干擾的背景圖像;
30、特征提取模塊,用于將獲取的所述原始圖像輸入預(yù)訓練的pvt-v2模型,提取輸入圖像的多個尺度的特征;
31、特征融合模塊,用于采用跨層迭代方式融合多層級特征,提取不同層級融合特征之間的差異信息,得到差異性特征圖;
32、特征增強模塊,用于融合處于同一層級的多個差異性特征圖,得到增強的差異性特征圖;
33、解碼輸出模塊,用于基于所述增強的差異性特征圖進行解碼,輸出目標檢測結(jié)果;所述檢測結(jié)果為輸入圖像的像素級分割掩碼,指示圖像中的每個像素屬于目標還是背景。
34、第三方面,本發(fā)明提供一種存儲一個或多個程序的計算機可讀存儲介質(zhì),其特征在于,所述一個或多個程序包括指令,所述指令當由計算設(shè)備執(zhí)行時,使得所述計算設(shè)備執(zhí)行根據(jù)上述的基于差異信息融合的水下陰暗環(huán)境目標檢測方法中的任一方法。
35、第四方面,本發(fā)明提供一種計算設(shè)備,包括,一個或多個處理器、存儲器以及一個或多個程序,其中一個或多個程序存儲在所述存儲器中并被配置為由所述一個或多個處理器執(zhí)行,所述一個或多個程序包括用于執(zhí)行根據(jù)上述的基于差異信息融合的水下陰暗環(huán)境目標檢測方法中的任一方法的指令。
36、與現(xiàn)有技術(shù)相比,本發(fā)明所達到的有益效果為:
37、(1)本發(fā)明提供一種基于差異信息融合的水下陰暗環(huán)境目標檢測方法,采用跨層迭代結(jié)構(gòu)整合多級特征,更好地利用了不同級別特征之間的互補性,并通過迭代的方法實現(xiàn)多級特征交互,整合了更大范圍內(nèi)的上下文信息;
38、(2)本發(fā)明采用多尺度條狀卷積減法模塊提取不同層級特征之間的差異信息,突出了有用的信息,有效抑制了冗余背景對目標檢測的干擾;
39、(3)本發(fā)明采用引導注意力模塊通過挖掘多尺度上下文信息并捕捉不同特征圖之間的關(guān)系,解碼特征圖得到最終的檢測結(jié)果,提高了目標檢測精度。
40、(4)本發(fā)明提供的基于差異信息融合的水下陰暗環(huán)境目標檢測方法在海洋資源開發(fā)、水下探索工程等領(lǐng)域均具有重要工程意義。