麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

圖像識別模型的訓練方法、識別方法、設(shè)備及存儲介質(zhì)與流程

文檔序號:41769917發(fā)布日期:2025-04-29 18:40閱讀:6來源:國知局
圖像識別模型的訓練方法、識別方法、設(shè)備及存儲介質(zhì)與流程

本公開涉及基于人工智能的圖像處理領(lǐng)域,具體涉及一種圖像識別模型的訓練方法、識別方法、設(shè)備及存儲介質(zhì)。


背景技術(shù):

1、隨著人工智能技術(shù)的發(fā)展,在醫(yī)療領(lǐng)域中,通過眼底識別系統(tǒng)對患者的眼底圖像進行分析越來越普遍。眼底識別系統(tǒng)一般是指利用由人工智能技術(shù)得到的可以對眼底圖像進行病變識別的圖像識別模型。

2、目前,圖像識別模型的訓練方法一般是將眼底圖像和眼底圖像對應的真實標簽作為監(jiān)督信號來對圖像識別模型進行訓練。具體地,通過計算眼底圖像的預測結(jié)果與真實標簽對應的結(jié)果的差異程度來對圖像識別模型的參數(shù)進行優(yōu)化。

3、然而,在眼底圖像的采集過程中,一些因素(例如采集環(huán)境或采集人員的經(jīng)驗等)對眼底圖像的采集有較大影響,導致采集到的同一個眼底的眼底圖像變化較大(例如眼底圖像的拍攝角度或拍攝亮度不同等)。利用現(xiàn)有訓練方法獲得的圖像識別模型對同個眼底在不同因素下獲得的眼底圖像進行識別可能會得到不同的結(jié)果,因此,識別算法對同一個眼底的不同因素下獲得的圖像的識別一致性還有待提高。


技術(shù)實現(xiàn)思路

1、本公開是有鑒于上述的狀況而提出的,其目的在于提供一種能夠提高眼底圖像的識別一致性的圖像識別模型的訓練方法、識別方法、設(shè)備及存儲介質(zhì)。

2、為此,本公開的第一方面提供一種圖像識別模型的訓練方法,包括:獲取多張訓練眼底圖像;對所述訓練眼底圖像進行數(shù)據(jù)擴增以獲取擴增圖像;并且在每次迭代中,將所述擴增圖像輸入至所述圖像識別模型中以獲得相應的包括特征映射的預測結(jié)果,基于歷史模型和當前模型獲得的所述預測結(jié)果獲得第一損失函數(shù)并利用所述第一損失函數(shù)對所述圖像識別模型進行優(yōu)化,其中,所述歷史模型為所述當前模型的前任一次優(yōu)化所得的圖像識別模型;基于所述歷史模型和所述當前模型獲得的與同一張訓練眼底圖像所對應的至少兩張擴增圖像的特征圖計算所述第一損失函數(shù),所述特征圖由與所述擴增圖像的多個特征映射組成。

3、在本公開的第一方面中,通過對獲取到的訓練眼底圖像進行數(shù)據(jù)擴增,能夠提高訓練集中眼底圖像的數(shù)據(jù)多樣性和圖像識別模型的泛化能力,進而能夠提高圖像識別模型對基于同一眼底的不同形式的眼底圖像的識別一致性。另外,通過與同一張訓練眼底圖像相關(guān)的特征圖計算第一損失函數(shù)以優(yōu)化圖像識別模型,能夠提高與同一張訓練眼底圖像相關(guān)的特征映射的相似度,進而能夠提高相關(guān)圖像的預測結(jié)果的一致性。另外,通過基于歷史模型和當前模型所對應的多張擴增圖像確定的特征圖來優(yōu)化圖像識別模型,能夠提高圖像識別模型的魯棒性,并且能夠提高圖像識別模型對基于同一眼底的不同形式的眼底圖像的識別一致性。

4、另外,在本公開第一方面所涉及的訓練方法中,可選地,所述預測結(jié)果還包括預測類別,還包括:獲取各張所述訓練眼底圖像對應的真實標簽;基于所述真實標簽和所述當前模型獲得的所述預測類別獲得第二損失函數(shù);并且利用所述第一損失函數(shù)和所述第二損失函數(shù)對所述圖像識別模型進行優(yōu)化。在這種情況下,基于第二損失函數(shù)對圖像識別模型的參數(shù)進行優(yōu)化,能夠使預測類別和真實標簽接近。另外,通過結(jié)合第一損失函數(shù)和第二損失函數(shù)優(yōu)化圖像識別模型,能夠提高圖像識別模型基于同一眼底的不同形式的訓練眼底圖像的特征提取的能力。

5、另外,在本公開第一方面所涉及的訓練方法中,可選地,基于所述第一損失函數(shù)和所述第二損失函數(shù)并利用反向傳播算法更新所述當前模型的參數(shù)以對所述圖像識別模型進行優(yōu)化;所述歷史模型不參與反向傳播。在這種情況下,通過利用反向傳播算法更新當前模型(也即,最新獲取的圖像識別模型)的參數(shù),能夠提高獲取圖像識別模型的參數(shù)的準確性,進而能夠使預測類別和真實標簽更加接近。

6、另外,在本公開第一方面所涉及的訓練方法中,可選地,對所述同一張訓練眼底圖像所對應的兩張擴增圖像的所述特征圖中的兩組特征映射進行相似度比較以獲得所述第一損失函數(shù)。在這種情況下,通過基于第一損失函數(shù),能夠提高圖像識別模型所提取的特征映射的一致性,進而能夠進一步提高基于同一眼底的不同形式的訓練眼底圖像的識別一致性。

7、另外,在本公開第一方面所涉及的訓練方法中,可選地,在每次迭代過程中,對于一張所述訓練眼底圖像:獲取隨機數(shù);并且基于所述隨機數(shù)確定是否進行所述數(shù)據(jù)擴增和所述數(shù)據(jù)擴增的運算。在這種情況下,通過隨機數(shù)確定更新的方式,能夠提高訓練眼底圖像分布的均衡性,抑制在比例大的訓練樣本的域偏移,進而能夠提高圖像識別模型泛化能力。

8、另外,在本公開第一方面所涉及的訓練方法中,可選地,所述數(shù)據(jù)擴增的運算包括圖像復制、圖像翻轉(zhuǎn)、圖像旋轉(zhuǎn)、圖像扭曲、圖像縮放、圖像壓縮、圖像隨機剪裁、圖像隨機邊緣填充、圖像對比度調(diào)整、圖像亮度調(diào)整、圖像色度調(diào)整、圖像飽和度調(diào)整、圖像色彩抖動、圖像添加噪聲、圖像模糊、圖像區(qū)域隨機擦除、背景色變換和圖像風格轉(zhuǎn)換中的至少一種。在這種情況下,通過對訓練眼底圖像進行不同的數(shù)據(jù)擴增的運算,能夠提高圖像識別模型的泛化能力和魯棒性,并且能夠減少域偏移現(xiàn)象的發(fā)生。

9、另外,在本公開第一方面所涉及的訓練方法中,可選地,所述訓練眼底圖像在所述數(shù)據(jù)擴增處理之前,對所述訓練眼底圖像進行預處理操作。在這種情況下,能夠消除訓練眼底圖像中無關(guān)的信息,增強有關(guān)信息的可檢測性和最大限度地簡化數(shù)據(jù),進而能夠提高識別的可靠性。

10、本公開的第二方面提供一種眼底圖像識別方法,包括:獲取待識別的眼底圖像;并且將所述待識別的眼底圖像輸入至經(jīng)訓練模型,得到與所述待識別的眼底圖像對應的識別結(jié)果;其中,所述經(jīng)訓練模型是基于本公開的第一方面所涉及的訓練方法獲得的當前模型。由此,能夠提高經(jīng)訓練模型對基于同一眼底的不同形式的眼底圖像的識別一致性。

11、本公開的第三方面提供一種電子設(shè)備,包括存儲器、處理器和存儲在所述存儲器上并在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)本公開的第一方面所涉及的圖像識別模型的訓練方法,或者實現(xiàn)本公開第二方面的所涉及的眼底圖像識別方法。

12、本公開第四方面提供一種非暫態(tài)計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)本公開的第一方面所涉及的圖像識別模型的訓練方法,或者實現(xiàn)本公開的第二方面所涉及的眼底圖像識別方法。

13、根據(jù)本公開,提供一種能夠提高眼底圖像的識別一致性的圖像識別模型的訓練方法、識別方法、設(shè)備及存儲介質(zhì)。



技術(shù)特征:

1.一種圖像識別模型的訓練方法,其特征在于,包括:獲取多張訓練眼底圖像;對所述訓練眼底圖像進行數(shù)據(jù)擴增以獲取擴增圖像;并且在每次迭代中,將所述擴增圖像輸入至所述圖像識別模型中以獲得相應的包括特征映射的預測結(jié)果,基于歷史模型和當前模型獲得的所述預測結(jié)果獲得第一損失函數(shù)并利用所述第一損失函數(shù)對所述圖像識別模型進行優(yōu)化,其中,所述歷史模型為所述當前模型的前任一次優(yōu)化所得的圖像識別模型;基于所述歷史模型和所述當前模型獲得的與同一張訓練眼底圖像所對應的至少兩張擴增圖像的特征圖計算所述第一損失函數(shù),所述特征圖由與所述擴增圖像的多個特征映射組成。

2.根據(jù)權(quán)利要求1所述的圖像識別模型的訓練方法,其特征在于,所述預測結(jié)果還包括預測類別,還包括:獲取各張所述訓練眼底圖像對應的真實標簽;基于所述真實標簽和所述當前模型獲得的所述預測類別獲得第二損失函數(shù);并且利用所述第一損失函數(shù)和所述第二損失函數(shù)對所述圖像識別模型進行優(yōu)化。

3.根據(jù)權(quán)利要求2所述的圖像識別模型的訓練方法,其特征在于,基于所述第一損失函數(shù)和所述第二損失函數(shù)并利用反向傳播算法更新所述當前模型的參數(shù)以對所述圖像識別模型進行優(yōu)化;所述歷史模型不參與反向傳播。

4.根據(jù)權(quán)利要求1所述的圖像識別模型的訓練方法,其特征在于,對所述同一張訓練眼底圖像所對應的兩張擴增圖像的所述特征圖中的兩組特征映射進行相似度比較以獲得所述第一損失函數(shù)。

5.根據(jù)權(quán)利要求1所述的圖像識別模型的訓練方法,其特征在于,在每次迭代過程中,對于一張所述訓練眼底圖像:獲取隨機數(shù);并且基于所述隨機數(shù)確定是否進行所述數(shù)據(jù)擴增和所述數(shù)據(jù)擴增的運算。

6.根據(jù)權(quán)利要求1所述的圖像識別模型的訓練方法,其特征在于,所述數(shù)據(jù)擴增的運算包括圖像復制、圖像翻轉(zhuǎn)、圖像旋轉(zhuǎn)、圖像扭曲、圖像縮放、圖像壓縮、圖像隨機剪裁、圖像隨機邊緣填充、圖像對比度調(diào)整、圖像亮度調(diào)整、圖像色度調(diào)整、圖像飽和度調(diào)整、圖像色彩抖動、圖像添加噪聲、圖像模糊、圖像區(qū)域隨機擦除、背景色變換和圖像風格轉(zhuǎn)換中的至少一種。

7.根據(jù)權(quán)利要求1所述的圖像識別模型的訓練方法,其特征在于,所述訓練眼底圖像在所述數(shù)據(jù)擴增處理之前,對所述訓練眼底圖像進行預處理操作。

8.一種眼底圖像識別方法,其特征在于,包括:獲取待識別的眼底圖像;并且將所述待識別的眼底圖像輸入至經(jīng)訓練模型,得到與所述待識別的眼底圖像對應的識別結(jié)果;其中,所述經(jīng)訓練模型是基于權(quán)利要求1至7任一項所述的訓練方法獲得的當前模型。

9.一種電子設(shè)備,包括存儲器、處理器和存儲在所述存儲器上并在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述程序時實現(xiàn)如權(quán)利要求1至7任一項所述的圖像識別模型的訓練方法,或者實現(xiàn)如權(quán)利要求8所述的眼底圖像識別方法。

10.一種非暫態(tài)計算機可讀存儲介質(zhì),所述可讀存儲介質(zhì)上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至7任一項所述的圖像識別模型的訓練方法,或者實現(xiàn)如權(quán)利要求8所述的眼底圖像識別方法。


技術(shù)總結(jié)
本公開描述一種圖像識別模型的訓練方法、識別方法、設(shè)備及存儲介質(zhì),訓練方法包括:獲取多張訓練眼底圖像;對訓練眼底圖像進行數(shù)據(jù)擴增以獲取擴增圖像;并且在每次迭代中,將擴增圖像輸入至圖像識別模型中以獲得相應的包括特征映射的預測結(jié)果,基于歷史模型和當前模型獲得的預測結(jié)果獲得第一損失函數(shù)并利用第一損失函數(shù)對圖像識別模型進行優(yōu)化,其中,歷史模型為當前模型的前任一次優(yōu)化所得的圖像識別模型;基于歷史模型和當前模型的至少兩張擴增圖像的特征圖計算第一損失函數(shù),特征圖由與擴增圖像的多個特征映射組成。由此,提供一種能夠提高眼底圖像的識別一致性的圖像識別模型的訓練方法、識別方法、設(shè)備及存儲介質(zhì)。

技術(shù)研發(fā)人員:潘曉春,鄭萬鐸,王娟,夏斌
受保護的技術(shù)使用者:深圳硅基智能科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/4/28
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 廊坊市| 汉川市| 银川市| 兴山县| 晋中市| 车险| 沁水县| 芦山县| 江孜县| 昂仁县| 宜阳县| 宁海县| 彭水| 元江| 芦山县| 沈丘县| 二连浩特市| 仙桃市| 建德市| 鸡西市| 井冈山市| 教育| 汉阴县| 保康县| 寻乌县| 托里县| 兴城市| 都昌县| 湖北省| 凤山县| 兰西县| 兰考县| 龙陵县| 庄浪县| 云霄县| 永兴县| 顺昌县| 乳山市| 呼伦贝尔市| 浪卡子县| 青州市|