本申請涉及計算機,尤其涉及一種光學字符識別方法、裝置、電子設備及可讀存儲介質。
背景技術:
1、光學字符識別(optical?character?recognition,ocr),是一種通過電子設備將印刷或手寫的文字轉換為計算機可編輯文本的過程。光學字符識別利用計算機視覺和深度學習技術,識別圖像中的字符,并將其轉化為文本格式。在數字化時代,ocr技術已成為信息提取、文檔管理、數據挖掘領域的必備工具。
2、在相關技術中,通過ocr識別得到的文本信息中,經常出現內容識別錯誤、拼接錯誤等識別錯誤的問題存在,識別的準確度較低。
技術實現思路
1、本申請公開一種光學字符識別方法、裝置、電子設備及可讀存儲介質,能夠提高識別的準確度。
2、為了解決上述問題,本申請采用下述技術方案:
3、第一方面,本申請實施例公開一種光學字符識別方法,包括:通過將包括待識別字符的目標圖像、以及目標語言種類列表輸入光學字符識別模型,對所述待識別字符進行識別,得到所述光學字符識別模型輸出的第一識別結果,其中,所述目標語言種類列表與所述目標圖像對應;基于所述第一識別結果中與目標位置對應的上下文信息,確定與所述目標位置對應的目標預測詞,其中,所述目標位置為所述第一識別結果中目標詞所在的位置,所述目標詞為所述第一識別結果中的任一詞語;通過將所述目標預測詞填入所述目標位置,得到第二識別結果。
4、第二方面,本申請實施例公開一種光學字符識別裝置,包括:得到模塊,用于通過將包括待識別字符的目標圖像、以及目標語言種類列表輸入光學字符識別模型,對所述待識別字符進行識別,得到所述光學字符識別模型輸出的第一識別結果,其中,所述目標語言種類列表與所述目標圖像對應;確定模塊,用于基于所述第一識別結果中與目標位置對應的上下文信息,確定與所述目標位置對應的目標預測詞,其中,所述目標位置為所述第一識別結果中目標詞所在的位置,所述目標詞為所述第一識別結果中的任一詞語;所述得到模塊,還用于通過將所述目標預測詞填入所述目標位置,得到第二識別結果。
5、第三方面,本申請實施例提供了一種電子設備,該電子設備包括處理器和存儲器,所述存儲器存儲可在所述處理器上運行的程序或指令,所述程序或指令被所述處理器執行時實現如第一方面所述的方法的步驟。
6、第四方面,本申請實施例提供了一種可讀存儲介質,所述可讀存儲介質上存儲程序或指令,所述程序或指令被處理器執行時實現如第一方面所述的方法的步驟。
7、第五方面,本申請實施例提供了一種計算機程序產品,所述計算機程序產品包括存儲在非暫態計算機可讀存儲介質上的計算機程序,所述計算機程序包括程序指令,當所述程序指令被計算機執行時,使所述計算機執行:如第一方面所述的方法的步驟。
8、本申請采用的技術方案能夠達到以下有益效果:
9、本申請實施例提供一種光學字符識別方法,通過將包括待識別字符的目標圖像、以及與目標圖像對應的目標語言種類列表輸入光學字符識別模型,對目標圖像中的待識別字符進行識別,得到光學字符識別模型輸出的第一識別結果,基于第一識別結果中與目標位置對應的上下文信息,確定與目標位置對應的目標預測詞,目標位置為第一識別結果中目標詞所在的位置,目標詞為第一識別結果中的任一詞語,然后通過將目標預測詞填入目標位置,得到第二識別結果,實現對光學字符識別模型輸出的第一識別結果的修正,能夠提升光學字符識別的準確度。
1.一種光學字符識別方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述基于所述第一識別結果中與目標位置對應的上下文信息,確定與所述目標位置對應的目標預測詞,包括:
3.根據權利要求2所述的方法,其特征在于,所述基于所述第一識別結果中與目標位置對應的上下文信息,確定與所述目標位置對應的預測詞以及與各個所述預測詞對應的概率信息,包括:
4.根據權利要求3所述的方法,其特征在于,所述基于所述第一識別結果中與目標位置對應的上下文信息,確定與所述目標位置對應的預測詞以及與各個所述預測詞對應的出現概率,包括:
5.根據權利要求3所述的方法,其特征在于,所述基于所述第一識別結果中與目標位置對應的上下文信息,確定與所述目標位置對應的預測詞以及與各個所述預測詞對應的出現概率,包括:
6.根據權利要求3所述的方法,其特征在于,所述分別確定目標詞與各個所述預測詞的相似概率,包括:
7.根據權利要求1所述的方法,其特征在于,在所述通過將包括待識別字符的目標圖像、以及目標語言種類列表輸入光學字符識別模型,對所述待識別字符進行識別,得到所述光學字符識別模型輸出的第一識別結果之前,還包括:
8.根據權利要求1所述的方法,其特征在于,在所述通過將包括待識別字符的目標圖像、以及目標語言種類列表輸入光學字符識別模型,對所述待識別字符進行識別,得到所述光學字符識別模型輸出的第一識別結果之前,還包括:
9.根據權利要求8所述的方法,其特征在于,所述基于目標數據,確定目標圖像,包括:
10.根據權利要求9所述的方法,其特征在于,在所述目標數據為動態圖像文件,且所述第一灰階圖像為所述動態圖像文件中的目標幀圖像對應的灰階圖像的情況下,所述通過對所述第一灰階圖像進行背景剝離,得到第一圖像,包括:
11.根據權利要求9所述的方法,其特征在于,在所述目標數據為不可編輯文檔,且所述第一灰階圖像包括多張文檔分頁圖像的情況下,所述通過對所述第一灰階圖像進行背景剝離,得到第一圖像,包括:
12.根據權利要求9所述的方法,其特征在于,所述基于所述目標圖像像素矩陣,確定目標圖像,包括:
13.根據權利要求12所述的方法,其特征在于,所述基于所述第二圖像中各個像素點對應的第二像素梯度強度,確定目標圖像,包括:
14.根據權利要求13所述的方法,其特征在于,所述基于所述第二圖像中各個像素點對應的第三像素梯度強度,確定目標圖像,包括:
15.一種光學字符識別裝置,其特征在于,包括:
16.一種電子設備,其特征在于,包括處理器和存儲器,所述存儲器存儲可在所述處理器上運行的程序或指令,所述程序或指令被所述處理器執行時實現如權利要求1-14任一項所述的光學字符識別方法的步驟。
17.一種可讀存儲介質,其特征在于,所述可讀存儲介質上存儲程序或指令,所述程序或指令被處理器執行時實現如權利要求1-14任一項所述的光學字符識別方法的步驟。
18.一種計算機程序產品,其特征在于,所述計算機程序產品包括存儲在非暫態計算機可讀存儲介質上的計算機程序,所述計算機程序包括程序指令,當所述程序指令被計算機執行時,使所述計算機執行:如權利要求1-14任一項所述的光學字符識別方法的步驟。