本技術涉及圖像識別,更具體地說,本技術涉及一種基于圖像識別的會計憑證分類方法及系統。
背景技術:
1、數據的快速增長和自動化處理需求推動了圖像識別技術的蓬勃發展,其中字符識別作為關鍵的組成部分有著重要的地位,早期的字符識別主要通過模板匹配法進行識別,但對字符變形和噪聲的適應性差,隨后,又通過對字符筆畫、端點等特征進行提取,以進行圖像內容的識別,但對于復雜的手寫體和多樣字體樣式的識別準確性任然不足,隨著辦公自動化的發展,使得紙質文檔轉換位電子數據的需求增加,像財務報表、會計憑證等,人工錄入效率低且易出錯,電子文檔中也需從圖像里提取文本信息,因此,通過圖像識別中的字符識別對不同類型的文本圖像進行識別變得越來越重要。
2、在圖像的字符識別中,字符識別首先對文本圖像進行預處理以提升圖像質量,隨后,通過光學字符識別提取關鍵的字符特征,包括文字信息和版式結構,然后,通過多模態融合方法將圖像特征與文本信息結合,以提高字符識別準確率,在對會計憑證的分類中,通常采用字符識別方法來識別出會計憑證中的文本內容,進而根據識別出的文本內容對會計憑證進行分類,然而,在對會計憑證圖像進行字符識別時,由于會計憑證的格式不固定(不同類型或來源的憑證模板差異較大),包括字段的位置、表單的布局,使得在提取關鍵信息時,尤其在會計憑證種類繁多的情況下,難以識別出會計憑證的關鍵字符特征,從而降低會計憑證的分類有效性,因此,如何在會計憑證格式不固定情況下識別出會計憑證的字符特征,從而提高會計憑證的分類有效性成為了業界面臨的難題。
技術實現思路
1、本技術提供一種基于圖像識別的會計憑證分類方法及系統,可在會計憑證格式不固定情況下識別出會計憑證的關鍵字符特征,從而提高會計憑證的分類有效性。
2、第一方面,本技術提供一種基于圖像識別的會計憑證分類方法,包括如下步驟:
3、對待分類的會計憑證進行圖像采集,得到會計憑證圖像;
4、識別出所述會計憑證圖像中各個字符行的字符區域,確定各個字符區域中選定字符的縱橫比參數,基于所有的縱橫比參數和各個字符區域的水平投影圖從所有的字符區域中提取出所述會計憑證在進行分類時的目標字符區域;
5、確定目標字符區域在字符垂直投影時的投影特征圖,基于目標字符區域中各個相鄰字符間的投影空白間隙和所述投影特征圖的投影分布特征從所述投影特征圖中提取出所有的字符分割點;
6、根據所有的字符分割點對目標字符區域進行字符分割,得到多個字符子區域,對每個字符子區域進行字符識別,得到所述每個字符子區域的字符識別特征;
7、通過所有的字符識別特征確定對所述會計憑證進行分類時的憑證信息。
8、在一些實施例中,識別出所述會計憑證圖像中各個字符行的字符區域具體包括:
9、將所述會計憑證圖像進行傾斜校正,得到會計憑證校正圖像;
10、標注出所述會計憑證校正圖像中的所有字符行;
11、對每個字符行進行邊界框提取,得到所述每個字符行的字符區域。
12、在一些實施例中,確定各個字符區域中選定字符的縱橫比參數具體包括:
13、選取一個字符區域作為選定字符區域;
14、從選定字符區域中提取出中間字符作為選定字符,提取選定字符的外接矩形;
15、通過所述外接矩形確定選定字符區域中選定字符的縱橫比參數;
16、繼續確定剩余字符區域中選定字符的縱橫比參數。
17、在一些實施例中,基于所有的縱橫比參數和各個字符區域的水平投影圖從所有的字符區域中提取出所述會計憑證在進行分類時的目標字符區域具體包括:
18、確定各個字符區域的水平投影圖;
19、從所有的縱橫比參數中提取出最大的縱橫比參數,并將最大的縱橫比參數對應的字符區域作為第一候選字符區域;
20、從所有的水平投影圖中提取出投影跨度最大的水平投影圖,并將提取所得的水平投影圖對應的字符區域作為第二候選字符區域;
21、當所述第一候選字符區域和所述第二候選字符區域為同一區域時,將所述第一候選字符區域和所述第二候選字符區域對應的字符區域進行邊界壓縮,得到所述會計憑證在進行分類時的目標字符區域,反之,則將第二候選字符區域作為所述會計憑證在進行分類時的目標字符區域。
22、在一些實施例中,確定各個字符區域的水平投影圖具體包括:
23、選取一個字符區域作為選定字符區域;
24、對選定字符區域進行二值化處理,得到二值化字符區域,對所述二值化字符區域的每行像素進行黑色像素的統計,得到每行像素的水平投影值,將各行像素的水平投影值作為縱軸元素,將所述二值化字符區域中的各個水平像素位置作為橫軸元素,進而構建出選定字符區域的水平投影圖;
25、繼續確定剩余字符區域的水平投影圖。
26、在一些實施例中,對每個字符子區域進行字符識別,得到所述每個字符子區域的字符識別特征具體包括:
27、獲取預訓練的字符識別模型;
28、選取一個字符子區域作為選定字符子區域,將選定字符子區域作為輸入參數輸入所述字符識別模型,由所述字符識別模型輸出選定字符子區域的字符識別特征;
29、繼續確定剩余字符子區域的字符識別特征,進而得到所述每個字符子區域的字符識別特征。
30、在一些實施例中,通過攝像頭對待分類的會計憑證進行圖像采集。
31、第二方面,本技術提供一種基于圖像識別的會計憑證分類系統,包括:
32、采集模塊,用于對待分類的會計憑證進行圖像采集,得到會計憑證圖像;
33、處理模塊,用于識別出所述會計憑證圖像中各個字符行的字符區域,確定各個字符區域中選定字符的縱橫比參數,基于所有的縱橫比參數和各個字符區域的水平投影圖從所有的字符區域中提取出所述會計憑證在進行分類時的目標字符區域;
34、所述處理模塊,還用于確定目標字符區域在字符垂直投影時的投影特征圖,基于目標字符區域中各個相鄰字符間的投影空白間隙和所述投影特征圖的投影分布特征從所述投影特征圖中提取出所有的字符分割點;
35、所述處理模塊,還用于根據所有的字符分割點對目標字符區域進行字符分割,得到多個字符子區域,對每個字符子區域進行字符識別,得到所述每個字符子區域的字符識別特征;
36、執行模塊,用于通過所有的字符識別特征確定對所述會計憑證進行分類時的憑證信息。
37、第三方面,本技術提供一種計算機設備,所述計算機設備包括存儲器和處理器,所述存儲器存儲有代碼,所述處理器被配置為獲取所述代碼,并執行上述的基于圖像識別的會計憑證分類方法。
38、第四方面,本技術提供一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現上述的基于圖像識別的會計憑證分類方法。
39、本技術公開的實施例提供的技術方案具有以下有益效果:
40、本技術提供的基于圖像識別的會計憑證分類方法及系統中,首先對待分類的會計憑證進行圖像采集,得到會計憑證圖像;其次,識別出所述會計憑證圖像中各個字符行的字符區域,確定各個字符區域中選定字符的縱橫比參數,基于所有的縱橫比參數和各個字符區域的水平投影圖從所有的字符區域中提取出所述會計憑證在進行分類時的目標字符區域;進一步的,確定目標字符區域在字符垂直投影時的投影特征圖,基于目標字符區域中各個相鄰字符間的投影空白間隙和所述投影特征圖的投影分布特征從所述投影特征圖中提取出所有的字符分割點;然后,根據所有的字符分割點對目標字符區域進行字符分割,得到多個字符子區域,對每個字符子區域進行字符識別,得到所述每個字符子區域的字符識別特征;最后,通過所有的字符識別特征確定對所述會計憑證進行分類時的憑證信息。
41、由此可見,本技術可在會計憑證格式不固定下識別出會計憑證的字符特征,從而提高會計憑證的分類有效性;首先,識別出所述會計憑證圖像中各個字符行的字符區域,識別出不同位置處的文本內容,進而得到更多的憑證信息,從而避免會計憑證格式不固定帶來的識別困難;其次,基于所有的縱橫比參數和各個字符區域的水平投影圖從所有的字符區域中提取出所述會計憑證在進行分類時的目標字符區域,以得到會計憑證在進行分類時的特點字符區域,以提高會計憑證的分類精度,進而避免了計憑證種類繁多的情況下帶來的分類誤差;進一步的,基于目標字符區域中各個相鄰字符間的投影空白間隙和所述投影特征圖的投影分布特征從所述投影特征圖中提取出所有的字符分割點,以對后續的單字符進行精確分割,從而避免單字符誤分割帶來的分類錯誤;然后,根據所有的字符分割點對目標字符區域進行字符分割,得到多個字符子區域,并提取得到各個字符子區域的字符識別特征;最后,通過所有的字符識別特征確定對所述會計憑證進行分類時的憑證信息;綜上所述,本技術提供的技術方案可在會計憑證格式不固定情況下識別出會計憑證的字符特征,從而提高會計憑證的分類有效性。