一種影像文件識別方法、裝置、設備、介質及產品與流程

文檔序號：41753605發布日期：2025-04-29 18:21閱讀：3來源：國知局

本申請涉及人工智能，尤其涉及一種影像文件識別方法、裝置、設備、介質及產品。

背景技術：

1、在金融機構為客戶辦理銀票、貿易融資等法貸業務時，為確保融資基于真實的貿易背景，需要采集(或錄入)客戶提供的貿易合同和發票信息，并對其進行真實性核驗。

2、現有方法通常是用戶提交銀票開票申請后，將對應的貿易合同及發票紙質資料交到銀行柜面。工作人員將貿易合同及發票信息，逐份手工維護到信貸系統中。并且將紙質資料掃描為影像資料后歸檔。工作人員手動核實合同信息(比如購貨方，銷貨方、金額、日期、簽章等)以及核實發票信息(比如核驗發票真實性)。以銀票為例，如果開立100張銀票，那么對應10個貿易合同及1000張發票。采用現有方法需要花費大量的時間和精力，手工完成貿易合同和發票信息的系統錄入和核對，工作量非常大，這樣耗時費力不僅會影響工作效率，而且準確性也較差。

技術實現思路

1、本申請提供了一種影像文件識別方法、裝置、設備、介質及產品，為業務流程中涉及影像文件處理的環節提供了自動化的解決方案，減少了人工手動操作的繁瑣與誤差，提高了信息錄入的工作效率和準確率。

2、第一方面，本申請提供了一種影像文件識別方法，該方法包括：

3、接收待識別的初始影像文件，并確定所述初始影像文件的影像類型；

4、當所述影像類型為非標文件時，對所述初始影像文件進行預處理得到所述初始影像文件在標準文件格式下對應的目標影像文件；

5、對所述目標影像文件中的字符進行提取，得到對應的關鍵數據集；

6、對所述關鍵數據集進行語義識別，得到所述初始影像文件對應的結構化信息。

7、進一步的，對所述初始影像文件進行預處理得到所述初始影像文件在標準文件格式下對應的目標影像文件，包括：檢測所述初始影像文件相對于標準識別角度下的頁面傾斜角度；基于所述頁面傾斜角度將所述初始影像文件旋轉至標準識別角度；在所述標準識別角度下，識別所述初始影像文件中的文檔首頁，所述文檔首頁為所述初始影像文件中多個子文件對應的首頁；當所述文檔首頁的數量為至少兩個時，基于所述文檔首頁在所述初始影像文件中的頁面位置對所述初始影像文件進行拆分，得到至少兩份所述目標影像文件。

8、進一步的，當所述非標文件為貿易合同時，識別所述初始影像文件中的文檔首頁，包括：對于所述初始影像文件中任一張頁面，識別所述頁面的內容中是否包含封面標識信息，所述封面標識信息至少包括合同編號和簽訂雙方；若包含所述封面標識信息，則確定所述頁面為所述文檔首頁；遍歷所述初始影像文件中每張頁面，得到所述初始影像文件中所包含的文檔首頁。

9、進一步的，所述方法還包括：當所述影像類型為標準文件時，獲取所述標準文件對應的標準模板；基于所述標準模板對所述初始影像文件進行語義識別，得到所述初始影像文件對應的結構化信息。

10、進一步的，當所述標準文件為發票時，在基于所述標準模板對所述初始影像文件進行語義識別之前，還包括：調用發票驗真接口對所述初始影像文件進行真偽校驗；當真偽校驗結果為校驗成功時，執行基于所述標準模板對所述初始影像文件進行語義識別。

11、進一步的，在對所述初始影像文件進行預處理得到所述初始影像文件在標準文件格式下對應的目標影像文件之前，還包括：確定所述初始影像文件是否為壓縮包格式；若是，則對所述初始影像文件進行解壓處理。

12、第二方面，本申請提供了一種影像文件識別裝置，該裝置包括：

13、類型確定模塊，用于接收待識別的初始影像文件，并確定所述初始影像文件的影像類型；

14、文件處理模塊，用于當所述影像類型為非標文件時，對所述初始影像文件進行預處理得到所述初始影像文件在標準文件格式下對應的目標影像文件；

15、信息提取模塊，用于對所述目標影像文件中的字符進行提取，得到對應的關鍵數據集；

16、文件識別模塊，用于對所述關鍵數據集進行語義識別，得到所述初始影像文件對應的結構化信息。

17、第三方面，本申請提供了一種電子設備，該電子設備包括：至少一個處理器；以及與所述至少一個處理器通信連接的存儲器；其中，所述存儲器存儲有可被所述至少一個處理器執行的計算機程序，所述計算機程序被所述至少一個處理器執行，以使所述至少一個處理器能夠執行本申請任意實施例所述的影像文件識別方法。

18、第四方面，本申請提供了一種計算機可讀存儲介質，所述計算機可讀存儲介質存儲有計算機指令，所述計算機指令用于使處理器執行時實現本申請任意實施例所述的影像文件識別方法。

19、第五方面，本申請提供了一種計算機程序產品，包括計算機程序，所述計算機程序在被處理器執行時實現本申請任意實施例所述的影像文件識別方法。

20、為了解決背景技術中現有技術的缺陷，本申請實施例提供了一種影像文件識別方法，執行該方法能夠帶來以下有益效果：接收待識別的初始影像文件，并確定初始影像文件的影像類型；當影像類型為非標文件時，對初始影像文件進行預處理得到初始影像文件在標準文件格式下對應的目標影像文件，這樣可以極大地提升了文件的通用性和后續處理的便利性，讓不同格式、規格的非標文件能夠納入統一的、標準化的處理流程中。對目標影像文件中的字符進行提取，得到對應的關鍵數據集；對關鍵數據集進行語義識別，將離散的字符信息轉化為具有明確邏輯結構和語義內涵的初始影像文件對應的結構化信息。這種結構化信息可直接被各類業務系統整合應用，為企業內不同業務場景下的決策提供有力支持。本申請為業務流程中涉及影像文件處理的環節提供了自動化的解決方案，減少了人工手動操作的繁瑣與誤差，提高了信息錄入的工作效率和準確率。

21、需要說明的是，上述計算機指令可以全部或者部分存儲在計算機可讀存儲介質上。其中，計算機可讀存儲介質可以與影像文件識別裝置的處理器封裝在一起，也可以與影像文件識別裝置的處理器單獨封裝，本申請對此不做限定。

22、本申請中第二方面、第三方面、…、以及第五方面的描述，可以參考第一方面的詳細描述；并且，第二方面、第三方面、…、以及第五方面的描述的有益效果，可以參考第一方面的有益效果分析，此處不再贅述。

23、應當理解，本部分所描述的內容并非旨在標識本申請的實施例的關鍵或重要特征，也不用于限制本申請的范圍。本申請的其他特征將通過以下的說明書而變得容易理解。

24、可以理解的是，在使用本申請各實施例公開的技術方案之前，均應當依據相關法律法規通過恰當的方式對本申請所涉及個人信息的類型、使用范圍以及使用場景等告知用戶并獲得用戶的授權。

技術特征：

1.一種影像文件識別方法，其特征在于，所述方法包括：

2.根據權利要求1所述的影像文件識別方法，其特征在于，對所述初始影像文件進行預處理得到所述初始影像文件在標準文件格式下對應的目標影像文件，包括：

3.根據權利要求2所述的影像文件識別方法，其特征在于，當所述非標文件為貿易合同時，識別所述初始影像文件中的文檔首頁，包括：

4.根據權利要求1所述的影像文件識別方法，其特征在于，所述方法還包括：

5.根據權利要求4所述的影像文件識別方法，其特征在于，當所述標準文件為發票時，在基于所述標準模板對所述初始影像文件進行語義識別之前，還包括：

6.根據權利要求1所述的影像文件識別方法，其特征在于，在對所述初始影像文件進行預處理得到所述初始影像文件在標準文件格式下對應的目標影像文件之前，還包括：

7.一種影像文件識別裝置，其特征在于，所述裝置包括：

8.一種電子設備，其特征在于，所述電子設備包括：

9.一種計算機可讀存儲介質，其特征在于，所述計算機可讀存儲介質存儲有計算機指令，所述計算機指令用于使處理器執行時實現權利要求1至6中任一項所述的影像文件識別方法。

10.一種計算機程序產品，包括計算機程序，所述計算機程序在被處理器執行時實現根據權利要求1至6中任一項所述的影像文件識別方法。

技術總結
本申請公開了一種影像文件識別方法、裝置、設備、介質及產品，涉及人工智能技術領域。其中，該方法包括：接收待識別的初始影像文件，并確定初始影像文件的影像類型；當影像類型為非標文件時，對初始影像文件進行預處理得到初始影像文件在標準文件格式下對應的目標影像文件；對目標影像文件中的字符進行提取，得到對應的關鍵數據集；對關鍵數據集進行語義識別，得到初始影像文件對應的結構化信息。本申請為業務流程中涉及影像文件處理的環節提供了自動化的解決方案，減少了人工手動操作的繁瑣與誤差，提高了信息錄入的工作效率和準確率。

技術研發人員：羅世謙,馮余劍,程鵬,顧旦青
受保護的技術使用者：中國工商銀行股份有限公司
技術研發日：
技術公布日：2025/4/28

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：羅世謙,馮余劍,程鵬,顧旦青
技術所有人：中國工商銀行股份有限公司
我是此專利的發明人

上一篇：結構緊湊且噪音低的無齒輪直驅式卷門機的制作方法
上一篇：一種新型分級機的制作方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網絡及物聯網
4、王老師：1.計算機網絡安全 2.計算機仿真技術
5、王老師：1.網絡安全；物聯網安全、大數據安全 2.安全態勢感知、輿情分析和控制 3.區塊鏈及應用
如您是高校老師，可以點此聯系我們加入專家庫。

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種影像文件識別方法、裝置、設備、介質及產品與流程

一種影像文件識別方法、裝置、設備、介質及產品與流程