麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種基于OCR模型的表格數據恢復方法與流程

文檔序號:41773757發布日期:2025-04-29 18:45閱讀:來源:國知局

技術特征:

1.一種基于ocr模型的表格數據恢復方法,其特征在于,包括:

2.根據權利要求1所述的一種基于ocr模型的表格數據恢復方法,其特征在于,所述步驟s1中,將表格圖像作為輕量級模型的輸入,輸出則為表格類型概率。

3.根據權利要求1所述的一種基于ocr模型的表格數據恢復方法,其特征在于,所述步驟s2中,識別表格類型若為無線表格,則:

4.根據權利要求3所述的一種基于ocr模型的表格數據恢復方法,其特征在于,所述步驟s2中,檢測框的具體信息包括但不限于邊界框坐標、置信度分數、類別。

5.根據權利要求3所述的一種基于ocr模型的表格數據恢復方法,其特征在于,所述步驟s2中,表格的物理結構包括表格單元格的多邊形坐標。

6.根據權利要求3所述的一種基于ocr模型的表格數據恢復方法,其特征在于,所述步驟s2中,預處理包括:

7.根據權利要求3所述的一種基于ocr模型的表格數據恢復方法,其特征在于,所述步驟s2中,檢測結果的后處理包括:

8.根據權利要求1所述的一種基于ocr模型的表格數據恢復方法,其特征在于,所述步驟s3包括:


技術總結
本發明公開了一種基于OCR模型的表格數據恢復方法,包括:步驟S1,采用輕量級模型識別表格類型,表格類型包括有線表格和無線表格;步驟S2,分別獲取無線表格的檢測框的邏輯坐標和物理坐標,以及有線表格的單元格物理坐標;步驟S3,根據檢測到的表格坐標,恢復表格的邏輯結構,確定表格的行列關系;步驟S4,使用文本識別模型對圖像進行文字識別,獲取文字框的位置和內容,并通過計算OCR識別文字框和單元格框的坐標重合度進行文字和單元格的準確匹配,確定每個單元格中的文字內容;步驟S5,對于未匹配到文字的單元格,把單元格區域進行裁剪,對這些單元格的圖像區域進行二次OCR識別,補充缺失的文字內容。本發明提高了復雜表格數據的自動化識別和解析能力。

技術研發人員:郭文蔚,車軼,張華,魏吉勇,孔令鍇,周小強
受保護的技術使用者:上海羚數智能科技有限公司
技術研發日:
技術公布日:2025/4/28
當前第2頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 天峻县| 奉化市| 安丘市| 清苑县| 屏南县| 镇安县| 灵宝市| 垦利县| 仁布县| 汪清县| 高州市| 崇文区| 海阳市| 洛宁县| 黄龙县| 桑植县| 于田县| 同心县| 丰宁| 苏尼特右旗| 车险| 信阳市| 沙田区| 安平县| 湖州市| 芜湖市| 五河县| 承德县| 拜泉县| 抚顺县| 靖江市| 扶余县| 泰宁县| 基隆市| 大关县| 弥勒县| 双桥区| 汉阴县| 红桥区| 收藏| 南开区|