麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

圖像處理設備和圖像處理方法與流程

文檔序號:11155168閱讀:574來源:國知局
圖像處理設備和圖像處理方法與制造工藝

本發明涉及圖像處理設備和圖像處理方法。



背景技術:

日本未經審查的專利申請公開No.9-138837公開了以下的技術:提取二值圖像的水平和垂直邊界,檢測圖的拐角,檢測充當邊界交叉處的點,連接這些點,檢測具有矩形形狀的最靠外外部框架的輪廓,提取框架結構的特征,通過參考列出預先登記的框架結構的特征的框架結構參考表來識別輸入報告形式,并且檢測字符讀取區域。

日本未經審查的專利申請公開No.6-119491公開了以下的技術:準備將識別目標報告形式的各項之間的物理布局關系與條目類型(諸如,用戶的地址和名稱)關聯的報告形式定義表,從輸入報告形式的圖像數據中提取限定連續排列的白色像素的邊界的矩形,將大小等于或大于閾值的矩形確定為寫框架,用報告形式定義表的定義信息來檢查得自所確定的寫框架的各項的物理布局關系,確定寫入項的類型,并且使用各寫入項的類型特有的信息對寫入項執行字符識別操作。

可通過識別在原始文檔(諸如,報告形式)中繪出的字符和邊界將原始文檔分類。例如,字符或邊界的識別可根據原始文檔的類型而表現得好或不好。



技術實現要素:

本發明的目的是相比于使用不顧及原始文檔類型而確定的識別處理的系統,在分類原始文檔時大幅提高了分類準確性。

根據本發明的第一方面,提供了一種圖像處理設備。所述圖像處理設備包括:獲取單元,其獲取原始文檔上形成的圖像的圖像信息;以及分類單元,其使用所述獲取單元獲取的圖像信息,響應于作為第一識別操作和第二識別操作中的一個的操作結果,按照所述第一識別操作和所述第二識別操作中的所述一個或兩個將所述圖像分類。所述第一識別操作被配置為根據所述圖像的特征量將圖像分類,所述第二識別操 作被配置為根據圖像的字符信息將所述圖像分類。

根據本發明的第二方面,依據圖像處理設備的第一方面,如果預定關聯關系指明作為所述第一識別操作和所述第二識別操作中的另一個的另一個識別操作的執行與所述一個識別操作的操作結果關聯,則所述分類單元在所述一個識別操作之后,執行所述另一個識別操作。

根據本發明的第三方面,依據圖像處理設備的第一方面,分別針對所述第一識別操作和所述第二識別操作預定多個項并且所述分類單元在所述第一識別操作和所述第二識別操作中的每個中識別所述圖像屬于哪一個項。如果在所述一個識別操作之后執行所述另一個識別操作,則所述分類單元減少預定項,以響應于所述一個識別操作的操作結果來選擇更少量的項,并且在所述另一個識別操作中識別所述圖像屬于所選擇的項中的哪一個。

根據本發明的第四方面,依據圖像處理設備的第三方面,預先按照每一項將針對各識別操作預定的項與圖像的分類目的地關聯。所述分類單元將所述圖像分類為與在所述另一個識別操作中所述圖像被識別所屬的項關聯的分類目的地。

根據本發明的第五方面,依據圖像處理設備的第一方面,如果如果作為所述一個識別操作的結果輸出了多個候選,則所述分類單元按照預定次序來選擇所述候選,直到確定了所述圖像的分類目的地,并且使用所選擇的候選,按照所述第一識別操作和所述第二識別操作中的一個或兩個將所述圖像分類。

根據本發明的第六方面,依據圖像處理設備的第一方面,所述分類單元根據用戶指定的條件,確定首先要執行所述第一識別操作和所述第二識別操作中的哪一個。

根據本發明的第七方面,依據圖像處理設備的第一方面,所述圖像的特征量包括所述圖像中包含的邊界。

根據本發明的第八方面,提供了一種圖像處理設備。所述圖像處理設備包括:獲取單元,其獲取原始文檔上形成的圖像的圖像信息;以及分類單元,其使用所述獲取單元獲取的圖像信息,響應于第一識別操作和與所述第一識別操作不同的第二識別操作中的一個的操作結果,按照所述第一識別操作和所述第二識別操作中的所述一個或兩個將所述圖像分類。

根據本發明的第九方面,提供了一種圖像處理方法。所述圖像處理方法包括:獲取原始文檔上形成的圖像的圖像信息;以及使用獲取的所述圖像信息,響應于第一識 別操作和第二識別操作中的一個的操作結果,按照所述第一識別操作和所述第二識別操作中的所述一個或兩個將所述圖像分類,所述第一識別操作被配置為根據所述圖像的特征量將圖像分類,所述第二識別操作被配置為根據圖像的字符信息將所述圖像分類。

根據本發明的第一方面和第九方面,相比于使用不顧及原始文檔類型而確定的識別處理的系統,所述圖像處理設備在分類原始文檔時大幅提高了分類準確性。

根據本發明的第二方面,相比于使用不顧及原始文檔類型而確定的識別處理的系統,所述圖像處理設備大幅提高了分類準確性。

根據本發明的第三方面,相比于確定圖像是否屬于所有預定項中的每個的系統,所述圖像處理設備大幅增加了處理速度。

根據本發明的第四方面,相比于使用不顧及原始文檔類型而確定的識別處理的系統,所述圖像處理設備大幅提高了分類準確性。

根據本發明的第五方面,即使所述一個識別操作不能夠唯一地識別圖像,所述圖像處理設備也確定原始文檔的分類目的地。

根據本發明的第六方面,所述圖像處理設備首先根據用戶指定的條件來確定首先要執行第一識別操作和第二識別操作中的哪一個。

根據本發明的第七方面,根據圖像中包含的邊界將原始文檔分類。

根據本發明的第八方面,相比于使用不顧及原始文檔類型而確定的識別處理的系統,所述圖像處理設備在分類原始文檔時大幅提高了分類準確性。

附圖說明

將基于下面的附圖詳細地描述本發明的示例性實施方式,其中:

圖1總體上示出示例性實施方式的圖像處理系統;

圖2示出示例性實施方式的圖像讀取設備的硬件構造;

圖3示出示例性實施方式的終端設備的硬件構造;

圖4是示例性實施方式的終端設備的功能構造的框圖;

圖5示出光學字符識別(OCR)操作和邊界識別操作的示例;

圖6是示出圖像處理系統的處理的例程的流程圖;

圖7示出可靠性表的示例;以及

圖8是示出在為OCR識別操作賦予較高優先級的情況下執行的處理的例程的流程圖。

具體實施方式

以下,參照附圖描述本發明的示例性實施方式。

首先,描述示例性實施方式的圖像處理系統1的整體構造。圖1總體上示出示例性實施方式的圖像處理系統1。示例性實施方式的圖像處理系統1將諸如報告的原始文檔分類。更具體地,示例性實施方式的圖像處理系統1將諸如報告的原始文檔分類。更具體地,在圖像處理系統1上設置包括“交付聲明”和“賬單”的各種類型的原始文檔并且圖像處理系統1根據原始文檔的內容將原始文檔分類。通過將原始文檔分類,用戶驗證處于被分類狀態的原始文檔上寫上的各項,并且按照各分類類別預定的處理流程來處理原始文檔。

如圖1中所示,圖像處理系統1包括圖像讀取設備10和終端設備20。圖像讀取設備10通過讀取原始文檔上形成的圖像,生成圖像數據(圖像信息)。終端設備20借助網絡30從圖像讀取設備10接收圖像信息并且將接收到的圖像信息分類。

具有掃描功能的圖像讀取設備10讀取諸如報告的原始文檔(紙張)上形成的圖像,并且生成指示被讀取圖像的圖像信息(下文中被稱為“原始文檔圖像信息”)。圖像讀取設備10可以例如是掃描儀裝置,并且是基于電荷耦合器件(CCD)系統或接觸式圖像傳感器(CIS)系統。在CCD系統中,用光束照射文檔,然后借助透鏡收集被文檔反射的光束。在CIS系統中,用來自發光二極管(LED)的光束照射文檔,并且由CIS傳感器接收被文檔反射的光束。除了掃描功能之外,圖像讀取設備10還可具有印刷功能、復印功能或傳真功能。

終端設備20借助網絡30接收由圖像讀取設備10生成的原始文檔圖像信息,并且使用接收到的原始文檔圖像信息將原始文檔分類(即,將原始文檔上形成的圖像分類)。個人計算機(PC)可用于終端設備20。按照示例性實施方式,終端設備20具有用作圖像處理設備的功能。

如以下更詳細描述的,終端設備20通過執行通過光學字符識別(OCR)識別原始文檔(原始文檔圖像信息)中包含的字符(包括數字、符號和標記)的操作和識別原始文檔中包含的邊界的操作將原始文檔分類。OCR是分析圖像數據中的字符并且 將字符轉換成計算機將要操縱的字符數據的技術。邊界代表垂直地或水平地繪制以勾畫或包圍各項的線,并且被視為代表圖像的特征量的信息示例。

通過OCR識別原始文檔中包含的字符信息并且將所識別的字符信息分類的操作還可被稱為OCR識別操作。識別原始文檔中包含的邊界并且將其分類的操作還可被稱為邊界識別操作。按照示例性實施方式,使用邊界識別操作作為第一識別操作的示例。使用OCR識別操作作為第二識別操作的示例。

網絡30是用于圖像讀取設備10和終端設備20之間的信息通信的通信網絡。例如,網絡30是局域網(LAN)。

以下,描述圖像讀取設備10的硬件構造。圖2示出示例性實施方式的圖像讀取設備10的硬件構造。如圖2中所示,圖像讀取設備10包括中央處理單元(CPU)101、隨機存取存儲器(RAM)102、只讀存儲器(ROM)103、硬盤驅動(HDD)104、顯示面板105、圖像形成單元106、圖像讀取單元107和通信接口(下文中被稱為通信I/F)108。這些元件借助總線109彼此相互連接,并且借助總線109交換數據。

CPU 101執行各種程序,包括操作系統(OS)和應用。RAM 102用作CPU 101的作業存儲器。ROM 103存儲CPU 101將要執行的各種程序。CPU 101將來自ROM 103等的各種程序加載到RAM 102,以執行這些程序。CPU 101因此執行圖像讀取設備10的功能中的每個。HDD 104存儲輸入到各種軟件程序或者從各種軟件程序輸出的數據。

顯示面板105從用戶接收各種信息或操作輸入的顯示。

圖像形成單元106響應于輸入圖像數據,在記錄介質上形成圖像。圖像形成單元106是通過將光導鼓上的色調劑轉移到記錄介質或噴墨系統來形成圖像的電子攝影系統,噴墨系統通過將墨水噴射到記錄介質上來形成圖像。

圖像讀取單元107讀取記錄介質上形成的圖像,并且生成代表讀取圖像的原始文檔圖像信息。

通信I/F 108借助網絡30從諸如終端設備20的外部設備接收各種數據或者將數據發送到外部設備。

以下,描述終端設備20的硬件構造。圖3示出示例性實施方式的終端設備20的硬件構造。如圖3中所示,終端設備20包括CPU 201、存儲器202和磁盤裝置(HDD)203。

CPU 201執行包括OS和應用的各種程序,從而實現終端設備20的功能。存儲器202存儲執行程序時使用的各種程序和數據。磁盤裝置203存儲輸入程序的數據或者從程序輸出的數據。終端設備20還包括被配置為與外部通信的通信I/F 204、包括視頻存儲器、顯示器等的顯示機構205、和諸如鍵盤和鼠標的輸入裝置206。

以下,描述終端設備20的功能和構造。圖4是示例性實施方式的終端設備20的功能構造的框圖。

終端設備20包括圖像信息接收器21、操作輸入接收器22、OCR識別單元23和邊界識別單元24。圖像信息接收器21借助網絡30從圖像讀取設備10接收原始文檔圖像信息。操作輸入接收器22從該用戶接收操作輸入。OCR識別單元23識別原始文檔圖像信息。邊界識別單元24通過邊界識別操作來識別原始文檔圖像信息。

終端設備20還包括分類處理器25和可靠性表存儲器26。分類處理器25基于OCR識別操作的操作結果和邊界識別操作的操作結果來確定分類目的地。可靠性表存儲器26預先存儲系統管理員制作的可靠性表。

圖像信息接收器21借助網絡30從圖像讀取設備10接收圖像讀取單元107已經通過讀取原始文檔上形成的圖像而生成的原始文檔圖像信息。

操作輸入接收器22從用戶接收操作輸入。例如,操作輸入接收器22接收指定當要將原始文檔分類時的分類模式的操作輸入。分類模式指示各原始文檔所屬的分類類別。用戶通過考慮各設置文檔的內容來指定分類模式。以下,詳細地描述分類模式。

OCR識別單元23通過OCR識別操作來識別原始文檔圖像信息。更具體地,OCR識別單元23通過OCR識別操作來識別圖像信息接收器21接收的原始文檔圖像信息中包含的字符。基于所識別的字符(字符串)的信息,OCR識別單元23將原始文檔分類為針對OCR識別操作預定的多個分類項中的一個。

邊界識別單元24通過邊界識別操作來識別原始文檔圖像信息。更具體地,邊界識別單元24水平地和垂直地掃描圖像信息接收器21接收的原始文檔圖像信息,并且識別具有預定長度或更長的連續黑點的線作為邊界。基于所識別的邊界的信息,邊界識別單元24將原始文檔分類,使其成為針對邊界識別操作確定的多個分類項中的一個。

參照圖5描述OCR識別操作和邊界識別操作。圖5示出OCR識別操作和邊界識別操作的示例。圖5的原始文檔301包括由邊界形成的圖302和圖303。圖302包括 字符串“AAA”并且圖303包括字符串“BBB”。

在OCR識別操作中,OCR識別單元23執行字符識別,從而得知在原始文檔301中繪制字符串“AAA”和字符串“BBB”。如果在原始文檔301中繪制字符串“AAA”和字符串“BBB”的情況下針對OCR識別操作預定分類項,則OCR識別單元23將原始文檔分類為預定分類項。當在OCR識別操作中執行分類時,可使用與字符相關的任何信息(諸如,字符的大小和位置(坐標信息))。

在邊界識別操作中,邊界識別單元24識別在原始文檔301中繪制邊界(諸如,圖302和圖303)。如果在原始文檔301中繪制圖302和圖303的情況下針對邊界識別操作預定分類項,則邊界識別單元24將原始文檔分類為預定分類項。當在邊界識別操作中執行分類時,可使用與邊界相關的任何信息(諸如,邊界的類型、大小和位置(坐標信息))。

因此,執行OCR識別操作和邊界識別操作。

分類處理器25確定是將要使用OCR識別操作和邊界識別操作中的一個還是兩個。分類處理器25通過執行OCR識別操作和邊界識別操作中的一個或兩個,確定原始文檔的最終分類目的地。分類處理器25在本文中確定原始文檔的類型是原始文檔的最終分類目的地。

對分類時用戶指定的各分類模式,確定具有優先級的識別操作(即,OCR識別操作或邊界識別操作)。另外,根據原始文檔,可通過識別字符而非邊界,更容易地將一些文檔分類,并且可通過識別邊界而非字符,更容易地將其他文檔分類。預先地,系統管理員可基于各分類模式來確定哪一個識別操作優先于其他。按照用戶指定的分類模式,分類處理器25將OCR識別操作和邊界識別操作之間的一個識別操作優先于其他識別操作。在示例性實施方式中,用戶將要指定的條件的示例是分類模式。

分類處理器25為OCR識別操作和邊界識別操作中的一個賦予優先級,然后基于執行的具有優先級的一個識別操作的操作結果,確定是否要執行另一個識別操作。存儲在可靠性表存儲器26中的可靠性表將OCR識別操作的操作結果與是否要在OCR識別操作之后執行邊界識別操作關聯。另外,存儲在可靠性表存儲器26中的可靠性表將邊界識別操作的操作結果與是否要在邊界識別操作之后執行OCR識別操作關聯。為此原因,在執行一個識別操作之后,分類處理器25參考可靠性表來確定是否要執行另一個識別操作。

基于在OCR識別操作和邊界識別操作之中的在另一個識別操作之前執行一個識別操作的操作結果,分類處理器25使用識別操作中的一個或兩個的操作結果,確定原始文檔的分類目的地。

可靠性表存儲器26存儲預先制作的可靠性表。可靠性表列出用于確定是否要執行OCR識別操作和邊界識別操作的信息。可靠性表還列出用于按照OCR識別操作的操作結果和邊界識別操作的操作結果來確定原始文檔的分類目的地的信息。以下,詳細描述可靠性表。在示例性實施方式中,使用可靠性表作為預定關聯關系的示例。

顯示器27向用戶顯示分類處理器25提供的分類結果。

當軟件資源與硬件資源協作時,實現終端設備20中的這些功能中的每個。更具體地,CPU 201將來自磁盤裝置203的被配置為實現終端設備20的功能的程序讀取到存儲器202上,并且執行程序。CPU 201因此實現功能。例如,可用磁盤裝置203實現可靠性表存儲器26。例如,可用顯示機構205實現顯示器27。

在示例性實施方式中,圖像信息接收器21用于充當獲取單元的示例。OCR識別單元23、邊界識別單元24和分類處理器25用于充當分類單元的示例。

以下,描述圖像處理系統1的處理的例程。圖6是示出圖像處理系統1的處理的例程的流程圖。在初始狀態下,用戶將原始文檔設置為圖像讀取設備10上的分類目標。

用戶響應于設置的原始文檔來指定分類模式。操作輸入接收器22接收指定分類模式的操作(步驟S101)。分類模式指示原始文檔所屬的類別。更具體地,以各作業為基礎,以各情況為基礎,或者以消費者為基礎,確定訂購作業、交付作業等分類模式。在示例性實施方式中,用戶僅僅指定預先準備的多個分類模式之中的響應于設置的原始文檔的分類模式。

用戶操作圖像讀取設備10以讀取設置的原始文檔。因此生成的原始文檔圖像信息被發送到終端設備20。

分類處理器25按照指定的分類模式,確定是否要使OCR識別操作優先于邊界識別操作(步驟S102)。如果步驟S102中的確定結果是“是”,則通過OCR識別操作來識別原始文檔圖像信息(步驟S103)。

在步驟S103中,OCR識別單元23通過OCR識別操作來識別原始文檔圖像信息。分類處理器25參考可靠性表,以響應于OCR識別操作的操作結果,確定是否要執行 邊界識別操作。換句話講,如果可靠性表將OCR識別操作的操作結果與邊界識別操作的執行關聯,則分類處理器25確定要執行邊界識別操作。如果確定要執行邊界識別操作,則邊界識別單元24通過邊界識別操作來識別原始文檔圖像信息。

如果步驟S102中的確定結果是“否”,則通過具有優先級的邊界識別操作來識別原始文檔圖像信息(步驟S104)。在步驟S104中,邊界識別單元24通過邊界識別操作來識別原始文檔圖像信息。通過參考可靠性表,分類處理器25參考響應于邊界識別操作的操作結果,確定是否要執行OCR識別操作。換句話講,如果可靠性表將邊界識別操作的操作結果與OCR識別操作的執行關聯,則確定要執行OCR識別操作。如果確定要執行OCR識別操作,則OCR識別單元22識別原始文檔圖像信息。

在步驟S103或步驟S104之后,分類處理器25響應于OCR識別操作的操作結果和邊界識別操作的操作結果,確定原始文檔的分類目的地(步驟S105)。響應于步驟S103和步驟S104中執行的識別操作的操作結果,確定原始文檔的分類目的地。更具體地,使用OCR識別操作和邊界識別操作的操作結果中的一個或兩個,確定原始文檔的分類目的地。確定被構造用于用戶指定的分類模式的各種類型的原始文檔之中的一種類型的原始文檔是原始文檔的分類目的地。因此完成處理的例程。

以下,描述可靠性表。圖7示出可靠性表的示例。可靠性表是已經得知用作分類目標的各種不同原始文檔的格式的系統管理員制作的。更具體地,系統管理員已經得知關于用作分類目標的各原始文檔上繪制的字符和邊界的信息,然后制作可靠性表。

“分類模式標識”代表分類模式。如圖7中所示,分類模式標識列出“分類模式1”和“分類模式2”。更具體地,“分類模式1”指示“交付”的作業,“分類模式2”指示“完成合約”的作業。

“分類名稱”代表原始文檔的類型。如圖7中所示,列出“文檔1”和“文檔2”。更具體地,列出“交付聲明”、“賬單”等。此外,“文檔1”、“文檔2”和“文檔3”這三種文檔類型被包括在“分類模式1”的類別中。換句話講,如果“分類模式”指示“交付操作”,則使用“文檔1”、“文檔2”和“文檔3”這三種文檔類型。在示例性實施方式中,分類處理器25確定列在“分類名稱”下方的文檔類型是原始文檔的分類目的地。

“OCR分類”代表OCR識別操作的分類項,根據其將原始文檔進行分類。如圖7中所示,OCR識別操作將“文檔1”的原始文檔分類為“A1”至“A7”分類項中 的一個。預先將分類項“A1”至“A7”與用作原始文檔的分類目的地的“文檔1”關聯。

如果“文檔1”代表“交付聲明”,則通常從不同來源發出交付聲明。一些交付聲明可被印刷為“發票”。其他交付聲明可被印刷為“交付證書”。文檔的類型一般被作為交付聲明來操縱,但對于不同文檔,OCR將要識別的字符串可以是不同的。即使文檔具有相同的“分類名稱”,也將它們分類為分類項“A1”至“A7”。例如,“A1”指示上面印刷有“交付聲明”的原始文檔,“A2”指示上面印刷有“發票”的原始文檔。

如果在OCR分類中將原始文檔分類為“不可應用”類別,則這意味著,沒有將原始文檔分類為分類項“A1”至“A7”中的任一個。在交付聲明的“文檔1”中,可按給定格式印刷交付聲明的僅僅單個詞語“交付”來替代全部詞語“交付聲明”。在這種情況下,通過OCR識別操作,可不能將文檔分類為交付聲明。依據這種情況,“不可應用”類別被包括在OCR分類中。

“邊界分類”代表邊界識別操作的分類項,根據其將原始文檔進行分類。如圖7中所示,邊界識別操作將“文檔1”的原始文檔分類為“B1”至“B4”分類項中的一個。預先將分類項“B1”至“B4”與用作原始文檔的分類目的地的“文檔1”關聯。

如果“文檔1”代表“交付聲明”,則通常從不同來源發出交付聲明。根據邊界的邊界結構,可將文檔分類為四個分類項“B1”至“B4”。例如,將具有“OCR分類”下方的“A2”的所有原始文檔分類為“邊界分類”下方的“B1”。另一方面,將具有“OCR分類”下方的“A3”的原始文檔中的一些分類為“邊界分類”下方的“B1”,而將具有“OCR分類”下方的“A3”的其他原始文檔分類為“邊界分類”下方的“B2”。

在邊界分類下方的“不可應用”類別中,沒有將原始文檔分類為分類項“B1”至“B4”中的任一個。在“文檔1”的情況下,一些交付聲明可沒有按其格式繪制的邊界,并且可不根據邊界進行分類。依據這種情況下,通過邊界識別操作,不可將原始文檔分類為交付聲明。因此,包括邊界分類類別“不可應用”。

“OCR確定”基于邊界識別操作的操作結果并且指示是否要執行OCR識別操作。這里,“是”指示將要執行OCR識別操作而“否”指示將不執行OCR識別操作。

“邊界確定”基于OCR識別操作的操作結果并且指示是否要執行邊界識別操作。這里,“是”指示將要執行邊界識別操作而“否”指示將不執行邊界識別操作。

按照OCR識別操作的操作結果或邊界識別操作的操作結果的可靠性,確定OCR識別操作或邊界識別操作的“是”或“否”。

例如,即使通過OCR識別操作將原始文檔分類為“A4”,可靠性也不會高得足以確定“分類名稱”是“文檔1”。另一方面,如果通過邊界識別操作將原始文檔分類為“B2”,可靠性可高得足以確定原始文檔是“文檔1”,而不需要執行OCR識別操作。在這種情況下,確定“OCR確定”是“否”而確定“邊界確定”是“是”。

如果“OCR分類”是不可應用的,則通過OCR識別操作不能分類原始文檔,并且“OCR確定”因此是“否”。類似地,如果“邊界分類”是不可應用的,則通過邊界識別操作不能分類原始文檔,并且“邊界確定”因此是“否”。

參照圖7的可靠性表,描述基于可靠性表進行的處理的例程的特定示例。本文中的處理對應于圖6的步驟S103至S105中的操作。用戶可即刻指定“分類模式1”。

以下,描述第一特定示例。在這個示例中,在OCR識別操作具有優先級的情況下,OCR識別操作可已經將原始文檔分類為分類項“A2”。

分類處理器25參考可靠性表,并且響應于“OCR分類”下方的“A2”來檢查“邊界確定”。如圖7中列出的,響應于“A2”的“邊界確定”是“是”。為此原因,執行邊界識別操作。

可靠性表指示響應于“A2”的“邊界分類”是“B1”。如果邊界識別單元24提供的操作結果是“B1”,則操作結果匹配可靠性表中的信息。確定響應于原始文檔圖像信息的原始文檔的類型是“文檔1”,“文檔1”是響應于“A2”和“B1”的“分類名稱”。更具體地,分類處理器25確定原始文檔的類型是作為原始文檔的分類目的地的“文檔1”。另一方面,如果邊界識別單元24提供的操作結果不是“B1”,則操作結果無法匹配可靠性表中的信息。在這個時間點,沒有確定原始文檔的類型。

邊界識別單元24提供的操作結果可僅僅確定是否能將原始文檔分類為“B1”,而不一定必須確定是否能將原始文檔分類為“B2”或“B3”而非“B1”。換句話講,邊界識別單元24比照被分類為“B1”的邊界來檢查原始文檔圖像信息中繪制的邊界,以確定邊界是否能被分類為“B1”。

在示例性實施方式中,首先對原始文檔執行OCR識別操作減少了預定多個分類項,以在邊界識別操作中選擇更少量的分類項,并且執行將原始文檔歸類為所選擇分類項中的一個的操作。在這個示例中,在預定分類項“B1”至“B4”收窄至“B1” 的情況下,執行邊界識別操作。

以下,描述第二特定示例。在這個示例中,在邊界識別操作具有優先級的情況下,邊界識別操作可已經將原始文檔歸類為分類項“B3”。

分類處理器25參考可靠性表,并且響應于“邊界分類”下方的“B3”來檢查“OCR確定”。如圖7中列出的,響應于“B3”的“OCR確定”是“是”。為此原因,執行OCR識別操作。

可靠性表指示響應于“B3”的“OCR分類”是“A6”或“A7”。如果OCR識別單元23提供的操作結果是“A6”或“A7”,則操作結果匹配可靠性表中的信息。確定響應于原始文檔圖像信息的原始文檔的類型是“文檔1”,“文檔1”是響應于“B3”的“分類名稱”。更具體地,分類處理器25確定原始文檔的類型是作為原始文檔的分類目的地的“文檔1”。另一方面,如果OCR識別單元23提供的操作結果既不是“A6”又不是“A7”,則操作結果無法匹配可靠性表中的信息。在這個時間點,沒有確定原始文檔的類型。

OCR識別單元23提供的操作結果可僅僅確定是否能將原始文檔分類為“A6”或“A7”,而不一定必須確定是否能將原始文檔分類為“A1”或“A2”而非“A6”或“A7”。換句話講,OCR識別單元23比照被分類為“A6”的字符串或被分類為“A7”的字符串來檢查原始文檔上印刷的字符串,以確定字符串是否能被分類為“A6”或“A7”。

在示例性實施方式中,首先對原始文檔執行邊界識別操作減少了預定多個分類項,以在OCR識別操作中選擇更少量的分類項,并且執行將原始文檔歸類為所選擇分類項中的一個的操作。在這個示例中,在預定分類項“A1”至“A7”收窄至“A6”和“A7”的情況下,執行OCR識別操作。

以下,描述第三特定示例。在這個示例中,在邊界識別操作具有優先級的情況下,邊界識別操作可已經將原始文檔分類為分類項“B4”。

分類處理器25參考可靠性表,并且響應于“邊界分類”下方的“B4”來檢查“OCR確定”。如圖7中列出的,響應于“B4”的“邊界確定”列出“是”和“否”。在這種情況下,執行OCR識別操作,并且只使用邊界識別操作的操作結果來確定原始文檔的分類目的地。更具體地,確定原始文檔的分類目的地是響應于“B4”的“文檔1”。

如果“OCR確定”是“否”,則OCR識別操作的操作結果的可靠性低,并且將 通過邊界識別操作將原始文檔分類。如果“OCR確定”列出“是”和“否”,則只使用邊界識別操作的操作結果來確定原始文檔的分類目的地,而不顧及OCR識別操作的操作結果。

如果“邊界確定”列出“是”和“否”,則執行與上述操作類似的操作。更具體地,只使用OCR識別操作的操作結果來確定原始文檔的分類目的地,而不顧及邊界識別操作的操作結果。

以下,描述第四特定示例。在這個示例中,已經在OCR識別操作具有優先級的情況下執行OCR識別操作,但是通過OCR識別操作沒有將原始文檔分類為屬于“分類模式1”的“OCR分類”的任何分類項。

如果通過OCR識別操作沒有將原始文檔分類為分類項中的任一個,則隨后執行邊界識別操作。只使用邊界識別操作的操作結果來確定原始文檔的分類目的地。

如果通過OCR識別操作沒有將原始文檔分類為作為指定“分類模式1”的分類項的“A1”至“A7”和“071”至“073”和“074”中的任一個,則執行邊界識別操作。如果邊界識別操作的操作結果是例如“B1”,則確定響應于原始文檔圖像信息的原始文檔的類型是作為響應于“B1”的“分類名稱”的“文檔1”。更具體地,分類處理器25確定原始文檔的類型是作為原始文檔的分類目的地的“文檔1”。例如,如果邊界識別操作的操作結果是“173”,則分類處理器25確定原始文檔的分類目的地是作為響應于“173”的“分類名稱”的“文檔3”。

在第四特定示例中,OCR識別操作具有優先級。如果通過邊界識別操作沒有將原始文檔分類為分類項中的任一個,執行與上述操作類似的操作。更具體地,邊界識別操作之后繼續進行OCR識別操作,并且通過只使用OCR識別操作的操作結果來確定原始文檔的分類目的地。

在示例性實施方式的可靠性表中,用于OCR識別操作的分類項的數量不必等于單個“分類名稱”(即,原始文檔類型)下的邊界識別操作的分類項的數量。換句話講,OCR識別操作的分類項不必逐一對應于邊界識別操作的分類項。例如,如果“分類名稱”是圖7的可靠性表中的“文檔1”,則OCR識別操作的分類項的數量是7個,即,“A1”至“A7”,并且邊界識別操作的分類項的數量是4個,即,“B1”至“B4”。此外,“OCR分類”下的“A3”類別對應于“邊界分類”下方的“B1”和“B2”這兩個類別。

如以上在示例性實施方式的可靠性表中描述的,將OCR識別操作的分類項和邊界識別操作的分類項與用作分類目標的原始文檔的類型關聯。即使OCR識別操作的分類項沒有逐一對應于邊界識別操作的分類項,也唯一地確定原始文檔類型。

詳細描述具有優先級的OCR識別操作的處理的例程。圖8是示出在OCR識別操作具有優先級的情況下執行的處理的例程的流程圖。圖8的處理對應于圖6的步驟S103和S105中的操作。

如果OCR識別操作具有優先級,則OCR識別單元23通過OCR識別操作來識別原始文檔(步驟S201)。分類處理器25確定原始文檔已經通過OCR識別操作被分類到的分類項(在圖7的可靠性表中的“OCR分類”下方列出的分類項)(步驟S202)。如果分類處理器25確定沒有將原始文檔圖像信息確定為分類項中的任一個(步驟S202中的“否”分支),則邊界識別單元24通過邊界識別操作來識別原始文檔圖像信息(步驟S203)。分類處理器25參考可靠性表并且識別與通過邊界識別操作分類的分類項(在圖7的可靠性表中的“邊界分類”下方列出的分類項)對應的原始文檔的類型。更具體地,分類處理器25只使用邊界識別操作的操作結果來確定原始文檔的類型(分類目的地)(步驟S204)。處理的例程因此結束。

如果在步驟S202中將原始文檔分類為分類項中的一個(步驟S202中的“是”分支),則存在將原始文檔分類為多個分類項的可能性。更具體地,OCR識別操作的操作結果沒有唯一地確定圖7的可靠性表中的“OCR分類”下方的分類項,而是提供多個候選。如果存在多個候選,則可在確定原始文檔的類型之前,按照任何類型的次序(諸如,可針對分類項確定的次序)來依次選擇候選。

分類處理器25這里按照任何類型的次序在OCR識別操作中選擇分類項候選中的一個(步驟S205)。分類處理器25參考可靠性表,以按照所選擇的分類項來確定是否執行邊界識別操作(步驟S206)。在確定將不執行邊界識別操作時(步驟S06中的“否”分支),分類處理器25參考可靠性表來識別響應于所選擇的分類項的原始文檔的類型。更具體地,分類處理器25響應于OCR識別操作的操作結果來確定原始文檔的類型(步驟S207)。處理的例程因此結束。

如果分類處理器25在步驟S206中確定將執行邊界識別操作(步驟S206中的“是”分支),則邊界識別單元24通過邊界識別操作來識別原始文檔圖像信息(步驟S208)。分類處理器25參考可靠性表,然后響應于OCR識別操作的操作結果和邊界識別操作 的操作結果,確定是否確定了原始文檔的類型(步驟S209)。

參照圖7的可靠性表來描述步驟S209中的操作。分類處理器25參考可靠性表并且響應于步驟S205中選擇的“OCR分類”的分類項來識別“邊界分類”的分類項。如果本文中識別的“邊界分類”的分類項匹配步驟S208中的邊界識別操作的操作結果,則確定原始文檔的類型。另一方面,如果本文中識別的“邊界分類”的分類項無法匹配步驟S208中的邊界識別操作的操作結果,則在這個時間點還沒有確定原始文檔的類型。

如果步驟S209中的確定結果是“是”,則響應于OCR識別操作的操作結果和邊界識別操作的操作結果來確定原始文檔的類型(步驟S210)。處理的例程因此結束。

另一方面,如果步驟S209中的確定結果是“否”,則分類處理器25確定步驟S201中的OCR識別操作中分類的分類項之中是否有任何分類項未選擇(步驟S211)。如果有分類項未選擇(步驟S211中的“是”分支),則處理返回步驟S205。如果選擇了所有分類項(步驟S211中的“否”分支),則處理前進至步驟S204。如果處理前進至步驟S204,則響應于步驟S208中的邊界識別操作的操作結果來確定原始文檔的類型。

已經參照圖8描述了具有優先級的OCR識別操作的情況。當邊界識別操作具有優先級時,執行類似處理。更具體地,如果邊界識別操作具有優先級,則邊界識別操作識別原始文檔圖像信息。然后,響應于邊界識別操作的操作結果來執行OCR識別操作,并且確定響應于原始文檔圖像信息的原始文檔的類型。

如上所述,示例性實施方式的終端設備20使用OCR識別操作和邊界識別操作將原始文檔分類。在這種情況下,響應于OCR識別操作和邊界識別操作中的一個的操作結果,終端設備20通過OCR識別操作和邊界識別操作中的另一個來確定是否要分類原始文檔。然后,終端設備20基于OCR識別操作和邊界識別操作的操作結果中的一個或兩個,確定原始文檔的分類目的地。

按照示例性實施方式,即使沒有響應于OCR識別操作和邊界識別操作中的一個的操作結果確定原始文檔的類型,也執行另一個識別操作。基于這兩個識別操作的操作結果來識別原始文檔的類型。

按照示例性實施方式,以各分類圖案為基礎確定OCR識別操作和邊界識別操作中的哪一個具有優先級。本發明不限于這種方法。例如,用戶可直接指定OCR識別 操作和邊界識別操作中的哪一個具有優先級。在這種情況下,操作輸入接收器22接收指定OCR識別操作和邊界識別操作中的哪一個具有優先級的操作輸入。

按照示例性實施方式,終端設備20使用兩個識別操作(即,OCR識別操作和邊界識別操作)將原始文檔分類。可另外使用另一種識別操作(諸如,使用QR碼(注冊商標)進行的識別操作)。在這種情況下,如果原始文檔包含QR碼,則終端設備20使用QR碼將原始文檔分類。如果原始文檔不含QR碼,則終端設備20使用多個識別操作之中的OCR識別操作和邊界識別操作將原始文檔分類。

在示例性實施方式中,圖像讀取設備10可實現終端設備20的功能。在這種情況下,圖像讀取設備10讀取原始文檔上形成的圖像,并且通過參考可靠性表來確定響應于讀取的原始文檔圖像信息的原始文檔的類型。在這種情況下,圖像讀取設備10可以是圖像處理設備的示例。

可使用通信系統來供應用于實現本發明的示例性實施方式的計算機程序。還可使用記錄介質(諸如,壓縮盤只讀存儲器(CD-ROM))的記錄介質來供應計算機程序。

已經出于例證和描述的目的提供了以上對本發明的示例性實施方式的描述。它不旨在是排他性的或者將本發明限于所公開的精確形式。顯而易見,對于本領域的從業技術人員而言,許多修改形式和變形形式將是清楚的。選擇描述實施方式是為了最佳地說明本發明的原理及其實際應用,從而使本領域的其他技術人員能夠理解適于特定用戶的預料的各種實施方式和各種修改形式。本發明的范圍旨在由下面的權利要求書及其等同物來限定。

當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 桂阳县| 象山县| 师宗县| 厦门市| 鲁甸县| 通城县| 彭阳县| 赤壁市| 晴隆县| 曲沃县| 汝州市| 益阳市| 蒙山县| 北川| 永和县| 日土县| 西充县| 张家界市| 泌阳县| 始兴县| 仙居县| 乌拉特后旗| 固阳县| 密云县| 行唐县| 新河县| 伽师县| 石泉县| 来安县| 白城市| 三原县| 桐城市| 临城县| 岳池县| 临泉县| 娄底市| 邓州市| 宜兴市| 米林县| 睢宁县| 邓州市|