一種掃描輸入裝置及掃描輸入方法
【專利摘要】本發明公開了一種掃描輸入裝置,包括:圖像傳感器,用于對掃描介質上的字符聚焦成像,生成圖像,送入控制器進行處理;控制器,用于對所述圖像進行處理,并根據掃描方式或識別結果判斷所掃描的圖像是字符還是控制命令,若輸入的是控制命令則執行該命令,否則保存字符。本發明通過將字符或符號等信息印于可攜帶的模擬鍵盤上,實現了控制命令和字符無障礙輸入,單詞的隨意查詢,并實現了計算器功能。控制命令和字符無障礙輸入,使設備擺脫鍵盤,降低成本,縮小體積。同時,與手寫輸入相比,具有較高的輸入效率,節省了用戶的操作時間。
【專利說明】一種掃描輸入裝置及掃描輸入方法
【技術領域】
[0001]本發明涉及光學字符識別領域,具體涉及一種掃描輸入裝置與掃描輸入方法,通過掃描進行控制命令和字符的輸入。
【背景技術】
[0002]在現有的計算機、便攜設備中,主要輸入方式為按鍵、觸摸屏、手寫等。按鍵輸入方式與觸摸屏輸入方式需要硬件支持,增加成本的同時,增大設備的體積。手寫輸入方式受用戶手寫速度限制,導致輸入效率較低。
[0003]光學字符識別(Optical Character Recognition, OCR)技術的出現,為大規模文本的快速輸入提供了便利,使得紙質文檔轉為電子存儲方式成為可能。
[0004]利用軟件識別技術,專利申請號為200620077723.2的專利文獻公開了一種用文字掃描或攝像技術直接查閱電子字典。所述電子字典采用數字轉換模式,將內置的掃描輸入裝置所拍攝的文字單詞圖像信息,轉換成數字信息,與存儲在字庫里的信息相對照,繼而直接查找出該單詞,并進行翻譯。
[0005]專利申請號為200620123568的專利文獻公開了一種便攜式圖像識別裝置。所述裝置的圖像傳感器獲取圖像后,識別轉換器截取第一個單詞,通過OCR轉換和字典查找,完成一個取詞-識別-翻譯-顯示的過程。
[0006]上述專利文獻公開的方案均實現了單詞的快速錄入,對于印刷有單詞的紙質文檔,利用圖像采集設備采集圖像,并實現了圖像識別查詞技術。
[0007]然而,雖然專利文獻200620123568與專利文獻200620077723.2所采用的圖像識
別技術可以實現單詞的快速錄入,但是該技術只能錄入并查找紙質文檔中已有的單詞,對于保存于復雜介質中的單詞,如印在復雜背景的圖像上的字符或手寫字符,識別率不高。另夕卜,黑板上,廣告牌上或口述字符,無法通過掃描進行輸入,無法完成錄入及查詞工作,因此該技術無法滿足用戶多樣化的錄入需求。
[0008]而且在上述專利文獻中,通過執行鍵,確認掃描,當翻譯結果錯誤時,用上下鍵選擇一個正確單詞來修正。這些按鍵支持增加設備體積,使裝置外觀不夠簡潔,操作動作繁瑣,降低用戶友好。
【發明內容】
[0009]本發明公開了一種掃描輸入裝置,可實現控制命令和字符的掃描輸入,并且實現了字符和控制命令的切換,設備外觀簡潔,操作更加流暢,增強了用戶友好,該掃描輸入裝置帶有模擬鍵盤,掃描輸入裝置可實現字符的自由輸入,滿足用戶的多樣化需求。
[0010]本發明提出的掃描輸入裝置包括:圖像傳感器,用于對掃描介質上的控制命令或字符聚焦成像,生成圖像,送入控制器進行處理,所述掃描介質上制作有控制命令和字符的至少一種,所述掃描介質上的控制命令或字符由手寫或印刷形成;控制器,用于對所述圖像進行處理,并根據掃描方式或識別結果判斷所掃描的圖像是字符還是控制命令,若輸入的是控制命令則執行該命令,否則保存字符信息。
[0011]其中,該掃描輸入裝置進一步包括觸發裝置、光路裝置和光學鏡頭,其中觸發裝置用于當掃描輸入裝置接觸掃描介質進行掃描時,產生工作信號,來控制光路裝置形成光路,光路產生的光經掃描介質反射后,再經光學鏡頭匯聚到圖像傳感器中用于圖像傳感器成像。
[0012]其中,該控制器進一步包括:圖像處理單元,用于對所述圖像進行圖像預處理;識別引擎,對經圖像處理單元處理后的圖像進行識別,識別結果為輸入的圖像;判斷單元,用于根據多幀圖像位移來判斷掃描輸入是控制命令還是字符、或者通過按鍵信號判斷輸入的是控制命令還是字符、或者根據對掃描輸入圖像的識別結果判斷輸入的是控制命令還是字符,若判斷輸入的是控制命令,則執行此圖像代表的命令,若輸入的是字符則保存識別結果O
[0013]所述字符包括數字、字母或文字,所述控制命令包括符號或圖案,控制命令不限于結束命令、刪除命令、拼首命令、查詞翻譯命令、返回命令、退出命令、語目切換命令、左移命令、上移命令、下移命令和/或右移命令;所述掃描介質上制作的控制命令和字符的至少一種形成鍵盤布局。
[0014]本發明還提出一種掃描輸入方法,包括:步驟1,對掃描介質上的控制命令或字符聚焦成像,生成圖像,送入控制器進行處理,所述掃描介質上制作有控制命令和字符的至少一種,所述掃描介質上的控制命令或字符由手寫或印刷形成;步驟2,對所述圖像進行處理,并根據掃描方式或識別結果判斷所掃描的圖像是字符還是控制命令,若輸入的是控制命令則執行該命令,否則保存字符。
[0015]其中步驟I進一步包括按照以下三種方式中的一種來輸入字符和控制命令:第一種方式:當需要輸入控制命令時,將掃描輸入裝置置于掃描介質控制命令上,擠壓觸發裝置,掃描輸入裝置靜止不動,采集控制命令,當需要輸入字符時,將掃描輸入裝置置于掃描介質字符上,擠壓觸發裝置,移動掃描輸入裝置來采集輸入字符;第二種方式:當需要輸入控制命令時,通過擠壓觸發裝置,同時按住掃描輸入裝置的某一按鍵來掃描輸入控制命令,而輸入字符時則不按所述按鍵;第三種方式:當需要輸入控制命令時,采集代表控制命令的特定圖像,需要輸入字符時,則采集不同于所述特定圖像的圖像。
[0016]其中步驟2進一步包括按照以下三種方式中的一種來判斷輸入的是字符還是控制命令:第一種方式:根據多幀圖像位移來判斷掃描輸入是控制命令還是字符;第二種方式:通過按鍵信號判斷輸入的是控制命令還是字符;第三種方式:根據對掃描輸入圖像的識別結果判斷輸入的是控制命令還是字符,若判斷輸入是控制命令,則執行此圖像代表的命令,若輸入是字符則保存識別結果。
[0017]本發明還提出另外一種掃描輸入裝置,該裝置包括:掃描單元,用于對掃描介質上的控制命令或字符聚焦成像,生成圖像,送入控制器進行處理,所述掃描介質上制作有控制命令和字符的至少一種,所述掃描介質上的控制命令或字符由手寫或印刷形成;圖像處理單元,對所述圖像進行處理,并根據掃描方式或識別結果判斷所掃描的圖像是字符還是控制命令,若輸入的是控制命令則執行該命令,否則保存字符。
[0018]其中所述掃描單元按照以下三種方式中的一種來輸入字符和控制命令:第一種方式:當需要輸入控制命令時,將掃描輸入裝置置于掃描介質控制命令上,擠壓觸發裝置,掃描輸入裝置靜止不動,采集控制命令,當需要輸入字符時,將掃描輸入裝置置于掃描介質字符上,擠壓觸發裝置,移動掃描輸入裝置來采集輸入字符;第二種方式:當需要輸入控制命令時,通過擠壓觸發裝置,同時按住掃描輸入裝置的一按鍵來掃描輸入控制命令,而輸入字符時則不按所述按鍵;第三種方式:當需要輸入控制命令時,采集代表控制命令的特定圖像,需要輸入字符時,則采集不同于所述特定圖像的圖像;
[0019]所述圖像處理單元按照以下三種方式中的一種來判斷輸入的是字符還是控制命令:第一種方式:根據多幀圖像位移來判斷掃描輸入是控制命令還是字符;第二種方式:通過按鍵信號判斷輸入的是控制命令還是字符;第三種方式:根據對掃描輸入圖像的識別結果判斷輸入的是控制命令還是字符,若判斷輸入是控制命令,則執行此圖像代表的命令,若輸入是字符則保存識別結果。
[0020]本發明通過將字符或符號等信息印于可攜帶掃描介質上,在該掃描介質上形成模擬鍵盤,或者是在掃描介質上書寫需要采集輸入的內容,掃描輸入裝置通過掃描需要輸入的字符或控制命令,實現了控制命令和字符的無障礙輸入。借此,實現了單詞的隨意查詢,并實現了計算器功能。控制命令和字符無障礙輸入,使設備擺脫鍵盤,降低成本,外觀簡潔,縮小體積。同時,與手寫輸入相比,具有較高的輸入效率,節省了用戶的操作時間。
【專利附圖】
【附圖說明】
[0021]圖1為本發明掃描輸入裝置的結構示意圖;
[0022]圖2a為本發明的包括字母和符號的模擬鍵盤示意圖;
[0023]圖2b為本發明的又一包括字母和符號的模擬鍵盤示意圖;
[0024]圖2c為本發明的再一包括數字和符號的模擬鍵盤示意圖;
[0025]圖3為本發明掃描輸入方法流程圖;
[0026]圖4為利用本發明的掃描輸入方法輸入單詞與詞組的流程圖;
[0027]圖5為利用本發明的掃描輸入方法進行計算的流程圖。
【具體實施方式】
[0028]為使本發明的目的、技術方案和優點更加清楚明白,以下結合具體實施例,并參照附圖,對本發明進一步詳細說明。
[0029]本發明提供一種掃描輸入裝置和掃描輸入方法,可實現控制命令輸入和字符輸入,該掃描輸入裝置可配備有一個模擬鍵盤,并可以不同方式掃描模擬鍵盤上或其他掃描介質上的字符或符號,通過圖像識別技術,實現控制命令輸入和字符輸入的自由切換,從而實現字符的無鍵盤快速輸入,不借助鍵盤與手寫,將各種介質中的字符進行輸入,實現無障礙輸入。
[0030]圖1為本發明掃描輸入裝置的功能結構圖。參照圖1,該掃描輸入裝置包括殼體1,控制器2,圖像傳感器3,顯示屏4,光學鏡頭5、開孔6、觸發裝置7、光路裝置8。
[0031]控制器2設置在殼體I內部,優選為嵌入式處理器,用于控制文字掃描輸入,進行文字識別等處理。圖像傳感器3設置在殼體I內部,且與控制器2相連,用于對掃描介質上的文字聚焦成像,生成圖像,送入控制器2進行圖像增強、灰度處理或圖像二值化等圖像預處理和識別處理,控制器2的處理結果顯示在顯示屏4上,圖像傳感器3能夠獲取模擬鍵盤或其它掃描介質上的字符或控制命令的圖像。在外殼I與圖像傳感器3對應的位置處開設一開孔6,使得圖像傳感器3透過開孔6獲取模擬鍵盤或掃描資料上的字符。觸發裝置7用于當掃描輸入裝置接觸掃描介質進行掃描時,產生工作信號,來控制光路裝置8形成光路,光路產生的光經掃描介質反射后,再經光學鏡頭5直接匯聚到圖像傳感器3中用于圖像傳感器3成像。光路裝置8優選使用光路照明LED。
[0032]上述模擬鍵盤可以為任何便于攜帶的可識別介質,如本設備的包裝皮套或紙質材料等,具有體積小,方便攜帶的特點。模擬鍵盤上包括但不僅限于數字、字母、符號,也可以是其它字符、控制命令或其它圖形。另外模擬鍵盤可以為任何便于攜帶的可識別介質,如本設備的包裝皮套或紙質材料。上述其他掃描介質上的字符或符號可以由用戶在可識別介質上書寫形成。
[0033]圖2a為本發明一種模擬鍵盤的示意圖。如圖2a所示,該模擬鍵盤包括字母和符號。其中“=”約定為結束符,符號“一”約定為刪除操作,空白圖像約定為空格。
[0034]圖2b為本發明另外一種模擬鍵盤的示意圖。如圖2b所示,該模擬鍵盤包括字母和符號,其中“掛”約定為拼音命令,“查”約定為查詞翻譯命令,“刪”約定為刪除命令,
Θ約定為返回命令,“一”約定為左移,“丨”約定為上移,“丨”約定下移,“一”約定為右移。
[0035]掃描輸入裝置可按照下面三種方式中的任一種來輸入控制命令和字符:第一種方式:當需要輸入控制命令時,將掃描輸入裝置置于模擬鍵盤或其它掃描介質控制命令上,通過擠壓觸發裝置7,打開LED照明,光學鏡頭5工作,掃描輸入裝置靜止不動,采集控制命令并通過圖像傳感器送入控制器2,掃描輸入裝置當需要輸入字符時,將掃描輸入裝置置于模擬鍵盤或其它掃描介質上,通過擠壓觸發裝置7,打開LED照明,光學鏡頭5工作,移動掃描裝置,采集輸入字符并通過圖像傳感器送入控制器2。第二種方式:當需要輸入控制命令時,移動掃描輸入裝置同時按住某按鍵,字符輸入時只移動掃描輸入裝置,不按按鍵。第三種方式:當需要輸入控制命令時,采集代表控制命令的特定圖像,需要輸入字符時,則采集不同于所述特定圖像的圖像,在這種方式中,控制命令和字符都是通過移動掃描輸入裝置的方式輸入,或者都是通過點擊的方式輸入。
[0036]控制器2進一步包括圖像處理單元201、識別引擎202和判斷單元203。
[0037]圖像處理單元201對所掃描的字符和控制命令進行圖像預處理,包括圖像增強,灰度處理以及二值化處理等。所述圖像增強是通過一定手段對原圖像附加一些信息或變換數據,有選擇地突出圖像中感興趣的特征或者抑制(掩蓋)圖像中某些不需要的特征,使圖像與視覺響應特性相匹配。所述圖像二值化就是將圖像上的像素點的灰度值設置為O或1,也就是將整個圖像呈現出明顯的黑白效果。圖像的二值化有利于凸顯的進一步處理,使圖像變得簡單,而且數據量減小,能凸顯出感興趣的目標的輪廓。
[0038]識別引擎202對經圖像處理單元201處理后的圖像進行識別。識別引擎202進一步包括OCR弓丨擎和分類器識別引擎。
[0039]如果掃描輸入裝置是按照上述第一種和第二種方式輸入字符和控制命令,則判斷單元203可直接根據多幀圖像位移和按鍵信號來判斷輸入的是字符還是控制命令,如果輸入的是字符,則調用OCR引擎識別,若是控制命令,則直接調用分類器識別。
[0040]如果掃描輸入裝置是按照上述第三種方式輸入字符和控制命令,則識別引擎202首先調用OCR引擎進行識別,根據識別距離等識別信息判斷識別結果可信度,若識別結果不可信,則判斷單元203判斷輸入的為自定義的控制命令,該自定義的控制命令為用戶自定義的控制命令,如刪等,標準內碼庫中沒有這些控制命令,需繼續進行分類器識別,得到控制命令的識別結果。若OCR識別結果可信,則分為兩種情況,一為輸入的是字符,二為輸入的是在標準內碼庫中可查找到的控制命令,如‘一’等,本發明對此種控制命令的含義預先進行約定,如果識別為這樣的控制命令,則根據約定的含義執行相應的控制命令。
[0041]OCR引擎對二值圖像進行識別,主要包括:字符提取,字符特征提取,特征比較,識別結果后處理。所述字符提取是指提取圖像中間字符所在區域,過濾掉該字符上下存在的其它黑像素、空白行與該字符左右的空白列。所述特征提取與特征比較是指計算上述字符的特征,與字庫中的特征模板進行比較,得到特征最相近字符作為識別結果。所述識別結果后處理是指根據使用環境對上述識別結果進行處理,修改不合理的結果。
[0042]分類器識別是指將控制命令圖像的特征作為分類依據,對應不同的識別分類器,需要的圖像特征也不同,識別分類器利用現有技術比較此圖像特征與分類器識別引擎中預先保存的各控制命令標準模板的特征之間的距離,選擇特征與此圖像特征相距最近的標準模板對應的控制命令作為此圖像的識別結果。
[0043]圖3為本發明掃描輸入方法的流程圖。參照圖3,該方法包括了以下各步驟:
[0044]步驟1,利用掃描輸入裝置獲取各種介質或模擬鍵盤上的字符或控制命令的圖像。在該步驟,按照以下三種方式中的一種來輸入字符和控制命令:
[0045]第一種方式:當需要輸入控制命令時,將掃描輸入裝置置于掃描介質控制命令上,擠壓觸發裝置,掃描輸入裝置靜止不動,采集控制命令,當需要輸入字符時,將掃描輸入裝置置于掃描介質字符上,擠壓觸發裝置,移動掃描輸入裝置來采集輸入字符。
[0046]第二種方式:當需要輸入控制命令時,通過擠壓觸發裝置,同時按住掃描輸入裝置的一按鍵來掃描輸入控制命令,而輸入字符時則不按所述按鍵。
[0047]第三種方式:當需要輸入控制命令時,采集代表控制命令的特定圖像,需要輸入字符時,則采集不同于所述特定圖像的圖像,在這種方式中,控制命令和字符都是通過移動掃描輸入裝置的方式輸入,或者都是通過點擊的方式輸入。
[0048]所采集輸入的字符或控制命令通過圖像傳感器3送入控制器2的處理單元201。
[0049]步驟2,利用控制器2中的圖像處理單元201對所掃描的字符和控制命令進行圖像預處理。所述圖像預處理包括圖像增強、灰度處理或二值化等。
[0050]所述圖像增強是通過一定手段對原圖像附加一些信息或變換數據,有選擇地突出圖像中感興趣的特征或者抑制(掩蓋)圖像中某些不需要的特征,使圖像與視覺響應特性相匹配。
[0051]所述圖像灰度處理是對灰度圖像進行分析和處理。灰度圖像反映了整幅圖像的亮度等級的分布,每個像素點的變化范圍為0-255。灰度處理包含生成灰度直方圖、灰度修正、提取圖像特征、圖像銳化等處理。
[0052]所述圖像二值化就是將圖像上的像素點的灰度值設置為O或1,也就是將整個圖像呈現出明顯的黑白效果。圖像的二值化有利于凸顯的進一步處理,使圖像變得簡單,而且數據量減小,能凸顯出感興趣的目標的輪廓。
[0053]步驟3,利用控制器中的識別引擎202對上述處理后的圖像進行識別。[0054]識別引擎202進一步包括OCR引擎和分類器識別裝置。如果在步驟I選擇第一種和第二種方式來輸入字符和控制命令,則判斷單元203可直接根據多幀圖像位移和按鍵信號來判斷輸入的是字符還是控制命令,如果輸入的是字符,則調用OCR引擎識別,若是控制命令,則直接調用分類器識別。
[0055]但如果在步驟I中選擇第三種輸入方式進行輸入字符和控制命令,則在該步驟3中,首先用OCR技術識別后,根據識別距離等識別信息判斷識別結果可信度,若識別結果不可信,則輸入的為自定義的控制命令,該自定義的控制命令為用戶自定義的控制命令,如刪等,標準內碼庫中沒有這些控制命令,需繼續進行分類器識別,得到控制命令的識別結果。若OCR識別結果可信,則分為兩種情況,一為輸入的是字符,二為輸入的是在標準內碼庫中可查找到的控制命令,如‘一’等,本發明對此種控制命令的含義預先進行約定,如果識別為這樣的控制命令,則根據約定的含義執行相應的控制命令。
[0056]OCR引擎對二值圖像進行識別,主要包括:字符提取,字符特征提取,特征比較,識別結果后處理。所述字符提取是指提取圖像中間字符所在區域,過濾掉該字符上下存在的其它黑像素、空白行與該字符左右的空白列。所述特征提取與特征比較是指計算上述字符的特征,與字庫中的特征模板進行比較,得到特征最相近字符作為識別結果。所述識別結果后處理是指根據使用環境對上述識別結果進行處理,修改不合理的結果。
[0057]分類器識別是指將控制命令圖像的特征作為分類依據,對應不同的識別分類器,需要的圖像特征也不同,識別分類器利用現有技術比較此圖像特征與識別引擎中預先保存的各控制命令標準模板的特征之間的距離,選擇特征與此圖像特征相距最近的標準模板對應的控制命令作為此圖像的識別結果。
[0058]步驟4,根據步驟3中的識別結果執行相應的動作,若輸入的是控制命令則執行該命令,否則保存字符信息。
[0059]下面通過舉例的方式來進一步說明本發明利用模擬鍵盤進行掃描輸入的方法,在下面的例子中,掃描輸入裝置以掃描筆為例來進行說明。
[0060]〈例1>
[0061]在該例子中采用上述步驟I中的第一種方式進行字符和控制命令的輸入。字符輸入時移動掃描筆;控制命令輸入時,掃描筆置于控制命令上方,筆靜止,采集圖像。控制器也由此判斷輸入的是字符還是控制命令。即如步驟I的第一種方式,掃描筆移動掃描時,輸入的為字符,掃描筆靜止采集圖像時,輸入的為控制命令。如果輸入的是控制命令,控制器調用分類器識別,如果輸入的是字符,則控制器調用OCR引擎。例如要查詢單詞BALL,則如圖4所示,執行以下步驟:
[0062]步驟1,移動掃描筆掃描資料中單詞“BALL”。因為要輸入字符“BALL”,所以將掃描筆置于掃描資料上方,移動掃描筆,采集幀圖像序列,然后將圖像幀序列拼接成一幅全景圖像。
[0063]步驟2,對全景圖像進行圖像處理及及識別。其中圖像處理包含圖像增強和圖像二值化處理。圖像增強采用中值濾波法來減弱噪聲。中值濾波法是一種非線性平滑技術,它將每一像素點的灰度值設置為該點某鄰域窗口內的所有像素點灰度值的中值。圖像二值化采用OtSU方法,即最大類間方差法。此方法按圖像的灰度特性,將圖像分成背景和前景兩部分。背景和前景之間的類間方差越大,說明構成圖像的兩部分的差別越大,當部分前景錯分為背景或背景錯分為前景都會導致兩部分差別變小。因此,是類間方差最大的分割意味著錯分概率最小。
[0064]由于掃描筆是通過移動的方式來進行掃描輸入的,因此控制器可根據幀圖像位移直接判斷出所輸入的是字符,因此調用OCR引擎對輸入的字符進行識別,OCR技術識別處理過程為,首先進行字符切分,得到每一個字符,然后對每一個字符進行識別。字符識別過程,首先提取各字符中間字符所在區域,過濾到字符上下存在的背景像素,然后提取字符特征并與字符庫中模板特征進行比較,找到字庫中特征最近的字符作為識別結果,最后根據使用環境對識別結果進行調整。
[0065]假設掃描輸入裝置的識別結果為“BALI”,最后一個字符識別錯誤,可以執行步驟3進行修改,也可以執行步驟4直接查詞,因為詞典會給出最相近的單詞列表,通過上下選擇得到正確結果。
[0066]步驟3,修改單詞最后一個字符,然后查詞,步驟如下:
[0067]步驟3.1,顯示屏中光標此時位于字符“I”處,將掃描筆置于模擬鍵盤“⑩上方,筆靜止,采集圖像并進行圖像處理及分類器識別處理。控制器檢測到此次輸入為K W叩-令,執行此輸入圖像代表的命令,即刪除字符“I”,在該步驟,由于掃描筆處于靜止狀態采集圖像,因此判斷為控制命令,所以針對控制命令來調用分類器識別。
[0068]步驟3.2,將掃描筆置于模擬鍵盤“L”上方,移動掃描筆掃描圖像并進行圖像處理及OCR識別處理。控制器檢測到此次輸入為字符,保存識別結果“L”。此時單詞“BALL”拼寫正確。
[0069]步驟3.3,將掃描筆放在“ ? ”上方,筆靜止,采集圖像并進行圖像處理及分類器識別處理。控制器檢測到此次輸入為控制命令,調用分類器識別,根據識別結果執行此輸入圖像代表的命令,進行查詞,查詞結果顯示在顯示屏上。
[0070]步驟4,掃描筆放在“ @ ”上方,筆靜止,采集圖像并進行圖像處理及分類器識別處理。控制器檢測到此次輸入為控制命令,執行此輸入圖像代表的命令,進行查詞,單詞“BALI”未查到,詞典給出最相近的單詞列表:BALL,BALT。
[0071]步驟5,將掃描筆放在“丨”上方,筆靜止,采集圖像并進行圖像處理及分類器識別處理。控制器檢測到此次輸入為控制命令,執行此輸入圖像代表的命令,向下選擇單詞“BALL”,并給出翻譯結果顯示在顯示屏上。
[0072]< 例 2>
[0073]在該例子中采用步驟I中的第二種方式進行字符和控制命令的輸入。
[0074]根據步驟I中的第二種方式輸入時,掃描筆移動同時檢測到按鍵按壓信號時,表示輸入的是控制命令;掃描筆移動但沒有按鍵按壓信號時,表示輸入的是字符。因此,控制命令的輸入方式為移動掃描筆的同時按住筆外殼上某按鍵,采集圖像;字符輸入時,只移動掃描筆,不按按鍵。控制器2可根據按鍵信號直接判斷輸入的是控制命令還是字符,如果是控制命令,則調用分類器識別,如果輸入的是字符,則調用OCR引擎。例如要查詢單詞“lovely” 及 “love”,步驟如下:
[0075]步驟1,移動掃描筆掃描資料中單詞“lovely”,掃描筆外殼上設置的功能健沒有被按壓時,表示掃描輸入字符。掃描過程與〈例1>中的掃描過程相同。掃描筆外殼上設置的功能鍵可以判斷是否是輸入控制命令專用的按鍵,也可以是外殼上已有按鍵的復用。[0076]步驟2,對全景圖像進行圖像處理及OCR技術識別處理。圖像預處理及字符識別處理同〈例1>中相同
[0077],待識別完成后保存識別結果“lovely”。
[0078]步驟3,掃描筆放在“g”上方,移動掃描筆同時拇指按住某按鍵,采集圖像并進行圖像處理及分類器識別處理。控制器2檢測到此次輸入為控制命令,執行此輸入圖像代表的命令,進行查詞,查詢結果顯示在顯示屏上。
[0079]步驟5,顯示屏中光標此時位于字符“y”處,將掃描筆置于模擬鍵盤“刪”上方,移動掃描筆同時拇指按住某按鍵,采集圖像并進行圖像處理及分類器識別處理。控制器檢測到此次輸入為控制命令,執行此輸入圖像代表的命令,刪除字符“y”。
[0080]步驟6,操作同步驟5,刪除字符“ I ”。
[0081 ] 步驟7,操作同步驟4,顯示屏上顯示“ love”查詞結果。
[0082]〈例3>
[0083]在該例子中采用步驟I中的第三種方式進行字符和控制命令的輸入。
[0084]掃描筆移動掃描字符或控制命令,控制器首先用OCR技術識別后,根據識別距離等識別信息判斷識別結果可信度,若識別結果不可信,則輸入的為自定義的控制命令,需繼續進行分類器識別,得到控制命令的識別結果。若OCR識別結果可信,則分為兩種情況,一為輸入的是字符,二為輸入的是在標準內碼庫中可查找到的控制命令,如果識別為控制命令,則根據約定的含義執行相應的控制命令。
[0085]例如通過掃描筆來查詢詞組look at,具體步驟如下:
[0086]步驟I,將掃描筆置于模擬鍵盤中字母“ I ”上方,攝像頭采集字母“ I ”的圖像并通過圖像傳感器傳送到處理單元進行圖像預處理,將圖像處理結果送到OCR識別裝置對此圖像進行處理與識別,并將識別結果保存。
[0087]在該步驟,模擬鍵盤采用圖2a所示的鍵盤。圖像預處理包含圖像增強和圖像二值化處理,圖像二值化采用OtSU方法,即最大類間方差法。此方法按圖像的灰度特性,將圖像分成背景和前景兩部分。背景和前景之間的類間方差越大,說明構成圖像的兩部分的差別越大,當部分前景錯分為背景或背景錯分為前景都會導致兩部分差別變小。因此,是類間方差最大的分割意味著錯分概率最小。
[0088]圖像增強采用中值濾波法來減弱噪聲。中值濾波法是一種非線性平滑技術,它將每一像素點的灰度值設置為該點某鄰域窗口內的所有像素點灰度值的中值。
[0089]步驟2,依照步驟I的方式分別采集并輸入“O” “O” “k”。
[0090]步驟3,輸入空格。預先約定輸入空白圖像時為空格,將掃描筆置于模擬鍵盤空白處,采集空白圖像,此字符作為空格保存。
[0091]步驟4,然后按照步驟I的方式采集相應圖像輸入“a” “t”。
[0092]步驟5,輸入結束字符。約定“=”作為結束符,將掃描筆置于模擬鍵盤“=”字符上方,取字符并進行圖像處理和光學字符識別處理,識別結果判定為結束符,則輸入結束。
[0093]步驟6,查詞并將翻譯結果顯示在顯示屏上。
[0094]其中結束字符不被保存,將已有的輸入字符組成一個完成的單詞或詞組,查找詞典進行翻譯。從而得到詞組look at的解釋等信息,最后將詞組和解釋信息顯示在顯示屏上。[0095]若字符輸入錯誤,需要清除,可將掃描筆置于模擬鍵盤中“一”上方,輸入“一”字符,進行字符刪除。
[0096]< 例 4>
[0097]本發明不僅可用于單詞查詢,還可實現計算器功能,如圖5的流程圖所示。
[0098]圖2c為印有數字與計算符號的模擬鍵盤。計算符號不限于模擬鍵盤上所印字符,也可包含其它復雜運算符號。例如需要計算(39+47)*62。將掃描輸入裝置依次置于模擬鍵盤中“(”“3” “9”“ + ”……等字符上方,采集其圖像并進行處理與識別。作為算式,最后輸入結束標記“ = ”,以確定輸入完成。最后進行計算,其結果為5332,將結果顯示在顯示屏上。其中處理及識別方法與〈例1>中所用方法相同。
[0099]以上所述的具體實施例,對本發明的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的 是,以上所述僅為本發明的具體實施例而已,并不用于限制本發明,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。
【權利要求】
1.一種掃描輸入裝置,包括: 圖像傳感器,用于對掃描介質上的控制命令或字符聚焦成像,生成圖像,送入控制器進行處理,所述掃描介質上制作有控制命令和字符的至少一種,所述掃描介質上的控制命令或字符由手寫或印刷形成; 控制器,用于對所述圖像進行處理,根據掃描方式或識別結果判斷所掃描的圖像是字符還是控制命令,若輸入的是控制命令則執行該命令,否則保存字符。
2.根據權利要求1所述的裝置,其特征在于,該掃描輸入裝置進一步包括觸發裝置、光路裝置和光學鏡頭,其中觸發裝置用于當掃描輸入裝置接觸掃描介質進行掃描時,產生工作信號,來控制光路裝置形成光路,光路產生的光經掃描介質反射后,再經光學鏡頭匯聚到圖像傳感器中用于圖像傳感器成像。
3.根據權利要求2所述的裝置,其特征在于,控制器進一步包括: 圖像處理單元,用于對所述圖像進行圖像預處理; 識別引擎,對經圖像處理單元處理后的圖像進行識別,識別結果為輸入的字符或控制命令; 判斷單元,用于根據多幀圖像位移來判斷掃描輸入的是控制命令還是字符、或者通過按鍵信號判斷輸入的是控制命令還是字符、或者根據對掃描輸入圖像的識別結果判斷輸入的是控制命令還是字符,若判斷輸入的是控制命令,則執行此圖像代表的命令,若輸入的是字符則保存識別結果。
4.根據權利要求3所述的裝置,其特征在于,所述字符包括數字、字母或文字,所述控制命令包括符號或圖案,并且不限于結束命令、刪除命令、拼音命令、查詞翻譯命令、返回命令、退出命令、左移命令、上移命令、下移命令和/或右移命令;所述掃描介質上制作的控制命令和字符的至少一種形成鍵盤布局。
5.—種掃描輸入方法,該方法包括步驟: 步驟I,對掃描介質上的控制命令或字符聚焦成像,生成圖像,送入控制器進行處理,所述掃描介質上制作有控制命令和字符的至少一種,所述掃描介質上的控制命令或字符由手寫或印刷形成; 步驟2,對所述圖像進行處理,并根據掃描方式或識別結果判斷所掃描的圖像是字符還是控制命令,若輸入的是控制命令則執行該命令,否則保存字符。
6.根據權利要求5所述的方法,其特征在于,步驟I進一步包括按照以下三種方式中的一種來輸入字符和控制命令:第一種方式:當需要輸入控制命令時,將掃描輸入裝置置于掃描介質控制命令上,擠壓觸發裝置,掃描輸入裝置靜止不動,采集控制命令,當需要輸入字符時,將掃描輸入裝置置于掃描介質字符上,擠壓觸發裝置,移動掃描輸入裝置來采集輸入字符;第二種方式:當需要輸入控制命令時,通過擠壓觸發裝置,同時按住掃描輸入裝置的一按鍵來掃描輸入控制命令,而輸入字符時則不按所述按鍵;第三種方式:當需要輸入控制命令時,采集代表控制命令的特定圖像,需要輸入字符時,則采集不同于所述特定圖像的圖像; 步驟2進一步包括按照以下三種方式中的一種來判斷輸入的是字符還是控制命令:第一種方式:根據多幀圖像位移來判斷掃描輸入是控制命令還是字符;第二種方式:通過按鍵信號判斷輸入的是控制命令還是字符;第三種方式:根據對掃描輸入圖像的識別結果判斷輸入的是控制命令還是字符,若判斷輸入的是控制命令,則執行此圖像代表的命令,若輸入的是字符則保存識別結果。
7.根據權利要求6所述的方法,其特征在于, 所述字符包括數字、字母或文字,所述控制命令包括符號或圖案,并且不限于結束命令、刪除命令、拼音命令、查詞翻譯命令、返回命令、退出命令、左移命令、上移命令、下移命令和/或右移命令;所述掃描介質上制作的控制命令和字符的至少一種形成鍵盤布局。
8.一種掃描輸入裝置,該裝置包括: 掃描單元,用于對掃描介質上的控制命令或字符聚焦成像,生成圖像,送入控制器進行處理,所述掃描介質上制作有控制命令和字符的至少一種,所述掃描介質上的控制命令或字符由手寫或印刷形成; 圖像處理單元,對所述圖像進行處理,并根據掃描方式或識別結果判斷所掃描的圖像是字符還是控制命令,若輸入的是控制命令則執行該命令,否則保存字符信息。
9.根據權利要求8所述的裝置,其特征在于,所述掃描單元按照以下三種方式中的一種來輸入字符和控制命令:第一種方式:當需要輸入控制命令時,將掃描輸入裝置置于掃描介質控制命令上,擠壓觸發裝置,掃描輸入裝置靜止不動,采集控制命令,當需要輸入字符時,將掃描輸入裝置置于掃描介質字符上,擠壓觸發裝置,移動掃描輸入裝置來采集輸入字符;第二種方式:當需要輸入控制命令時,通過擠壓觸發裝置,同時按住掃描輸入裝置的一按鍵來掃描輸入控制命令,而輸入字符時則不按所述按鍵;第三種方式:當需要輸入控制命令時,采集代表控制命令的特定圖像,需要輸入字符時,則采集不同于所述特定圖像的圖像; 所述圖像處理單元按照以下三種方式中的一種來判斷輸入的是字符還是控制命令:第一種方式:根據多幀圖像位移來判斷掃描輸入是控制命令還是字符;第二種方式:通過按鍵信號判斷輸入的是控制命令還是字符;第三種方式:根據對掃描輸入圖像的識別結果判斷輸入的是控制命令還是字符,若判斷輸入是控制命令,則執行此圖像代表的命令,若輸入是字符則保存識別結果。
10.根據權利要求9所述的裝置,其特征在于, 所述字符包括數字、字母或文字,所述控制命令包括符號或圖案,并且不限于結束命令、刪除命令、拼音命令、查詞翻譯命令、返回命令、退出命令、語言切換命令、左移命令、上移命令、下移命令和/或右移命令;所述掃描介質上制作的控制命令和字符的至少一種形成鍵盤布局。
【文檔編號】G06K9/20GK103699890SQ201210365732
【公開日】2014年4月2日 申請日期:2012年9月27日 優先權日:2012年9月27日
【發明者】劉迎建, 劉正珍, 張娜, 李玉梅, 萬鑫, 閆江震 申請人:漢王科技股份有限公司