語音轉化手寫筆跡的方法和裝置與流程

文檔序號：11954800閱讀：902來源：國知局

本發明涉及信息技術領域，特別是涉及一種語音轉化手寫筆跡的方法和裝置。

背景技術：

當前隨著智能手機、掌上電腦、交互式電子白板等信息工具的普及，以及智能語音合成、語音識別技術的發展，傳統的語音技術已經無法滿足用戶的使用要求。

在實現過程中，發明人發現傳統技術中至少存在如下問題：傳統的語音技術無法將語音轉化成用戶手寫筆跡，影響輸入效率：例如，當用戶在可書寫設備上進行書寫，遇到不懂書寫的字詞(即忘記或不知字詞的書寫筆畫和拼寫方式)時，需要通過其他查找途徑得到具體的書寫筆畫或拼寫方式，再手動寫到書寫設備上去，整個過程操作繁瑣，不夠便利；或當用戶雙手被占用，無法在書寫設備上及時完成手寫操作時，會直接影響工作效率。

技術實現要素：

基于此，有必要針對傳統的語音技術無法將語音轉化成用戶手寫筆跡的問題，提供一種語音轉化手寫筆跡的方法和裝置。

為了實現上述目的，本發明技術方案的實施例為：

一方面，提供了一種語音轉化手寫筆跡的方法，包括以下步驟：

在接收到用戶輸入的語音數據時，對語音數據進行語音識別處理，得到語音數據對應的語音內碼；

在筆跡數據庫中對語音內碼進行檢索，在檢索到與語音內碼對應的筆跡內碼時，從筆跡數據庫中獲取筆跡內碼對應的手寫筆跡的關鍵數據；

對關鍵數據進行筆跡還原處理，得到手寫還原筆跡。

另一方面，提供了一種語音轉化手寫筆跡的裝置，包括：

語音識別單元，用于在接收到用戶輸入的語音數據時，對語音數據進行語音識別處理，得到語音數據對應的語音內碼；

檢索單元，用于在筆跡數據庫中對語音內碼進行檢索，在檢索到與語音內碼對應的筆跡內碼時，從筆跡數據庫中獲取筆跡內碼對應的手寫筆跡的關鍵數據；

筆跡還原單元，用于對關鍵數據進行筆跡還原處理，得到手寫還原筆跡。

上述技術方案具有如下有益效果：

本發明語音轉化手寫筆跡的方法和裝置，在筆跡數據庫中對語音識別得到的內碼進行檢索，得到語音數據所對應的筆跡關鍵數據，從而通過內碼將語音數據和用戶的手寫筆跡關聯起來，可以將語音中的詞匯內容轉化成用戶手寫筆跡；當用戶在可書寫設備上進行書寫時，可以通過語音輸入，將語音數據轉化成書寫筆跡進行補充，過程簡單，使用方便。

附圖說明

圖1為本發明語音轉化手寫筆跡的方法實施例1的流程示意圖；

圖2為本發明語音轉化手寫筆跡的方法實施例2的流程示意圖；

圖3為本發明語音轉化手寫筆跡的裝置實施例1的結構示意圖。

具體實施方式

為了便于理解本發明，下面將參照相關附圖對本發明進行更全面的描述。附圖中給出了本發明的首選實施例。但是，本發明可以以許多不同的形式來實現，并不限于本文所描述的實施例。相反地，提供這些實施例的目的是使對本發明的公開內容更加透徹全面。

除非另有定義，本文所使用的所有的技術和科學術語與屬于本發明的技術領域的技術人員通常理解的含義相同。本文中在本發明的說明書中所使用的術語只是為了描述具體的實施例的目的，不是旨在于限制本發明。本文所使用的術語“及/或”包括一個或多個相關的所列項目的任意的和所有的組合。

為了解決傳統的語音技術無法將語音轉化成用戶手寫筆跡的問題，本發明提供了一種語音轉化手寫筆跡的方法實施例1，圖1為本發明語音轉化手寫筆跡的方法實施例1的流程示意圖；如圖1所示，語音轉化手寫筆跡的方法實施例1可以包括以下步驟：

步驟S110：在接收到用戶輸入的語音數據時，對語音數據進行語音識別處理，得到語音數據對應的語音內碼；

步驟S120：在筆跡數據庫中對語音內碼進行檢索，在檢索到與語音內碼對應的筆跡內碼時，從筆跡數據庫中獲取筆跡內碼對應的手寫筆跡的關鍵數據；

步驟S130：對關鍵數據進行筆跡還原處理，得到手寫還原筆跡。

具體而言，語音識別技術可以指將人類的語音中的詞匯內容轉換為計算機可讀的輸入的過程；而內碼是指計算機漢字系統中使用的二進制字符編碼，是溝通輸入、輸出與系統平臺之間的交換碼；當接收用戶手寫輸入模塊在預設時間段內未接收到相應的手寫輸入數據時，設備可確定用戶不懂如何書寫或雙手被占用，可以彈出語音輸入框選項或直接激活語音輸入模塊，從而可以利用本發明語音轉化手寫筆跡的方法實施例1，在筆跡數據庫中對語音識別得到的語音內碼進行檢索，在檢索到相應的筆跡內碼時，即可得到語音數據所對應的筆跡關鍵數據，從而通過內碼將語音數據和用戶的手寫筆跡關聯起來，可以將語音中的詞匯內容轉化成用戶手寫筆跡，其中語音內碼與筆跡數據庫中的筆跡內碼的實質是相同的。

進一步的，可以對關鍵數據進行筆跡還原處理，從而得到手寫還原筆跡；具體而言，當關鍵數據的數據類型為軌跡數據和/或矢量圖形數據時，可以根據軌跡數據獲取軌跡坐標點的坐標和寫入順序，通過線段將坐標點連接起來，即可還原出用戶手寫筆跡；當關鍵數據的數據類型為截圖數據時，既可以直接對截圖數據進行顯示，也可以對截圖數據進行解析，在獲取到相應的軌跡點坐標后，對軌跡點進行線段連接，從而還原出用戶的手寫筆跡。

在一個具體的實施例中，步驟S110之前還可以包括步驟：

跟蹤用戶輸入的手寫筆跡，對手寫筆跡進行手寫識別處理，得到手寫筆跡對應的筆跡內碼；

采集手寫筆跡對應的關鍵數據；關鍵數據包括手寫筆跡的以下數據中的任意一種或任意組合：軌跡數據、截圖數據和矢量圖形數據；

將筆記內碼和關鍵數據存儲在筆跡數據庫中。

在一個具體的實施例中對手寫筆跡進行手寫識別處理，得到手寫筆跡對應的筆跡內碼的步驟可以包括：

獲取手寫筆跡的有序軌跡信息；

對有序軌跡信息進行內碼轉換，得到筆跡內碼。

在一個具體的實施例中，采集手寫筆跡對應的關鍵數據的步驟可以包括：

采集用戶在進行手寫時經過的軌跡點的特征數據；特征數據包括軌跡點的坐標數據和寫入順序數據；

根據特征數據，對軌跡點進行線段連接，得到手寫軌跡；

對手寫軌跡進行相應的數據處理或轉換，得到所述關鍵數據。

具體而言，本發明可以通過手寫輸入模塊(可以包括紅外、電容、電阻觸摸屏設備)跟蹤用戶輸入的手寫筆跡，獲取手寫筆跡；然后通過手寫識別技術對手寫筆跡進行手寫識別處理，得到手寫筆跡對應的筆跡內碼；同時采集手寫筆跡對應的關鍵數據，具體而言，在用戶書寫輸入筆跡時，可以記錄用戶手指或者筆移動時經過的“點p(x，y)”的坐標位置和寫入順序，然后可以用線段將這些“點”連接起來形成手寫軌跡，而這些“點”數據形成的軌跡數據、截圖數據或矢量圖形數據就是本發明要保存的關鍵數據，具體對手寫軌跡進行數據處理或數據轉換(例如數據截圖、軌跡存儲或根據手寫軌跡進行矢量圖形的繪制)，從而得到相應類型的關鍵數據。

采用這種關鍵數據的采集方式，在用戶在使用書寫設備進行手寫時，可以完全還原出用戶的手寫筆跡，保證筆跡還原的準確性。此外，在本發明的各實施例中，是通過對用戶個人的手寫筆跡進行數據采集，建立起的筆跡數據庫(數據庫中保存的筆跡數據具有個性化的特點，因此可以提高內碼檢索的速度)，使得本發明中的筆跡數據庫能夠貼合用戶的實際書寫習慣的需要，提高將用戶的語音數據處理或轉換成個人的手寫筆跡的效率。

進一步的，本發明也可直接將“點”數據作為關鍵數據進行保存，同時記錄點的輸入時間戳(即寫入順序)，在筆跡還原的過程中直接用線段對“點”進行依次連接，從而還原出用戶的手寫筆跡。

步驟S130之后還可以包括步驟：

將手寫還原筆跡在顯示設備上進行顯示。

具體而言，當用戶在可書寫設備上書寫，遇到不懂書寫的字詞時，可以通過語音輸入，由本發明的方法轉化成書寫筆跡進行補充(顯示在顯示設備上)，不需要通過其他途徑知道怎么書寫后再手動寫上去，過程簡單，使用方便。當用戶雙手被占用時，也可以通過本發明在書寫設備上實現手寫筆跡的顯示，從而提高工作效率。

本發明語音轉化手寫筆跡的方法實施例2：

為了解決傳統的語音技術無法將語音轉化成用戶手寫筆跡的問題，同時詳細闡述本發明的技術方案，特以具體應用本發明語音轉化手寫筆跡的方法進行語音轉化的實例為例，說明本發明的實現過程，圖2為本發明語音轉化手寫筆跡的方法實施例2的流程示意圖；如圖2所示：

獲取用戶在手寫輸入設備中輸入的手寫筆跡，在可以通過手寫識別技術獲取手寫筆跡對應的內碼時(盡量屏蔽掉無效或無用的手寫筆跡，節約設備成本，提高識別效率，同時保證由語音轉化得到的手寫筆跡的準確性)，獲取該手寫筆跡的關鍵數據，并將內碼和關鍵數據即該手寫筆跡的筆跡數據存儲在相應的筆跡數據庫中；同時，可以通過不斷重復上述步驟，得到用戶更多的筆跡數據，以保證筆跡數據庫中數據的全面性與準確性。

獲取用戶輸入的語音數據，在可以通過語音識別技術獲取語音數據對應的內碼時，在上述筆跡數據庫中對語音內碼進行檢索，到檢索到具有相同內容的筆跡內碼時，獲取該筆跡內碼對應的手寫筆跡的關鍵數據，并根據關鍵數據，還原出用戶筆跡，同時在顯示設備上進行顯示。

本發明語音轉化手寫筆跡的方法的各實施例，在筆跡數據庫中對語音識別得到的語音內碼進行檢索，得到語音數據所對應的筆跡關鍵數據，再根據關鍵數據還原出用戶的手寫筆跡，從而通過內碼將語音數據和用戶的手寫筆跡關聯起來，可以將語音中的詞匯內容轉化成用戶手寫筆跡；當用戶在可書寫設備上進行書寫時，可以通過語音輸入，將語音數據轉化成書寫筆跡進行補充，過程簡單，使用方便。

本發明語音轉化手寫筆跡的裝置實施例1：

基于以上語音轉化手寫筆跡的方法的技術思想，同時為了解決傳統的語音技術無法將語音轉化成用戶手寫筆跡的問題，本發明還提供了一種語音轉化手寫筆跡的裝置實施例1，圖3為本發明語音轉化手寫筆跡的裝置實施例1的結構示意圖；如圖3所示，可以包括：

語音識別單元310，用于在接收到用戶輸入的語音數據時，對語音數據進行語音識別處理，得到語音數據對應的語音內碼；

檢索單元320，用于在筆跡數據庫中對語音內碼進行檢索，在檢索到與語音內碼對應的筆跡內碼時，從筆跡數據庫中獲取筆跡內碼對應的手寫筆跡的關鍵數據；筆跡還原單元330，用于對關鍵數據進行筆跡還原處理，得到手寫還原筆跡。

具體而言，本發明語音轉化手寫筆跡的裝置實施例1，通過檢索單元320在筆跡數據庫中對語音識別得到的語音內碼進行檢索，在檢索單元320檢索到相應的筆跡內碼時，即可得到語音數據所對應的筆跡關鍵數據，從而通過內碼將語音數據和用戶的手寫筆跡關聯起來，筆跡還原單元330可以將語音中的詞匯內容轉化成用戶手寫筆跡。

進一步的，可以通過本發明語音轉化手寫筆跡的裝置獲取用戶在手寫輸入設備中輸入的手寫筆跡，在可以通過手寫識別技術獲取手寫筆跡對應的內碼時(盡量屏蔽掉無效或無用的手寫筆跡，節約設備成本，提高識別效率，同時保證由語音轉化得到的手寫筆跡的準確性)，通過獲取該手寫筆跡的關鍵數據，并將內碼和關鍵數據即該手寫筆跡的筆跡數據存儲在相應的筆跡數據庫中；同時，可以通過不斷重復上述步驟，得到用戶更多的筆跡數據，以保證筆跡數據庫中數據的全面性與準確性。

此外接收到用戶輸入的語音數據后，在可以通過語音識別技術獲取語音數據對應的內碼時，在上述筆跡數據庫中對語音內碼進行檢索，到檢索到具有相同內容的筆跡內碼時，獲取該筆跡內碼對應的手寫筆跡的關鍵數據，并根據該關鍵數據，還原出用戶筆跡，同時在顯示設備上進行顯示。

在一個具體的實施例中，語音轉化手寫筆跡的裝置實施例1還可以包括：

手寫識別單元340，用于跟蹤用戶輸入的手寫筆跡，對手寫筆跡進行手寫識別處理，得到手寫筆跡對應的筆跡內碼；

關鍵數據獲取單元350，用于采集手寫筆跡對應的關鍵數據；關鍵數據包括手寫筆跡的以下數據中的任意一種或任意組合：軌跡數據、截圖數據和矢量圖形數據；

存儲單元360，用于將筆記內碼和關鍵數據存儲在筆跡數據庫中。

在一個具體的實施例中，關鍵數據獲取單元350可以包括：

采集模塊352，用于采集用戶在進行手寫時經過的軌跡點的特征數據；特征數據包括軌跡點的坐標數據和寫入順序數據；

軌跡獲取模塊354，用于根據特征數據，對軌跡點進行線段連接，得到手寫軌跡；

數據處理模塊356，用于對手寫軌跡進行相應的數據處理或轉換，得到關鍵數據。

在一個具體的實施例中，筆跡還原單元330可以包括：

采集模塊332，用于根據關鍵數據，獲取用戶在進行手寫時經過的軌跡的特征數據；特征數據包括軌跡點的坐標數據和寫入順序數據；

數據處理模塊334，用于根據特征數據，對軌跡點進行線段連接，得到手寫還原筆跡。

具體而言，本發明可以通過手寫識別單元340跟蹤用戶輸入的手寫筆跡，獲取手寫筆跡，并對手寫筆跡進行手寫識別處理，得到手寫筆跡對應的筆跡內碼。并通過關鍵數據獲取單元360采集手寫筆跡對應的關鍵數據，具體而言，在用戶書寫輸入筆跡時，可以記錄用戶手指或者筆移動時經過的“點p(x，y)”的位置，然后可以用線段將這些“點”連接起來形成筆跡，那么這些“點”數據就是本發明要保存的關鍵數據(也可以為軌跡數據、截圖數據或矢量圖形數據)。

在一個具體的實施例中，語音轉化手寫筆跡的裝置還可以包括：顯示單元380，用于將手寫還原筆跡在顯示設備上進行顯示。

具體而言，當用戶在可書寫設備上書寫，遇到不懂書寫的字詞時或者雙手被占用的情況時，可以通過語音輸入，由本發明的裝置將語音數據轉化成書寫筆跡進行補充(顯示在顯示設備上)，不需要通過其他途徑知道怎么書寫后再手動寫上去，過程簡單，使用方便。

本發明語音轉化手寫筆跡的裝置實施例1，在筆跡數據庫中對語音識別得到的內碼進行檢索，得到語音數據所對應的筆跡關鍵數據，從而通過內碼將語音數據和用戶的手寫筆跡關聯起來，可以將語音中的詞匯內容轉化成用戶手寫筆跡；當用戶在可書寫設備上書寫，遇到不懂書寫的字詞時，可以通過語音輸入，由本發明的方法轉化成書寫筆跡進行補充，不需要通過其他途徑知道怎么書寫后再手動寫上去，過程簡單，使用方便。

以上所述實施例的各技術特征可以進行任意的組合，為使描述簡潔，未對上述實施例中的各個技術特征所有可能的組合都進行描述，然而，只要這些技術特征的組合不存在矛盾，都應當認為是本說明書記載的范圍。

以上所述實施例僅表達了本發明的幾種實施方式，其描述較為具體和詳細，但并不能因此而理解為對發明專利范圍的限制。應當指出的是，對于本領域的普通技術人員來說，在不脫離本發明構思的前提下，還可以做出若干變形和改進，這些都屬于本發明的保護范圍。因此，本發明專利的保護范圍應以所附權利要求為準。

完整全部詳細技術資料下載

當前第1頁1 2 3