1.一種音頻批量分割方法,其特征在于,所述方法包括下述步驟:
獲取錄音文本以及錄音后的音頻,將所述音頻進行語音識別,得到對應(yīng)的待匹配文本;
將所述待匹配文本與所述錄音文本進行匹配;
根據(jù)預(yù)設(shè)匹配度,從所述音頻中分割出對應(yīng)的小音頻段。
2.如權(quán)利要求1所述的方法,其特征在于,所述獲取錄音文本以及錄音后的音頻,將所述音頻進行語音識別,得到對應(yīng)的待匹配文本的步驟,包括:
根據(jù)說話的時間間隔,將所述音頻分割為臨時音頻段;
將所述臨時音頻段進行語音識別,得到對應(yīng)的待匹配文本。
3.如權(quán)利要求1所述的方法,其特征在于,所述將所述待匹配文本與所述錄音文本進行匹配的步驟,包括:
獲取所述待匹配文本的字符串;
將所述待匹配文本的字符串與所述錄音文本的字符串進行逐字符匹配。
4.如權(quán)利要求1所述的方法,其特征在于,所述預(yù)設(shè)匹配度,從所述音頻中分割出對應(yīng)的小音頻段的步驟,包括:
當(dāng)所述待匹配文本與所述錄音文本的匹配度大于預(yù)設(shè)匹配度時,從所述音頻中分割出對應(yīng)的小音頻段,所述小音頻段包括對應(yīng)字、詞、短語和\或句子的音頻。
5.如權(quán)利要求1所述的方法,其特征在于,所述預(yù)設(shè)匹配度,從所述音頻中分割出對應(yīng)的小音頻段的步驟,還包括:
當(dāng)所述待匹配文本與所述錄音文本的匹配度小于預(yù)設(shè)匹配度時,從所述錄音文本中提取出未匹配到的文本。
6.一種音頻批量分割裝置,其特征在于,所述裝置包括:
待匹配文本識別單元,用于獲取錄音文本以及錄音后的音頻,將所述音頻進行語音識別,得到對應(yīng)的待匹配文本;
文本匹配單元,用于將所述待匹配文本與所述錄音文本進行匹配;以及
小音頻分割單元,用于根據(jù)預(yù)設(shè)匹配度,從所述音頻中分割出對應(yīng)的小音頻段。
7.如權(quán)利要求6所述的裝置,其特征在于,所述待匹配文本識別單元,包括:
臨時分割單元,用于根據(jù)說話的時間間隔,將所述音頻分割為臨時音頻段;以及
待匹配文本識別子單元,用于將所述臨時音頻段進行語音識別,得到對應(yīng)的待匹配文本。
8.如權(quán)利要求6所述的裝置,其特征在于,所述文本匹配單元,包括:
字符串單元,用于獲取所述待匹配文本的字符串;以及
文本匹配子單元,用于將所述待匹配文本的字符串與所述錄音文本的字符串進行逐字符匹配。
9.如權(quán)利要求6所述的裝置,其特征在于,所述小音頻分割單元,包括:
分割子單元,用于當(dāng)所述待匹配文本與所述錄音文本的匹配度大于預(yù)設(shè)匹配度時,從所述音頻中分割出對應(yīng)的小音頻段,所述小音頻段包括對應(yīng)字、詞、短語和\或句子的音頻。
10.如權(quán)利要求6所述的裝置,其特征在于,所述小音頻分割單元,還包括:
提取單元,用于當(dāng)所述待匹配文本與所述錄音文本的匹配度小于預(yù)設(shè)匹配度時,從所述錄音文本中提取出未匹配到的文本。