麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種音頻批量分割方法及裝置與流程

文檔序號:11097829閱讀:866來源:國知局
一種音頻批量分割方法及裝置與制造工藝

本發(fā)明屬于計算機技術領域,尤其涉及一種音頻批量分割方法及裝置。



背景技術:

目前根據錄音文本的內容錄制對應的音頻后,需要進行后期音頻處理,將錄音文本的內容分割成多個對應的小音頻段,現有的音頻分割方法是:把音頻導入Audition音頻處理軟件中,通過人工一邊看錄音文本,一邊聽錄音后的音頻,同時將每小段加上標識,之后導出標記有標識的小音頻段,從而完成音頻拆分,該方法依賴人工進行分割,需要花費大量的時間,從而增加人力成本,另外,通過人工去邊看錄音文本邊標記,需要一直集中注意力,否則出錯率很高,后期還需要人工進行校正,保證正確率,效率極低。



技術實現要素:

本發(fā)明的目的在于提供一種音頻批量分割方法及裝置,旨在解決現有技術中需要依賴人工對音頻進行分割,導致人力成本過高、分割效率較低以及出錯率較高的問題。

一方面,本發(fā)明提供了一種音頻批量分割方法,所述方法包括下述步驟:

獲取錄音文本以及錄音后的音頻,將所述音頻進行語音識別,得到對應的待匹配文本;

將所述待匹配文本與所述錄音文本進行匹配;

根據預設匹配度,從所述音頻中分割出對應的小音頻段。

另一方面,本發(fā)明提供了一種音頻批量分割裝置,所述裝置包括:

待匹配文本識別單元,用于獲取錄音文本以及錄音后的音頻,將所述音頻進行語音識別,得到對應的待匹配文本;

文本匹配單元,用于將所述待匹配文本與所述錄音文本進行匹配;以及

小音頻分割單元,用于根據預設匹配度,從所述音頻中分割出對應的小音頻段。

在本發(fā)明實施例中,將錄音后的音頻通過語音識別得到待匹配文本,將待匹配文本與錄音文本進行匹配后,從音頻中分割出對應的小音頻段,通過語音識別與文本匹配,實現將錄音的音頻,按錄音文本的要求,直接批量分割成多個小音頻段,無需逐個一一加標識再導出分割小音頻段,從而提高拆分效率,節(jié)約人力成本以及降低出錯率。

附圖說明

圖1是本發(fā)明實施例一提供的音頻批量分割方法的實現流程圖;以及

圖2是本發(fā)明實施例二提供的音頻批量分割裝置的結構示意圖。

具體實施方式

為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結合附圖及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

以下結合具體實施例對本發(fā)明的具體實現進行詳細描述:

實施例一:

圖1示出了本發(fā)明實施例一提供的音頻批量分割方法的實現流程圖,為了便于說明,僅示出了與本發(fā)明實施例相關的部分,詳述如下:

在步驟S101中,獲取錄音文本以及錄音后的音頻,將音頻進行語音識別,得到對應的待匹配文本。

在本發(fā)明實施例中,根據已有的錄音文本進行錄音,得到錄音后的音頻,錄音之后需要對該音頻進行處理,通過語音識別技術得到識別后的待匹配文本,該待匹配文本是對應該音頻識別出的文本數據。

進一步地,根據說話的時間間隔,將音頻分割為臨時音頻段;

將臨時音頻段進行語音識別,得到對應的待匹配文本。

具體地,為了降低數據處理量,可以通過預處理將音頻根據說話的時間間隔進行臨時分割,得到臨時音頻段,然后對該臨時音頻段進行語音識別,得到對應的待匹配文本。

在步驟S102中,將待匹配文本與錄音文本進行匹配。

在本發(fā)明實施例中,通過對音頻進行語音識別得到待匹配文本,將待匹配文本與錄音文本進行匹配。

進一步地,獲取待匹配文本的字符串;

將待匹配文本的字符串與錄音文本的字符串進行逐字符匹配。

具體地,獲取待匹配文本的字符串,通過將待匹配文本的字符串與錄音文本的字符串進行逐字符匹配,有效地保證了匹配的精確度,同時提高匹配效率。

在步驟S103中,根據預設匹配度,從音頻中分割出對應的小音頻段。

在本發(fā)明實施例中,將待匹配文本與錄音文本進行匹配,根據預設匹配度,從音頻中分割出對應的小音頻段,該小音頻段包括對應字、詞、短語和\或句子的音頻。

進一步地,當待匹配文本與錄音文本的匹配度大于預設匹配度時,從音頻中分割出對應的小音頻段。

具體地,當待匹配文本與錄音文本的匹配度為全完匹配時,從音頻中分割出對應的小音頻段,還可以通過預設匹配度,將大于預設匹配度的待匹配文本所對應的音頻中分割出對應的小音頻段。根據實際經驗,可以將預設匹配度設定為60%-80%。

又進一步地,當待匹配文本與錄音文本的匹配度小于預設匹配度時,從錄音文本中提取出未匹配到的文本。

具體地,將待匹配文本與錄音文本進行匹配,當待匹配文本與錄音文本的匹配度小于預設匹配度時,從錄音文本中提取出未匹配到的文本,以便于后期再次對該未匹配到的文本,進一步進行處理。

在本發(fā)明實施例中,將錄音后的音頻通過語音識別得到待匹配文本,將待匹配文本與錄音文本進行匹配后,從音頻中分割出對應的小音頻段,通過語音識別與文本匹配,實現將錄音的音頻,按錄音文本的要求,直接批量分割成多個小音頻段,無需逐個一一加標識再導出分割小音頻段,從而提高拆分效率,節(jié)約人力成本以及降低出錯率。

本領域普通技術人員可以理解實現上述實施例方法中的全部或部分步驟是可以通過程序來指令相關的硬件來完成,所述的程序可以存儲于一計算機可讀取存儲介質中,所述的存儲介質,如ROM/RAM、磁盤、光盤等。

實施例二:

圖2示出了本發(fā)明實施例二提供的音頻批量分割裝置的結構示意圖,為了便于說明,僅示出了與本發(fā)明實施例相關的部分。在本發(fā)明實施例中,音頻批量分割裝置包括:待匹配文本識別單元21、文本匹配單元22以及小音頻分割單元23,其中:

待匹配文本識別單元21,用于獲取錄音文本以及錄音后的音頻,將音頻進行語音識別,得到對應的待匹配文本。

在本發(fā)明實施例中,根據已有的錄音文本進行錄音,得到錄音后的音頻,錄音之后需要對該音頻進行處理,通過語音識別技術得到識別后的待匹配文本,該待匹配文本是對應該音頻識別出的文本數據。

進一步地,該待匹配文本識別單元21包括:臨時分割單元211以及待匹配文本識別子單元212,其中:

臨時分割單元211,用于根據說話的時間間隔,將音頻分割為臨時音頻段;以及

待匹配文本識別子單元212,用于將臨時音頻段進行語音識別,得到對應的待匹配文本。

具體地,為了降低數據處理量,可以通過預處理將音頻根據說話的時間間隔進行臨時分割,得到臨時音頻段,然后對該臨時音頻段進行語音識別,得到對應的待匹配文本。

文本匹配單元22,用于將待匹配文本與錄音文本進行匹配。

在本發(fā)明實施例中,通過對音頻進行語音識別得到待匹配文本,將待匹配文本與錄音文本進行匹配。

進一步地,該文本匹配單元22包括:字符串單元221以及文本匹配子單元222,其中:

字符串單元221,用于獲取待匹配文本的字符串;以及

文本匹配子單元222,用于將待匹配文本的字符串與錄音文本的字符串進行逐字符匹配。

具體地,獲取待匹配文本的字符串,通過將待匹配文本的字符串與錄音文本的字符串進行逐字符匹配,有效地保證了匹配的精確度,同時提高匹配效率。

小音頻分割單元23,用于根據預設匹配度,從音頻中分割出對應的小音頻段。

在本發(fā)明實施例中,將待匹配文本與錄音文本進行匹配,根據預設匹配度,從音頻中分割出對應的小音頻段,該小音頻段包括對應字、詞、短語和\或句子的音頻。

進一步地,該小音頻分割單元23,包括:

分割子單元231,用于當待匹配文本與錄音文本的匹配度大于預設匹配度時,從音頻中分割出對應的小音頻段,該小音頻段包括對應字、詞、短語和\或句子的音頻。

具體地,當待匹配文本與錄音文本的匹配度為全完匹配時,從音頻中分割出對應的小音頻段,還可以通過預設匹配度,將大于預設匹配度的待匹配文本所對應的音頻中分割出對應的小音頻段。根據實際經驗,可以將預設匹配度設定為60%-80%。

又進一步地,該小音頻分割單元23,還包括:

提取單元232,用于當待匹配文本與錄音文本的匹配度小于預設匹配度時,從錄音文本中提取出未匹配到的文本。

具體地,將待匹配文本與錄音文本進行匹配,當待匹配文本與錄音文本的匹配度小于預設匹配度時,從錄音文本中提取出未匹配到的文本,以便于后期再次對該未匹配到的文本,進一步進行處理。

在本發(fā)明實施例中,將錄音后的音頻通過語音識別得到待匹配文本,將待匹配文本與錄音文本進行匹配后,從音頻中分割出對應的小音頻段,通過語音識別與文本匹配,實現將錄音的音頻,按錄音文本的要求,直接批量分割成多個小音頻段,無需逐個一一加標識再導出分割小音頻段,從而提高拆分效率,節(jié)約人力成本以及降低出錯率。

在本發(fā)明實施例中,音頻批量分割裝置的各單元可由相應的硬件或軟件單元實現,各單元可以為獨立的軟、硬件單元,也可以集成為一個軟、硬件單元,在此不用以限制本發(fā)明。該裝置各單元的實施方式具體可參考前述實施例一的描述,在此不再贅述。

以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內所作的任何修改、等同替換和改進等,均應包含在本發(fā)明的保護范圍之內。

當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 大安市| 宁明县| 平顶山市| 乐安县| 象州县| 五家渠市| 那坡县| 乌拉特前旗| 祁门县| 德江县| 乐平市| 安图县| 隆化县| 太湖县| 田阳县| 靖边县| 庆元县| 周口市| 霍州市| 政和县| 望都县| 松潘县| 黄骅市| 濮阳县| 平果县| 甘洛县| 柞水县| 鹰潭市| 栾川县| 西吉县| 翁牛特旗| 册亨县| 株洲市| 乐亭县| 忻州市| 调兵山市| 齐河县| 高陵县| 建始县| 同德县| 乌鲁木齐市|