一種視頻處理方法、裝置、設(shè)備及存儲介質(zhì)與流程

文檔序號：41756840發(fā)布日期：2025-04-29 18:25閱讀：3來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本公開涉及數(shù)據(jù)處理領(lǐng)域，尤其涉及一種視頻處理方法、裝置、設(shè)備及存儲介質(zhì)。

背景技術(shù)：

1、隨著計算機技術(shù)的不斷發(fā)展，人們對視頻編輯類應(yīng)用程序能夠支持的視頻處理功能的需求越來越多樣化。例如，大多視頻編輯軟件支持音頻識別成文字，即字幕生成功能等。

2、為了滿足用戶日益增長的多樣化視頻處理需求，如何進一步豐富視頻處理方式是目標(biāo)亟待解決的技術(shù)問題。

技術(shù)實現(xiàn)思路

1、為了解決上述技術(shù)問題，本公開實施例提供了一種視頻處理方法。

2、第一方面，本公開提供了一種視頻處理方法，所述方法包括：

3、對目標(biāo)視頻草稿中的音頻進行語音識別，得到所述目標(biāo)視頻草稿的初始文本片段；

4、根據(jù)所述目標(biāo)視頻草稿的初始語言類型和目標(biāo)語言類型，對所述初始文本片段進行語言轉(zhuǎn)換得到目標(biāo)文本片段；其中，所述初始語言類型用于表征所述目標(biāo)視頻草稿所屬的語言類型，所述目標(biāo)文本片段屬于所述目標(biāo)語言類型；

5、基于所述目標(biāo)文本片段生成目標(biāo)音頻片段；其中，所述目標(biāo)音頻片段屬于所述目標(biāo)語言類型；

6、基于所述目標(biāo)音頻片段生成所述目標(biāo)視頻草稿對應(yīng)的編輯結(jié)果視頻草稿；其中，所述編輯結(jié)果視頻草稿中的目標(biāo)音頻片段與所述目標(biāo)視頻草稿對應(yīng)的初始文本片段之間具有對應(yīng)關(guān)系，所述編輯結(jié)果視頻草稿屬于所述目標(biāo)語言類型。

7、一種可選的實施方式中，所述根據(jù)所述目標(biāo)視頻草稿的初始語言類型和目標(biāo)語言類型，對所述初始文本片段進行語言轉(zhuǎn)換得到目標(biāo)文本片段之前，還包括：

8、根據(jù)所述目標(biāo)視頻草稿的初始文本片段，確定所述目標(biāo)視頻草稿的初始語言類型；

9、以及，接收針對所述目標(biāo)視頻草稿輸入的目標(biāo)語言類型。

10、一種可選的實施方式中，所述根據(jù)所述目標(biāo)視頻草稿的初始文本片段，確定所述目標(biāo)視頻草稿的初始語言類型，包括：

11、將所述目標(biāo)視頻草稿的初始文本片段中的文字轉(zhuǎn)換成預(yù)設(shè)類型編碼；

12、根據(jù)所述文字對應(yīng)的預(yù)設(shè)類型編碼所屬的編碼范圍，確定所述目標(biāo)視頻草稿的初始語言類型。

13、一種可選的實施方式中，所述根據(jù)所述目標(biāo)視頻草稿的初始語言類型和目標(biāo)語言類型，對所述初始文本片段進行語言轉(zhuǎn)換得到目標(biāo)文本片段，包括：

14、如果確定所述初始語言類型和所述目標(biāo)語言類型屬于同一種語言類型下的不同方言類型，則將所述目標(biāo)視頻草稿的初始文本片段確定為目標(biāo)文本片段。

15、一種可選的實施方式中，所述根據(jù)所述目標(biāo)視頻草稿的初始語言類型和目標(biāo)語言類型，對所述初始文本片段進行語言轉(zhuǎn)換得到目標(biāo)文本片段之前，還包括：

16、對所述目標(biāo)視頻草稿中的音頻進行語音識別，獲取所述目標(biāo)視頻草稿的語音聲紋信息；

17、針對不同的語音聲紋信息分別生成不同的文本軌道；其中，所述不同的文本軌道用于承載不同的語音聲紋信息對應(yīng)的初始文本片段。

18、一種可選的實施方式中，所述基于所述目標(biāo)文本片段生成目標(biāo)音頻片段，包括：

19、確定第一文本軌道對應(yīng)的文本朗讀聲音信息；

20、利用所述文本朗讀聲音信息，基于所述第一文本軌道上的目標(biāo)文本片段生成目標(biāo)音頻片段。

21、一種可選的實施方式中，所述基于所述目標(biāo)音頻片段生成所述目標(biāo)視頻草稿對應(yīng)的編輯結(jié)果視頻草稿之前，還包括：

22、根據(jù)所述目標(biāo)音頻片段對應(yīng)的初始音頻片段的時長，對所述目標(biāo)音頻片段的播放速度進行調(diào)整，得到變速后目標(biāo)音頻片段；其中，所述初始音頻片段屬于所述目標(biāo)視頻草稿，所述變速后目標(biāo)音頻片段的時長與所述初始音頻片段的時長之差不大于預(yù)設(shè)時長閾值；

23、相應(yīng)的，所述基于所述目標(biāo)音頻片段生成所述目標(biāo)視頻草稿對應(yīng)的編輯結(jié)果視頻草稿，包括：

24、基于所述變速后目標(biāo)音頻片段，生成所述目標(biāo)視頻草稿對應(yīng)的編輯結(jié)果視頻草稿。

25、一種可選的實施方式中，所述基于所述目標(biāo)音頻片段生成所述目標(biāo)視頻草稿對應(yīng)的編輯結(jié)果視頻草稿之后，還包括：

26、響應(yīng)于針對所述編輯結(jié)果視頻草稿中的第一目標(biāo)音頻片段的選定操作，顯示所述第一目標(biāo)音頻片段對應(yīng)的多個候選文本內(nèi)容；

27、響應(yīng)于針對所述多個候選文本內(nèi)容中的目標(biāo)候選文本內(nèi)容的選定操作，生成所述目標(biāo)候選文本內(nèi)容對應(yīng)的音頻片段；

28、利用所述目標(biāo)候選文本內(nèi)容對應(yīng)的音頻片段更新所述編輯結(jié)果視頻草稿中的所述第一目標(biāo)音頻片段。

29、一種可選的實施方式中，所述基于所述初始音頻片段對應(yīng)的目標(biāo)音頻片段，生成所述目標(biāo)視頻草稿對應(yīng)的編輯結(jié)果視頻草稿之前，還包括：

30、將所述目標(biāo)文本片段確定為對應(yīng)的目標(biāo)音頻片段的字幕片段；

31、相應(yīng)的，所述基于所述初始音頻片段對應(yīng)的目標(biāo)音頻片段，生成所述目標(biāo)視頻草稿對應(yīng)的編輯結(jié)果視頻草稿，包括：

32、基于所述初始音頻片段對應(yīng)的目標(biāo)音頻片段以及所述目標(biāo)音頻片段的字幕片段，生成所述目標(biāo)視頻草稿對應(yīng)的編輯結(jié)果視頻草稿。

33、一種可選的實施方式中，所述對目標(biāo)視頻草稿中的音頻進行語音識別，得到所述目標(biāo)視頻草稿對應(yīng)的初始文本片段之前，還包括：

34、基于原始視頻確定目標(biāo)視頻草稿；

35、相應(yīng)的，所述基于所述目標(biāo)音頻片段生成所述目標(biāo)視頻草稿對應(yīng)的編輯結(jié)果視頻草稿之后，還包括：

36、響應(yīng)于視頻導(dǎo)出操作，基于所述編輯結(jié)果視頻草稿生成所述原始視頻對應(yīng)的目標(biāo)視頻；其中，所述目標(biāo)視頻屬于所述目標(biāo)語言類型。

37、第二方面，本公開提供了一種視頻處理裝置，所述裝置包括：

38、語音識別模塊，用于對目標(biāo)視頻草稿中的音頻進行語音識別，得到所述目標(biāo)視頻草稿的初始文本片段；

39、轉(zhuǎn)換模塊，用于根據(jù)所述目標(biāo)視頻草稿的初始語言類型和目標(biāo)語言類型，對所述初始文本片段進行語言轉(zhuǎn)換得到目標(biāo)文本片段；其中，所述初始語言類型用于表征所述目標(biāo)視頻草稿所屬的語言類型，所述目標(biāo)文本片段屬于所述目標(biāo)語言類型；

40、第一生成模塊，用于基于所述目標(biāo)文本片段生成目標(biāo)音頻片段；其中，所述目標(biāo)音頻片段屬于所述目標(biāo)語言類型；

41、第二生成模塊，用于基于所述目標(biāo)音頻片段生成所述目標(biāo)視頻草稿對應(yīng)的編輯結(jié)果視頻草稿；其中，所述編輯結(jié)果視頻草稿中的目標(biāo)音頻片段與所述目標(biāo)視頻草稿的初始文本片段之間具有對應(yīng)關(guān)系，所述編輯結(jié)果視頻草稿屬于所述目標(biāo)語言類型。

42、第三方面，本公開提供了一種計算機可讀存儲介質(zhì)，所述計算機可讀存儲介質(zhì)中存儲有指令，當(dāng)所述指令在終端設(shè)備上運行時，使得所述終端設(shè)備實現(xiàn)上述的方法。

43、第四方面，本公開提供了一種視頻處理設(shè)備，包括：存儲器，處理器，及存儲在所述存儲器上并可在所述處理器上運行的計算機程序，所述處理器執(zhí)行所述計算機程序時，實現(xiàn)上述的方法。

44、第五方面，本公開提供了一種計算機程序產(chǎn)品，所述計算機程序產(chǎn)品包括計算機程序/指令，所述計算機程序/指令被處理器執(zhí)行時實現(xiàn)上述的方法。

45、本公開實施例提供的技術(shù)方案與現(xiàn)有技術(shù)相比至少具有如下優(yōu)點：

46、本公開實施例提供了一種視頻處理方法，首先，對目標(biāo)視頻草稿中的音頻進行語音識別，得到目標(biāo)視頻草稿的初始文本片段，根據(jù)目標(biāo)視頻草稿的初始語言類型和目標(biāo)語言類型，對初始文本片段進行語言轉(zhuǎn)換得到目標(biāo)文本片段，其中，初始語言類型用于表征目標(biāo)視頻草稿所屬的語言類型，目標(biāo)文本片段屬于目標(biāo)語言類型，然后，基于目標(biāo)文本片段生成目標(biāo)音頻片段，其中，目標(biāo)音頻片段屬于目標(biāo)語言類型，最后，基于目標(biāo)音頻片段生成目標(biāo)視頻草稿對應(yīng)的編輯結(jié)果視頻草稿，其中，編輯結(jié)果視頻草稿中的目標(biāo)音頻片段與目標(biāo)視頻草稿中的初始音頻片段之間具有對應(yīng)關(guān)系，編輯結(jié)果視頻草稿屬于目標(biāo)語言類型。可見，本公開實施例通過將目標(biāo)視頻草稿的初始文本片段進行語言轉(zhuǎn)換得到屬于目標(biāo)語言類型的目標(biāo)文本片段，并基于目標(biāo)文本片段生成屬于目標(biāo)語言類型的目標(biāo)音頻片段，進而生成編輯結(jié)果視頻草稿的方式，實現(xiàn)了將一種語言類型的目標(biāo)視頻草稿轉(zhuǎn)換成另一種語言類型的編輯結(jié)果視頻草稿的視頻編輯功能，滿足用戶日益增長的多樣化視頻處理需求，提升了用戶體驗。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：尹赟江,熊英鷹,張永根
技術(shù)所有人：北京字跳網(wǎng)絡(luò)技術(shù)有限公司
我是此專利的發(fā)明人

上一篇：一種瓦楞紙箱釘裝裝置的制作方法
上一篇：一種納米霧噴射頭皮洗護一體設(shè)備的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種視頻處理方法、裝置、設(shè)備及存儲介質(zhì)與流程