本公開涉及人工智能,特別涉及一種直播方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,具備直播功能的應(yīng)用程序(比如短視頻應(yīng)用)在人群中越來越普及。這使得主播通過應(yīng)用程序創(chuàng)建直播間即可進行直播。相應(yīng)地,觀眾通過應(yīng)用程序進入他人的直播間即可觀看直播。
2、通常情況下,主播在直播開始前需要編寫直播腳本,這樣在直播過程中便可按照編寫的直播腳本推進直播內(nèi)容。然而,這對主播的個人能力和專業(yè)素養(yǎng)要求非常高,對于普通人來講存在直播成本高、直播難度大等問題。為此,在確保直播內(nèi)容質(zhì)量的前提下,如何降低直播成本和直播難度,成為了本領(lǐng)域技術(shù)人員亟待解決的一個問題。
技術(shù)實現(xiàn)思路
1、本公開提供一種直播方法、裝置、電子設(shè)備及存儲介質(zhì)。本公開的技術(shù)方案如下:
2、根據(jù)本公開實施例的第一方面,提供一種直播方法,包括:
3、在直播配置頁面上顯示輔助直播入口,所述直播配置頁面用于提供對目標直播事件的配置功能;
4、響應(yīng)于對所述輔助直播入口的觸發(fā)操作,顯示多個基于人工智能的直播模式;其中,不同的直播模式用于在直播過程中采用不同的輔助直播方式對所述目標直播事件進行直播;
5、響應(yīng)于對任一個直播模式的選中操作,在直播開始后,基于被選中的直播模式顯示直播頁面。
6、在一些實施例中,所述顯示多個直播模式,包括:
7、顯示第一直播模式、第二直播模式或第三直播模式中的兩個或兩個以上;
8、其中,所述第一直播模式是指通過在所述直播頁面上顯示直播文案對第一主播對象進行輔助直播;所述第一主播對象用于對所述目標直播事件進行直播;
9、所述第二直播模式是指通過在直播間內(nèi)播放直播音頻對所述第一主播對象進行輔助直播;所述直播音頻是通過對所述直播文案進行文本轉(zhuǎn)語音得到的;
10、所述第三直播模式是指通過數(shù)字虛擬人在所述直播間內(nèi)對所述目標直播事件進行直播。
11、在另一些實施例中,所述方法還包括:
12、顯示至少一條歷史直播記錄;其中,所述歷史直播記錄用于描述歷史直播事件;
13、響應(yīng)于對第一歷史直播記錄的復(fù)用操作,基于所述第一歷史直播記錄中描述的歷史直播事件的配置數(shù)據(jù),顯示所述直播頁面;
14、響應(yīng)于對第二歷史直播記錄的編輯操作,基于所述第二歷史直播記錄中描述的歷史直播事件編輯后的配置數(shù)據(jù),顯示所述直播頁面。
15、在另一些實施例中,在選中所述第二直播模式的情況下,所述基于被選中的直播模式顯示直播頁面,包括:
16、在所述直播頁面上顯示提詞控件;
17、響應(yīng)于對所述提詞控件的觸發(fā)操作,在所述直播頁面上顯示與當前直播進度相匹配的直播文案。
18、在另一些實施例中,所述在所述直播頁面上顯示與當前直播進度相匹配的直播文案,包括:
19、在當前直播進度指示所述第一主播對象正在進行物品講解的情況下,在所述直播頁面上顯示當前正在講解中的物品的講解文案;或,
20、在當前直播進度指示直播開始的情況下,在所述直播頁面上顯示直播開場文案;或,
21、在當前直播進度指示所述第一主播對象正在進行互動引導(dǎo)的情況下,在所述直播頁面上顯示互動引導(dǎo)文案;或,
22、在當前直播進度指示直播結(jié)束的情況下,在所述直播頁面上顯示直播結(jié)束文案。
23、在另一些實施例中,在選中所述第二直播模式的情況下,所述基于被選中的直播模式顯示直播頁面,包括:
24、在所述直播頁面上顯示音頻播放控件;
25、響應(yīng)于對所述音頻播放控件的觸發(fā)操作,在所述直播頁面上顯示至少一條直播音頻的播放控件;
26、響應(yīng)于對任一條直播音頻的播放控件的觸發(fā)操作,在所述直播間內(nèi)播放被選中的直播音頻。
27、在另一些實施例中,在選中所述第二直播模式的情況下,所述方法還包括:
28、顯示至少一個聲音選項;其中,不同的聲音選項用于提供具有不同聲學(xué)特征的樣本聲音;
29、響應(yīng)于基于任一個聲音選項的聲音播放操作,播放被選中的樣本聲音;
30、響應(yīng)于基于任一個聲音選項的聲音選用操作,基于被選中的樣本聲音的聲學(xué)特征,對所述直播文案進行文本轉(zhuǎn)語音,得到直播音頻。
31、在另一些實施例中,在選中所述第二直播模式的情況下,所述方法還包括:
32、獲取輸入的樣本聲音;
33、基于輸入的樣本聲音的聲學(xué)特征,對所述直播文案進行文本轉(zhuǎn)語音,得到直播音頻。
34、在另一些實施例中,所述直播音頻包括待展示物品的講解音頻、直播開場音頻、互動引導(dǎo)音頻或直播結(jié)束音頻中的至少一類;所述方法還包括:
35、響應(yīng)于對生成的任一條直播音頻的試聽操作,播放所述直播音頻。
36、在另一些實施例中,在選中所述第一直播模式的情況下,所述基于被選中的直播模式顯示直播頁面,包括:
37、在所述直播頁面上顯示提詞控件;
38、響應(yīng)于對所述提詞控件的觸發(fā)操作,在所述直播頁面上顯示與當前直播進度相匹配的直播文案。
39、在另一些實施例中,在選中所述第三直播模式的情況下,所述方法還包括:
40、顯示至少一個聲音選項和至少一個形象選項;其中,不同的聲音選項用于提供具有不同聲學(xué)特征的樣本聲音;不同的形象選項用于提供具有不同形象的數(shù)字虛擬人;
41、響應(yīng)于對任一個聲音選項和任一個形象選項的選中操作,生成直播視頻;其中,所述直播視頻中包括用于播報所述直播文案的數(shù)字虛擬人,所述數(shù)字虛擬人與所述樣本聲音具有相同的聲學(xué)特征。
42、在另一些實施例中,所述方法還包括:
43、響應(yīng)于對任一個直播模式的選中操作,顯示配置選項;其中,所述配置選項用于指示配置直播時長、直播風格或直播間內(nèi)待展示的物品類目中的至少一項;
44、基于配置的直播時長、直播風格或物品類目中的至少一項,顯示物品推薦列表;其中,所述物品推薦列表中的物品在直播開始后處于被展示狀態(tài)。
45、在另一些實施例中,所述響應(yīng)于對任一個直播模式的選中操作,顯示設(shè)置選項包括:
46、響應(yīng)于對任一個直播模式選項的選中操作,在所述直播設(shè)置頁面上顯示第一設(shè)置控件;
47、響應(yīng)于對所述第一設(shè)置控件的觸發(fā)操作,顯示所述設(shè)置選項。
48、在另一些實施例中,所述方法還包括:
49、顯示所述物品推薦列表的編輯控件;其中,所述編輯控件用于被觸發(fā)后執(zhí)行以下至少一種操作;
50、刪除所述物品推薦列表中的物品;
51、在所述物品推薦列表中添加新的物品;
52、調(diào)整所述物品推薦列表中包括的物品的排序。
53、在另一些實施例中,所述方法還包括:
54、基于所述物品推薦列表和設(shè)置的直播風格,顯示生成的直播文案;
55、響應(yīng)于對所述直播文案的編輯操作,顯示編輯后的所述直播文案。
56、在另一些實施例中,所述方法還包括:
57、在所述直播文案的生成過程中,響應(yīng)于頁面退出操作,保存當前頁面內(nèi)容;或,
58、在語音合成過程中,響應(yīng)于頁面退出操作,保存當前頁面內(nèi)容。
59、在另一些實施例中,所述基于被選中的樣本聲音的聲學(xué)特征,對所述直播文案進行文本轉(zhuǎn)語音,得到直播音頻,包括以下至少一項:
60、基于被選中的樣本語音,對待展示物品的講解文案進行文本轉(zhuǎn)語音,得到與被選中的樣本語音具有相同聲學(xué)特征的講解音頻;
61、基于被選中的樣本語音,對直播開場文案進行文本轉(zhuǎn)語音,得到與被選中的樣本語音具有相同聲學(xué)特征的直播開場音頻;
62、基于被選中的樣本語音,對互動引導(dǎo)文案進行文本轉(zhuǎn)語音,得到與被選中的樣本語音具有相同聲學(xué)特征的互動引導(dǎo)音頻;
63、基于被選中的樣本語音,對直播結(jié)束文案進行文本轉(zhuǎn)語音,得到與被選中的樣本語音具有相同聲學(xué)特征的直播結(jié)束音頻。
64、在另一些實施例中,所述方法還包括:
65、響應(yīng)于基于任一個形象選項的視頻播放操作,播放被選中的數(shù)字虛擬人的樣本播報視頻。
66、在另一些實施例中,所述方法還包括:
67、配置所述目標直播事件的開播時間;
68、所述基于被選中的直播模式顯示直播頁面,包括:。
69、在到達所述開播時間后,在所述直播頁面上播放所述直播視頻。
70、根據(jù)本公開實施例的第二方面,提供一種直播方法,所述方法包括:
71、響應(yīng)于接收到直播配置請求,生成直播配置數(shù)據(jù);所述直播配置請求是直播配置頁面上的輔助直播入口被觸發(fā)后由終端發(fā)送的;
72、向所述終端發(fā)送所述直播配置數(shù)據(jù);其中,所述終端用于基于所述直播配置數(shù)據(jù)顯示多個基于人工智能的直播模式,不同的直播模式用于在直播過程中采用不同的輔助直播方式對所述目標直播事件進行直播;
73、響應(yīng)于任一個直播模式被選中,基于被選中的直播模式生成直播頁面,并向所述終端發(fā)送所述直播頁面。
74、在一些實施例中,所述方法還包括:
75、基于配置的直播時長確定直播過程中可展示的物品數(shù)量;
76、基于配置的物品類目和與第一主播對象相關(guān)的多維度數(shù)據(jù),生成第一候選物品列表;其中,所述第一主播對象用于對所述目標直播事件進行直播;所述多維度數(shù)據(jù)包括物品數(shù)據(jù)和對象數(shù)據(jù);
77、在確定的物品數(shù)量的約束下,在所述第一候選物品列表中篩選推薦值排在前預(yù)設(shè)數(shù)目位的物品,得到第二候選物品列表;其中,對于任一款物品,所述推薦值用于反映所述物品在所述第一主播對象的直播間內(nèi)展示的適配程度;
78、基于物品過濾規(guī)則,對所述第二候選物品列表中的物品進行過濾,得到物品推薦列表,向所述終端發(fā)送所述物品推薦列表。
79、在另一些實施例中,所述物品數(shù)據(jù)包括以下至少一項:
80、所述直播間內(nèi)歷史展示物品的資源轉(zhuǎn)移數(shù)據(jù);
81、所述歷史展示物品的屬性數(shù)據(jù);
82、第二主播對象的基于物品的資源轉(zhuǎn)移數(shù)據(jù);其中,所述第二主播對象為所述第一主播對象的同行主播、同規(guī)模主播或同風格主播;
83、所述對象數(shù)據(jù)包括以下至少一項:
84、所述歷史展示物品的資源轉(zhuǎn)移對象數(shù)據(jù);
85、所述第一主播對象的關(guān)注對象數(shù)據(jù);
86、與所述第二對象匹配的物品類目。
87、根據(jù)本公開實施例的第三方面,提供一種直播裝置,包括:
88、第一顯示模塊,被配置為在直播配置頁面上顯示輔助直播入口,所述直播配置頁面用于提供對目標直播事件的配置功能;
89、第二顯示模塊,被配置為響應(yīng)于對所述輔助直播入口的觸發(fā)操作,顯示多個基于人工智能的直播模式;其中,不同的直播模式用于在直播過程中采用不同的輔助直播方式對所述目標直播事件進行直播;
90、第三顯示模塊,被配置為響應(yīng)于對任一個直播模式的選中操作,在直播開始后,基于被選中的直播模式顯示直播頁面。
91、在一些實施例中,所述第二顯示模塊,被配置為:
92、顯示第一直播模式、第二直播模式或第三直播模式中的兩個或兩個以上;
93、其中,所述第一直播模式是指通過在所述直播頁面上顯示直播文案對第一主播對象進行輔助直播;所述第一主播對象用于對所述目標直播事件進行直播;
94、所述第二直播模式是指通過在直播間內(nèi)播放直播音頻對所述第一主播對象進行輔助直播;所述直播音頻是通過對所述直播文案進行文本轉(zhuǎn)語音得到的;
95、所述第三直播模式是指通過數(shù)字虛擬人在所述直播間內(nèi)對所述目標直播事件進行直播。
96、在另一些實施例中,所述裝置還包括:
97、第四顯示模塊,被配置為顯示至少一條歷史直播記錄;其中,所述歷史直播記錄用于描述歷史直播事件;
98、所述第四顯示模塊,還被配置為響應(yīng)于對第一歷史直播記錄的復(fù)用操作,基于所述第一歷史直播記錄中描述的歷史直播事件的配置數(shù)據(jù),顯示所述直播頁面;
99、所述第四顯示模塊,還被配置為響應(yīng)于對第二歷史直播記錄的編輯操作,基于所述第二歷史直播記錄中描述的歷史直播事件編輯后的配置數(shù)據(jù),顯示所述直播頁面。
100、在另一些實施例中,在選中所述第二直播模式的情況下,所述第三顯示模塊,被配置為在所述直播頁面上顯示提詞控件;響應(yīng)于對所述提詞控件的觸發(fā)操作,在所述直播頁面上顯示與當前直播進度相匹配的直播文案。
101、在另一些實施例中,所述第三顯示模塊,被配置為:
102、在當前直播進度指示所述第一主播對象正在進行物品講解的情況下,在所述直播頁面上顯示當前正在講解中的物品的講解文案;或,
103、在當前直播進度指示直播開始的情況下,在所述直播頁面上顯示直播開場文案;或,
104、在當前直播進度指示所述第一主播對象正在進行互動引導(dǎo)的情況下,在所述直播頁面上顯示互動引導(dǎo)文案;或,
105、在當前直播進度指示直播結(jié)束的情況下,在所述直播頁面上顯示直播結(jié)束文案。
106、在另一些實施例中,在選中所述第二直播模式的情況下,所述第三顯示模塊,被配置為在所述直播頁面上顯示音頻播放控件;響應(yīng)于對所述音頻播放控件的觸發(fā)操作,在所述直播頁面上顯示至少一條直播音頻的播放控件;響應(yīng)于對任一條直播音頻的播放控件的觸發(fā)操作,在所述直播間內(nèi)播放被選中的直播音頻。
107、在另一些實施例中,在選中所述第二直播模式的情況下,所述裝置還包括:
108、第五顯示模塊,被配置為顯示至少一個聲音選項;其中,不同的聲音選項用于提供具有不同聲學(xué)特征的樣本聲音;響應(yīng)于基于任一個聲音選項的聲音播放操作,播放被選中的樣本聲音;響應(yīng)于基于任一個聲音選項的聲音選用操作,基于被選中的樣本聲音的聲學(xué)特征,對所述直播文案進行文本轉(zhuǎn)語音,得到直播音頻。
109、在另一些實施例中,在選中所述第二直播模式的情況下,所述第五顯示模塊,還被配置為獲取輸入的樣本聲音;基于輸入的樣本聲音的聲學(xué)特征,對所述直播文案進行文本轉(zhuǎn)語音,得到直播音頻。
110、在另一些實施例中,所述直播音頻包括待展示物品的講解音頻、直播開場音頻、互動引導(dǎo)音頻或直播結(jié)束音頻中的至少一類;所述裝置還包括:
111、播放模塊,被配置為響應(yīng)于對生成的任一條直播音頻的試聽操作,播放所述直播音頻。
112、在另一些實施例中,在選中所述第一直播模式的情況下,所述第三顯示模塊,被配置為在所述直播頁面上顯示提詞控件;響應(yīng)于對所述提詞控件的觸發(fā)操作,在所述直播頁面上顯示與當前直播進度相匹配的直播文案。
113、在另一些實施例中,在選中所述第三直播模式的情況下,所述裝置還包括:
114、第六顯示模塊,被配置為顯示至少一個聲音選項和至少一個形象選項;其中,不同的聲音選項用于提供具有不同聲學(xué)特征的樣本聲音;不同的形象選項用于提供具有不同形象的數(shù)字虛擬人;響應(yīng)于對任一個聲音選項和任一個形象選項的選中操作,生成直播視頻;其中,所述直播視頻中包括用于播報所述直播文案的數(shù)字虛擬人,所述數(shù)字虛擬人與所述樣本聲音具有相同的聲學(xué)特征。
115、在另一些實施例中,所述裝置還包括:
116、第七顯示模塊,被配置為響應(yīng)于對任一個直播模式的選中操作,顯示配置選項;其中,所述配置選項用于指示配置直播時長、直播風格或直播間內(nèi)待展示的物品類目中的至少一項;基于配置的直播時長、直播風格或物品類目中的至少一項,顯示物品推薦列表;其中,所述物品推薦列表中的物品在直播開始后處于被展示狀態(tài)。
117、根據(jù)本公開實施例的第四方面,提供一種直播裝置,包括:
118、第一生成模塊,被配置為響應(yīng)于接收到直播配置請求,生成直播配置數(shù)據(jù);所述直播配置請求是直播配置頁面上的輔助直播入口被觸發(fā)后由終端發(fā)送的;
119、發(fā)送模塊,被配置為向所述終端發(fā)送所述直播配置數(shù)據(jù);其中,所述終端用于基于所述直播配置數(shù)據(jù)顯示多個基于人工智能的直播模式,不同的直播模式用于在直播過程中采用不同的輔助直播方式對所述目標直播事件進行直播;
120、第二生成模塊,被配置為響應(yīng)于任一個直播模式被選中,基于被選中的直播模式生成直播頁面;
121、所述發(fā)送模塊,還被配置為向所述終端發(fā)送所述直播頁面。
122、在一些實施例中,所述裝置還包括:
123、確定模塊,被配置為基于配置的直播時長確定直播過程中可展示的物品數(shù)量;
124、第三生成模塊,被配置為基于配置的物品類目和與第一主播對象相關(guān)的多維度數(shù)據(jù),生成第一候選物品列表;其中,所述第一主播對象用于對所述目標直播事件進行直播;所述多維度數(shù)據(jù)包括物品數(shù)據(jù)和對象數(shù)據(jù);
125、篩選模塊,被配置為在確定的物品數(shù)量的約束下,在所述第一候選物品列表中篩選推薦值排在前預(yù)設(shè)數(shù)目位的物品,得到第二候選物品列表;其中,對于任一款物品,所述推薦值用于反映所述物品在所述第一主播對象的直播間內(nèi)展示的適配程度;
126、過濾模塊,被配置為基于物品過濾規(guī)則,對所述第二候選物品列表中的物品進行過濾,得到物品推薦列表;
127、所述發(fā)送模塊,還被配置為向所述終端發(fā)送所述物品推薦列表。
128、在另一些實施例中,所述物品數(shù)據(jù)包括以下至少一項:
129、所述直播間內(nèi)歷史展示物品的資源轉(zhuǎn)移數(shù)據(jù);
130、所述歷史展示物品的屬性數(shù)據(jù);
131、第二主播對象的基于物品的資源轉(zhuǎn)移數(shù)據(jù);其中,所述第二主播對象為所述第一主播對象的同行主播、同規(guī)模主播或同風格主播;
132、所述對象數(shù)據(jù)包括以下至少一項:
133、所述歷史展示物品的資源轉(zhuǎn)移對象數(shù)據(jù);
134、所述第一主播對象的關(guān)注對象數(shù)據(jù);
135、與所述第二對象匹配的物品類目。
136、根據(jù)本公開實施例的第五方面,提供一種電子設(shè)備,該電子設(shè)備包括:
137、一個或多個處理器;
138、用于存儲該處理器可執(zhí)行程序代碼的存儲器;
139、其中,該處理器被配置為執(zhí)行該程序代碼,以實現(xiàn)上述的直播方法。
140、根據(jù)本公開實施例的第六方面,提供一種計算機可讀存儲介質(zhì),在該計算機可讀存儲介質(zhì)中的程序代碼由電子設(shè)備的處理器執(zhí)行的情況下,使得電子設(shè)備能夠執(zhí)行上述的直播方法。
141、根據(jù)本公開實施例的第七方面,提供了一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被電子設(shè)備的處理器執(zhí)行時實現(xiàn)上述的直播方法。
142、本公開實施例實現(xiàn)了通過提供多種直播模式來輔助主播對象開播。詳細來說,在直播準備階段,主播對象通過觸發(fā)一個操作入口,即可查看多種直播模式。這使得主播對象可以在這些直播模式中隨意選擇適合自己的直播模式。另外,不同的直播模式用于在直播過程中采用不同的輔助直播方式進行直播,這不但能夠滿足不同主播對象的需求,而且由于實現(xiàn)了智能化且多樣化的輔助直播,因為大大降低了直播成本和直播難度。另外,輔助直播功能的出現(xiàn)也確保了直播內(nèi)容質(zhì)量。
143、應(yīng)當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本公開。