所屬的技術人員能夠理解,本技術的各個方面可以實現為系統、方法或程序產品。因此,本技術的各個方面可以具體實現為以下形式,即:完全的硬件實施方式、完全的軟件實施方式(包括固件、微代碼等),或硬件和軟件方面結合的實施方式,這里可以統稱為“電路”、“模塊”或“系統”。在介紹了本技術示例性實施方式的多媒體數據召回方法和裝置之后,接下來,介紹根據本技術的另一示例性實施方式的用于多媒體數據召回的電子設備。與本技術上述方法實施例基于同一發明構思,本技術實施例中還提供了一種電子設備,該電子設備可以是服務器。在該實施例中,電子設備的結構可以如圖13所示,包括存儲器1301,以及一個或多個處理器1302。存儲器1301,用于存儲處理器1302執行的計算機程序。存儲器1301可主要包括存儲程序區和存儲數據區,其中,存儲程序區可存儲操作系統,以及運行即時通訊功能所需的程序等;存儲數據區可存儲各種即時通訊信息和操作指令集等。存儲器1301可以是易失性存儲器(volatile?memory),例如隨機存取存儲器(random-access?memory,ram);存儲器1301也可以是非易失性存儲器(non-volatilememory),例如只讀存儲器,快閃存儲器(flash?memory),硬盤(hard?disk?drive,hdd)或固態硬盤(solid-state?drive,ssd);或者存儲器1301是能夠用于攜帶或存儲具有指令或數據結構形式的期望的計算機程序并能夠由計算機存取的任何其他介質,但不限于此。存儲器1301可以是上述存儲器的組合。處理器1302,可以包括一個或多個中央處理單元(central?processing?unit,cpu)或者為數字處理單元等等。處理器1302,用于調用存儲器1301中存儲的計算機程序時實現上述多媒體數據召回方法。本技術實施例中不限定上述存儲器1301和處理器1302之間的具體連接介質。本技術實施例在圖13中以存儲器1301和處理器1302之間通過總線1303連接,總線1303在圖13中以粗線描述,其它部件之間的連接方式,僅是進行示意性說明,并不引以為限??偩€1303可以分為地址總線、數據總線、控制總線等。為便于描述,圖13中僅用一條粗線描述,但并不描述僅有一根總線或一種類型的總線。存儲器1301中存儲有計算機存儲介質,計算機存儲介質中存儲有計算機可執行指令,計算機可執行指令用于實現本技術實施例的多媒體數據召回方法。處理器1302用于執行上述的多媒體數據召回方法。在一些可能的實施方式中,本技術提供的多媒體數據召回方法的各個方面還可以實現為一種程序產品的形式,其包括計算機程序,當程序產品在電子設備上運行時,計算機程序用于使電子設備執行本說明書上述描述的根據本技術各種示例性實施方式的多媒體數據召回方法中的步驟。程序產品可以采用一個或多個可讀介質的任意組合??勺x介質可以是可讀信號介質或者可讀存儲介質??勺x存儲介質例如可以是但不限于電、磁、光、電磁、紅外線、或半導體的系統、裝置或器件,或者任意以上的組合??勺x存儲介質的更具體的例子(非窮舉的列表)包括:具有一個或多個導線的電連接、便攜式盤、硬盤、隨機存取存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或閃存)、光纖、便攜式緊湊盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。本技術的實施方式的程序產品可以采用便攜式緊湊盤只讀存儲器(cd-rom)并包括計算機程序,并可以在計算裝置上運行。然而,本技術的程序產品不限于此,在本文件中,可讀存儲介質可以是任何包含或存儲程序的有形介質,該程序可以被命令執行系統、裝置或者器件使用或者與其結合使用。可讀信號介質可以包括在基帶中或者作為載波一部分傳播的數據信號,其中承載了可讀計算機程序。這種傳播的數據信號可以采用多種形式,包括但不限于電磁信號、光信號或上述的任意合適的組合??勺x信號介質還可以是可讀存儲介質以外的任何可讀介質,該可讀介質可以發送、傳播或者傳輸用于由命令執行系統、裝置或者器件使用或者與其結合使用的程序??勺x介質上包含的計算機程序可以用任何適當的介質傳輸,包括但不限于無線、有線、光纜、rf等等,或者上述的任意合適的組合。應當注意,盡管在上文詳細描述中提及了裝置的若干單元或子單元,但是這種劃分僅僅是示例性的并非強制性的。實際上,根據本技術的實施方式,上文描述的兩個或更多單元的特征和功能可以在一個單元中具體化。反之,上文描述的一個單元的特征和功能可以進一步劃分為由多個單元來具體化。此外,盡管在附圖中以特定順序描述了本技術方法的操作,但是,這并非要求或者暗示必須按照該特定順序來執行這些操作,或是必須執行全部所示的操作才能實現期望的結果。附加地或備選地,可以省略某些步驟,將多個步驟合并為一個步驟執行,和/或將一個步驟分解為多個步驟執行。本領域內的技術人員應明白,本技術的實施例可提供為方法、系統、或計算機程序產品。因此,本技術可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本技術可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器、cd-rom、光學存儲器等)上實施的計算機程序產品的形式。本技術是參照根據本技術的方法、設備(系統)、和計算機程序產品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上,使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。顯然,本領域的技術人員可以對本技術進行各種改動和變型而不脫離本技術的精神和范圍。這樣,倘若本技術的這些修改和變型屬于本技術權利要求及其等同技術的范圍之內,則本技術也意圖包含這些改動和變型在內。
背景技術:
1、隨著互聯網的發展,網絡平臺為目標對象提供了越來越多的便利,目標對象可以通過互聯網進行交易或瀏覽等。為了增加曝光率,需要在網絡上投放多媒體數據。
2、由于目標對象的需求或興趣不同,不同的目標對象對于多媒體數據的需求也不同。針對不同的目標對象,通常需要推送不同種類的多媒體數據,因此在向目標對象投放多媒體數據之前,需要確定被投放的多媒體數據,即召回多媒體數據。換言之,對于不同的目標對象,需要召回不同的多媒體數據。
3、在多媒體數據行業中,每個多媒體數據對應一個信息標識(identity?document,id)。當多媒體數據被目標對象點擊時,多媒體數據和目標對象之間的交互記錄可以與多媒體數據的信息id建立關聯關系。目前,每天都有大量的新多媒體數據被創建。由于創建的新多媒體數據沒有被目標對象點擊過,因此創建的新多媒體數據的細粒度特征(如,信息id)缺少與之關聯的多媒體數據和目標對象之間的交互記錄。
4、在投放創建的新的多媒體數據的初始階段,由于新的多媒體數據的信息id沒有關聯的交互記錄,因此認為該多媒體數據處在冷啟動階段。當多媒體數據被目標對象點擊設定次數后,多媒體數據的信息id關聯有一定程度的多媒體數據和目標對象之間的交互記錄,此時可以認為該多媒體數據度過冷啟動階段。對于度過冷啟動階段的多媒體數據而言,由于信息id與交互記錄存在關聯關系,針對不同的目標對象,其交互記錄對于確定召回的多媒體數據至關重要。因此,在召回階段,信息id往往是最為重要的特征之一。
5、目前召回方案中,有對多媒體數據的信息標識屏蔽(id?masking)和對比學習方案,該方案可能存在對于信息id過度削弱的問題,即在確定召回的多媒體數據時不再參考多媒體數據的信息id。過度削弱多媒體數據的信息id,會使得被點擊過的多媒體數據和創建的新的多媒體數據一樣,缺少與目標對象之間的交互記錄,從而影響到度過冷啟動期的多媒體數據的召回效果。
技術實現思路
1、本技術實施例提供了一種多媒體數據召回方法、裝置、設備及存儲介質,用以在不影響度過冷啟動期的多媒體數據召回的情況下,提升處于冷啟動階段的多媒體數據的召回效果。
2、第一方面,本技術實施例提供了一種多媒體數據召回方法,包括:
3、獲取目標對象的對象描述數據;
4、采用已訓練的目標預測模型中的對象特征提取網絡,基于所述對象描述數據,獲得對應的對象特征;
5、采用所述目標預測模型中的數據特征提取網絡,針對各候選多媒體數據,分別通過基于點擊頻次得到的加權參數,對基于標識信息和屬性信息得到的相應的綜合特征,以及基于所述屬性信息得到的相應的屬性特征進行加權融合,得到相應的多媒體數據特征;其中,所述候選多媒體數據包括所述點擊頻次、所述標識信息和所述屬性信息;
6、根據所述對象特征與各多媒體數據特征之間的特征相似情況,在所述各候選多媒體數據中,確定針對所述目標對象召回的至少一個目標多媒體數據。
7、第二方面,本技術實施例提供了一種多媒體數據召回裝置,包括:
8、第一獲取單元,用于獲取目標對象的對象描述數據;
9、第二獲取單元,用于采用已訓練的目標預測模型中的對象特征提取網絡,針對各候選多媒體數據,分別通過基于點擊頻次得到的加權參數,對基于標識信息和屬性信息得到的相應的綜合特征,以及基于所述屬性信息得到的相應的屬性特征進行加權融合,得到相應的多媒體數據特征;其中,所述候選多媒體數據包括所述點擊頻次、所述標識信息和所述屬性信息;
10、確定單元,用于根據所述對象特征與各多媒體數據特征之間的特征相似情況,在所述各候選多媒體數據中,確定針對所述目標對象召回的至少一個目標多媒體數據。
11、一種可能的實現方式中,所述確定單元,還用于采用如下方式訓練得到所述目標預測模型:獲取訓練樣本集;一個訓練樣本包括:一個樣本對象的對象描述數據,一個樣本多媒體數據的樣本數據集,以及所述一個樣本對象對于所述一個樣本多媒體數據的操作標簽;所述樣本數據集中包括標識信息、屬性信息和點擊頻次;采用所述訓練樣本集,對構建的初始預測模型進行多輪迭代訓練,得到訓練后的目標預測模型,其中,在一輪迭代過程中,執行以下操作:
12、采用所述初始預測模型,基于讀取的訓練樣本中的對象描述數據,得到對象特征,并基于對應的樣本數據集,得到由綜合特征和屬性特征加權得到的多媒體數據特征,以及基于所述對象特征和所述多媒體數據特征,輸出預測結果;
13、基于所述預測結果和對應的操作標簽之間的結果差異,調整模型參數。
14、一種可能的實現方式中,所述初始預測模型包括:對象特征提取網絡、全局預測網絡,以及由綜合特征提取子網絡、屬性特征提取子網絡和門控子網絡組成的數據特征提取網絡;所述確定單元,基于對應的樣本數據集,得到由綜合特征和屬性特征加權得到的多媒體數據特征時,具體用于:
15、基于所述樣本數據集中的標識信息、屬性信息,以及點擊頻次,分別進行信息嵌入處理,得到對應的標識嵌入結果、屬性嵌入結果,以及頻次嵌入結果;
16、采用所述綜合特征提取子網絡,基于所述標識嵌入結果和所述屬性嵌入結果,得到對應的綜合特征,并采用所述屬性特征提取子網絡,基于所述屬性嵌入結果,得到對應的屬性特征,以及采用所述門控子網絡,基于所述頻次嵌入結果,得到加權參數;
17、根據所述加權參數對所述綜合特征和所述屬性特征進行加權融合,得到對應的多媒體數據特征。
18、一種可能的實現方式中,所述初始預測模型包括:對象特征提取網絡、全局預測網絡,以及由綜合特征提取子網絡、屬性特征提取子網絡和門控子網絡組成的數據特征提取網絡,與所述綜合特征提取子網絡連接的綜合預測子網絡、與所述屬性特征提取子網絡連接的屬性預測子網絡;
19、所述確定單元,基于所述對象特征和所述多媒體數據特征,輸出預測結果時,具體用于:
20、采用所述綜合預測子網絡,基于所述綜合特征和所述對象特征,得到所述樣本對象對于所述樣本多媒體數據的第一操作預測結果;
21、采用所述屬性預測子網絡,基于所述屬性特征和所述對象特征,得到所述樣本對象對于所述樣本多媒體數據的第二操作預測結果;
22、采用所述全局預測網絡,基于所述多媒體特征和所述對象特征,得到所述樣本對象對于所述樣本多媒體數據的第三操作預測結果。
23、一種可能的實現方式中,所述確定單元,基于所述預測結果和對應的操作標簽之間的結果差異,調整模型參數時,具體用于:
24、基于所述第一操作預測結果和對應的操作標簽之間的第一結果差異,計算第一損失值,并基于所述第二操作預測結果和對應的操作標簽之間的第二結果差異,計算第二損失值,以及基于所述第三操作預測結果和對應的操作標簽之間的第三結果差異,計算第三損失值;
25、根據所述第一損失值、所述第二損失值和所述第三損失值,調整模型參數。
26、一種可能的實現方式中,所述確定單元,基于所述預測結果和對應的操作標簽之間的結果差異,調整模型參數時,具體用于:
27、基于所述第一操作預測結果和對應的操作標簽之間的第一結果差異,計算第一損失值,并基于所述第二操作預測結果和對應的操作標簽之間的第二結果差異,計算第二損失值;
28、在確定所述第一損失值不高于所述第二損失值,則基于所述第一操作預測結果和所述第二操作預測結果之間的結果差異,計算蒸餾損失;
29、基于由所述第三操作預測結果和對應的操作標簽之間的第三結果差異,計算得到的第三損失值,以及所述蒸餾損失,調整模型參數。
30、一種可能的實現方式中,所述確定單元,還用于采用如下方式構建訓練樣本集:獲取記錄有各業務對象各自操作的多媒體數據的歷史操作數據集;
31、在所述各業務對象中選定各樣本對象,并依據所述歷史操作數據集,統計各多媒體數據各自對應的點擊頻次,以及針對所述各樣本對象分別選定對應的各樣本多媒體數據;針對每個樣本對象,執行以下操作:將所述樣本對象分別與對應的各樣本多媒體數據進行組合,得到相應的各訓練樣本;一條訓練樣本包括:一個樣本對象的對象描述數據、一個樣本多媒體數據的點擊頻次、標識信息和屬性信息,以及根據所述樣本對象對于所述一個多媒體數據的操作情況確定的操作標簽。
32、一種可能的實現方式中,所述第二確定單元,在獲取目標對象的對象描述數據之后,還用于:
33、按照所述目標對象的對象描述數據,確定與所述目標對象匹配的候選多媒體數據范圍;
34、在所述候選多媒體數據范圍中,根據所述目標對象歷史操作的多媒體數據的內容類型,選定所述目標對象對應的各候選多媒體數據。
35、第三方面,本技術實施例提供一種電子設備,包括:存儲器和處理器,其中,存儲器,用于存儲計算機指令;處理器,用于執行計算機指令以實現本技術實施例提供的多媒體數據召回方法的步驟。
36、第四方面,本技術實施例提供一種計算機可讀存儲介質,計算機可讀存儲介質存儲有計算機指令,計算機指令被處理器執行時實現本技術實施例提供的多媒體數據召回方法的步驟。
37、第五方面,本技術實施例提供一種計算機程序產品,其包括計算機指令,計算機指令存儲在計算機可讀存儲介質中;當電子設備的處理器從計算機可讀存儲介質讀取計算機指令時,處理器執行計算機指令,使得電子設備執行本技術實施例提供的多媒體數據召回方法的步驟。
38、本技術有益效果如下:
39、本技術實施例提供了一種多媒體數據召回方法、裝置、設備及存儲介質,在本技術實施例中,首先獲取目標對象的對象描述數據,采用已訓練的目標預測模型中的對象特征提取網絡,基于對象描述數據,獲得對應的對象特征;然后獲取采用目標預測模型中的數據特征提取網絡,基于各候選多媒體數據各自對應的候選多媒體數據的標識信息、屬性信息,以及點擊頻次,分別輸出的多媒體數據特征;最后根據所述對象特征與各多媒體數據特征之間的特征相似情況,在所述各候選多媒體數據中,確定針對所述目標對象召回的至少一個目標多媒體數據。其中,數據特征提取網絡中包括:綜合特征提取子網絡、屬性特征提取子網絡,及門控子網絡;門控子網絡用于根據一個候選多媒體數據的點擊頻次,輸出一個候選多媒體數據的綜合特征和屬性特征之間的加權參數。本技術中,在目標預測模型的訓練過程中,通過多媒體數據的點擊頻次確定多媒體數據的綜合特征和屬性特征之間的加權參數,進而根據多媒體數據的點擊頻次確定標識信息對于多媒體數據的重要情況。因此,通過各多媒體數據的標識信息、屬性信息,以及點擊頻次,基于已訓練的目標預測模型確定各多媒體數據特征,并且基于已訓練的目標預測模型確定對象特征,以通過各多媒體數據特征和對象特征確定各多媒體數據的點擊概率,進而確定針對目標對象召回的目標多媒體數據。通過上述方式,可以在不影響度過冷啟動期的多媒體數據召回的情況下,通過點擊頻次確定標識信息對于多媒體數據的重要程度,進而可以提升處于冷啟動階段的多媒體數據的召回效果。
40、本技術的其它特征和優點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本技術而了解。本技術的目的和其他優點可通過在所寫的說明書、權利要求書、以及附圖中所特別指出的結構來實現和獲得。