1.一種點擊率預估中基于元學習的雙層優化方法,其特征在于,包括:
2.根據權利要求1所述的點擊率預估中基于元學習的雙層優化方法,其特征在于,步驟s1中所述點擊率預估模型由1個嵌入模型和1個分類器組成,其中,表示模型的輸入,和分別表示嵌入模型和分類器的參數;對于給定用戶與物品的交互特征,嵌入模型先將交互特征映射為向量表示,然后分類器將向量表示映射為用戶對該物品的點擊概率。
3.根據權利要求2所述的點擊率預估中基于元學習的雙層優化方法,其特征在于,步驟s1中嵌入模型將第t個時間步的數據映射為向量表示,具體計算式為:
4.根據權利要求1所述的點擊率預估中基于元學習的雙層優化方法,其特征在于,步驟s2中所述特征學習器為基于注意力機制構建的模型;特征學習器以歷史時刻的向量表示作為輸入,以下一時刻的向量表示作為輸出,該輸出即為特征學習器對未來向量表示的預測;
5.根據權利要求1所述的點擊率預估中基于元學習的雙層優化方法,其特征在于,步驟s3中內循環損失值的計算式為:;
6.根據權利要求5所述的點擊率預估中基于元學習的雙層優化方法,其特征在于,步驟s4中基于獲得的內循環損失值,使用梯度下降方法優化點擊率預估模型中的分類器時,分類器參數更新表示為:
7.根據權利要求1所述的點擊率預估中基于元學習的雙層優化方法,其特征在于,步驟s5中外循環損失值的計算式為:
8.根據權利要求7所述的點擊率預估中基于元學習的雙層優化方法,其特征在于,步驟s6中基于獲得的外循環損失值,使用梯度下降方法優化點擊率預估模型中的分類器時,分類器參數更新表示為:
9.一種非暫態計算機可讀存儲介質,其特征在于,其上存儲有計算機指令,該計算機指令使計算機執行權利要求1-8任意一項所述的點擊率預估中基于元學習的雙層優化方法。
10.一種電子設備,其特征在于,包括:處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信,處理器調用存儲器中的邏輯指令,以執行權利要求1-8任意一項所述的點擊率預估中基于元學習的雙層優化方法。