本發(fā)明涉及推薦領域,尤其涉及一種自適應的解纏對比推薦方法。
背景技術:
1、推薦系統(tǒng)能有效緩解數(shù)據(jù)過載,在人們的日常生活中起著不可或缺的作用。其主要是通過學習用戶和項目的歷史交互實現(xiàn)對用戶的個性化精準推薦。基于圖神經(jīng)網(wǎng)絡(gnns)的協(xié)同過濾推薦是現(xiàn)有的主流辦法之一。例如:pinsage、ngcf、lightgcn、和lr-gccf。它主要是利用迭代的聚合鄰域節(jié)點的特征,學習目標節(jié)點特征的傳播機制,為圖神經(jīng)協(xié)同過濾方法提供了先進的推薦性能。
2、然而,用戶和項目的交互數(shù)據(jù),作為監(jiān)督推薦模型的關鍵標簽,在現(xiàn)實中往往呈現(xiàn)高度稀疏性,致使模型難以充分利用有限的標簽信息進行有效訓練。對比學習作為一種自監(jiān)督學習方法,在訓練過程中通過比較正樣本之間的相似性和負樣本的差異性來學習有效的表示,為此,最近的研究開始將圖神經(jīng)網(wǎng)絡和對比學習的力量結合起來,以探索未標記的信息為模型提供自我監(jiān)督信號。遵循互信息的最大化原則使正對的保持一致性而負對具有差異性,圖對比學習通過構建用戶和項目的交互圖子圖,從不同視角強化用戶和項目表示,在解決監(jiān)督標簽短缺問題上表現(xiàn)出了強大的性能。例如:xsimgcl、lightgcl、adamcl、autocf。
3、盡管這些辦法在推薦領域已經(jīng)展現(xiàn)出了優(yōu)秀的性能,仍然有兩個關鍵問題亟待解決:
4、(1)傳統(tǒng)的基于圖神經(jīng)網(wǎng)絡的協(xié)同過濾模型隨著堆疊層數(shù)的增加,鄰域感受野的快速擴張會使每個節(jié)點與越來越多的鄰居進行信息交流,用戶、項目的節(jié)點信息會被傳播到大量距離較遠的節(jié)點,使節(jié)點的嵌入變得過于相似,難以區(qū)分不同用戶和項目的特征,且這一過程中難以避免在節(jié)點表征中引入不相關的遠距離節(jié)點信息,影響節(jié)點表示質(zhì)量從而導致性能下降。目前大多數(shù)基于圖神經(jīng)網(wǎng)絡的推薦系統(tǒng)都存在這樣的問題。為此,緩解過平滑、改進用戶-項目交互圖的建模方法,以獲取具有高區(qū)分度和高質(zhì)量的節(jié)點表示,是這一方向亟待攻克的關鍵問題之一。
5、(2)用戶與項目交互背后存在高度復雜的潛在因素,這些因素因用戶偏好的多樣性而相互糾纏,以統(tǒng)一的意圖來建模用戶的偏好很難捕捉到用戶和項目交互之間更細粒度的表示,從而導致次優(yōu)用戶表征。在實際生活中,用戶和項目的交互往往由許多意圖因素共同驅(qū)動,例如購買包或是工作需求或被其款式所吸引;看電影是為打發(fā)時間或喜歡某演員,顯然不同的意圖對于激發(fā)用戶行為具有不同的貢獻。然而,現(xiàn)有的基于圖對比學習的推薦方法將學習到的用戶偏好使用固定的編碼表征,未能實現(xiàn)捕捉用戶與項目之間更細致的交互模式,這阻礙了捕獲用戶的真實興趣以及提供準確的意圖感知自我監(jiān)督的能力。為此,需設計出一種新的推薦方法,通過去糾纏的對比信號來實現(xiàn)信息增強,進一步提升推薦性能。
技術實現(xiàn)思路
1、本發(fā)明旨在至少解決現(xiàn)有技術中存在的技術問題,特別創(chuàng)新地提出了一種自適應的解纏對比推薦方法。
2、為了實現(xiàn)本發(fā)明的上述目的,本發(fā)明提供了一種自適應的解纏對比推薦方法,其特征在于,包括以下步驟:
3、s1,對用戶-項目交互圖進行鄰域聚合:分別聚合用戶和項目中心節(jié)點的鄰居節(jié)點信息,得到用戶的嵌入表征和項目的嵌入表征
4、s2,對用戶、項目的潛在向量空間進行意圖解纏:令用戶和項目分別具有k1、k2個不同的意圖,分別用潛在意圖cu和cv表示,然后分別對用戶、項目的潛在意圖進行意圖解纏,并將用戶解纏后的意圖項目解纏后的意圖通過多意圖編碼器分別編碼保留在和中,所述編碼器為lightgcn;此時,預測目標為:
5、
6、其中,表示經(jīng)過編碼器后,用戶的意圖編碼表示;
7、表示經(jīng)過編碼器后,項目的意圖編碼表示;編碼器為lightgcn;
8、cu、cv分別表示用戶和項目的意圖;
9、⊙為點積運算;
10、f(·)表示編碼意圖上的預測函數(shù);
11、s3,掩碼子圖生成:利用用戶-項目交互矩陣與意圖向量t進行余弦相似度生成的掩碼子圖得到關系矩陣由此生成了具有設計了一個參數(shù)化的邊緣掩碼生成器進行數(shù)據(jù)增強;
12、s4,使用邊緣掩碼生成器生成具有自適應增強的局部協(xié)作視圖和全局協(xié)作視圖,以及解耦的全局協(xié)作視圖t(u)和全局信息補全圖i(u);
13、s5,利用注意力機制對聚合完成之后的增強表示分配權重,得到最后的用戶和項目表示e(u)和e(v),然后對所述e(u)和e(v)進行點積得到最終的預測得分y,將得分最高的項目推薦給用戶。
14、
15、式中,表示用戶的嵌入表征和項目的嵌入表征,即s1得到的用戶嵌入表征和項目嵌入表征的卷積層表達;
16、分別表示用戶的局部級別和全局級別的增強表示,即為兩個增強表示的視圖;通過公式(14)計算獲得,此時公式(14)的為公式(6)計算得到;通過公式(14)計算獲得,此時公式(14)的為公式(9)計算得到;
17、分別表示項目的局部級別和全局級別的增強表示,即為兩個增強表示的視圖;通過公式(14)計算獲得,此時公式(14)的為公式(6)計算得到;通過公式(14)計算獲得,此時公式(14)的為公式(9)計算得到;
18、分別表示用戶和項目的意圖表征嵌入表示,即為用戶、項目解纏后的意圖;
19、
20、其中,e(u)、e(v)分別表示最終的用戶和項目的嵌入表征向量;
21、attweight是注意力機制學習到的權重分配函數(shù);
22、δ(l)代表分配給第l圖層的注意力權重;
23、分別表示第l層圖神經(jīng)網(wǎng)絡時用戶和項目的嵌入表征向量;
24、由此計算出用戶和項目的偏好得分為:
25、
26、其中,分別表示用戶ui和項目vj的嵌入表示;
27、t為轉(zhuǎn)置符號;
28、yi,j表示用戶i和項目j的交互得分;
29、y表示用戶i和項目j的最終交互得分;
30、e(u)表示用戶i和項目j的最終嵌入表示。
31、優(yōu)選地,所述對用戶-項目交互圖進行鄰域聚合包括:
32、
33、其中,σ(·)表示leakyrelu激活函數(shù);
34、分別代表從中心節(jié)點ui和vj的鄰居節(jié)點聚合得到的嵌入表征;
35、分別表示用戶-項目交互矩陣中的第i行和交互矩陣中的第j列;
36、e(u)、e(v)分別表示用戶、項目的初始化嵌入表征;對用戶和項目使用xavier函數(shù)得到的初始化結果。
37、優(yōu)選地,是由用戶-項目交互矩陣推導出的歸一化相鄰矩陣:
38、
39、式中的和分別代表用戶和項目的對角度矩陣;
40、表示用戶-項目的交互矩陣;
41、和分別代表用戶ui和項目vj的鄰居節(jié)點集合的個數(shù);
42、||表示進行歸一化操作;
43、表示用戶項目交互圖的鄰接矩陣中的第i行第j列的元素。
44、優(yōu)選地,利用用戶-項目交互矩陣與使用意圖向量t進行余弦相似度生成的掩碼子圖得到關系矩陣包括:
45、
46、其中,表示用戶-項目的交互矩陣;
47、代表一個關系矩陣;
48、代表掩碼子圖,求解公式如下:
49、
50、其中,表示代表掩碼子圖中的每一個值;
51、
52、||||2表示二范數(shù);
53、為的轉(zhuǎn)置;
54、分別表示用戶和項目的解纏表示。
55、公式(11)、(12)表示了邊緣掩碼生成器。
56、優(yōu)選地,對關系矩陣采用可學習數(shù)據(jù)增強,提升計算效率:
57、使用節(jié)點的度對關系矩陣進行歸一化操作,表示為:
58、
59、其中,表示進行歸一化操作之后關系矩陣第i行第j列的元素值;
60、表示關系矩陣第i行第j列的元素;
61、u表示用戶的大小;
62、i表示項目的大小;
63、t為轉(zhuǎn)置符號。
64、優(yōu)選地,s4,生成具有自適應增強的局部協(xié)作視圖和全局協(xié)作視圖,包括:
65、首先,將歸一化學習關系矩陣應用于節(jié)點消息以實現(xiàn)可學習的消息傳播,通過擾動圖結構來生成具有自適應增強的對比學習視圖,這種具有自適應掩碼的增強表示為:
66、
67、其中,分別表示在對l層的表征嵌入向量進行圖擾動操作;
68、分別表示用戶和項目在l層的圖神經(jīng)網(wǎng)絡遍歷得到的表征嵌入向量;
69、表示進行歸一化操作之后得到的關系矩陣,
70、公式(14)中的通過以下公式(6)求得,從而得到用戶和項目的局部級別的增強表示
71、
72、其中,分別表示ui和vj在l層的圖神經(jīng)網(wǎng)絡遍歷得到的表征嵌入向量;
73、表示用戶與其鄰接目標節(jié)點的聚合信息經(jīng)過l-1層的圖神經(jīng)網(wǎng)絡得到的表征嵌入向量;
74、表示項目與其鄰接目標節(jié)點的聚合信息經(jīng)過l-1層的圖神經(jīng)網(wǎng)絡得到的表征嵌入向量;
75、公式(14)中的通過以下公式(9)求得,從而得到用戶和項目的全局級別的增強表示
76、
77、式中,分別表示ui和vj在l層的圖神經(jīng)網(wǎng)絡遍歷得到的表征嵌入向量;
78、分別表示前l(fā)-1層從中心節(jié)點ui和vj的鄰居節(jié)點聚合得到的嵌入表示;
79、和分別代表經(jīng)過圖神經(jīng)網(wǎng)絡的前l(fā)-1層圖層堆疊之后的用戶和項目的意圖感知表示,分別表示經(jīng)過l-1層的圖神經(jīng)網(wǎng)絡得到的用戶和項目的解纏表示。
80、優(yōu)選地,通過下列公式求得:
81、
82、其中,分別表示用戶和項目的解纏表示;
83、表示在第l層圖神經(jīng)網(wǎng)絡時,經(jīng)過編碼器后,在意圖cu下,用戶的表征嵌入向量;表示表示在第l層圖神經(jīng)網(wǎng)絡時,經(jīng)過編碼器后,在意圖cv下,項目的表征嵌入向量;
84、cu、cv分別表示用戶、意圖表征向量;
85、分別表示對應第i個用戶、意圖表征向量;
86、和代表在第l層用戶和項目的表征向量;
87、代表用戶ui和每一個意圖原型cu的相關性;
88、表示代表用戶vj和每一個意圖原型cv的相關性;
89、優(yōu)選地,相關性sk使用意圖相關性分數(shù)計算得到,用式(8)推導計算:
90、
91、其中,表示第l層用戶和項目的嵌入表征向量;
92、為的轉(zhuǎn)置;
93、表示在第l-1層用戶的嵌入表征向量;
94、均表示用戶第i個、第i′個意圖的表征向量,其中i′代表索引,即包含了遍歷操作;
95、為的轉(zhuǎn)置;
96、表示在第l-1層項目的嵌入表征向量;
97、分別表示項目第i個、第i′個意圖的表征向量,其中i′代表索引,即包含了遍歷操作。
98、由此可得每個意圖k的相關性分數(shù)在各個圖層上執(zhí)行嵌入傳播時使對用戶意圖k有影響的信息被編碼到表示中。
99、優(yōu)選地,所述權重通過下列公式求得:
100、
101、式中,δ(l)代表分配給第l圖層的注意力權重;
102、l表示圖卷積網(wǎng)絡的層數(shù);
103、⊙為點積運算;
104、e(l)、e(l′)均表示第l層、第l′層圖神經(jīng)網(wǎng)絡的特征向量;
105、watt是用于注意力計算的參數(shù),注意力機制可以學習不同的權值用于圖神經(jīng)網(wǎng)絡層以優(yōu)化損失函數(shù),有效地緩解過平滑問題。
106、優(yōu)選地,在訓練時使用的負樣本是通過評級函數(shù)得到的:
107、
108、其中,rm表示候選負樣本im的評級值;
109、|?|為絕對值符號;
110、表示用戶u嵌入表示的轉(zhuǎn)置;
111、表示候選負樣本的嵌入表示;
112、表示正樣本的嵌入表示;
113、α,β,p是預定義的超參數(shù);
114、對所有候選負樣本進行評級計算后,得到一個評級集合在中依次選擇rm值最小的候選負樣本im作為最終確定的負樣本。
115、綜上所述,由于采用了上述技術方案,本發(fā)明為使用戶-項目的信息傳播不受限于局部等級,從全局層面定義了k個具有全局語義信息的意圖(用戶和項目分別具有k1、k2個不同的意圖);為解決以往大多數(shù)解糾纏推薦方法從以完全監(jiān)督的方式進行,設計了一個可學習的自適應對比增強器,這種設計在緩解噪聲問題的同時也有效的緩解了數(shù)據(jù)稀疏性;針對圖神經(jīng)網(wǎng)絡都具有過平滑問題的共同局限性,采用了層注意力機制有效的緩解此問題;此外,為實現(xiàn)針對正樣本的預測分數(shù)自適應的選擇具有對應硬度的負樣本,進行了兩輪采樣策略,從而增強了adadcl方法的準確性和可解釋性。
116、具體的有益效果是:
117、(1)通過應用圖對比學習技術,增強了用戶-項目交互數(shù)據(jù)的細化,將具有全局等級的意圖感知信息融入到了協(xié)作過濾框架中,利用層注意力機制為每層分配注意力權重,穩(wěn)定了深層的gnn訓練,并采用了雙重負采樣策略來優(yōu)化模型學習過程。
118、(2)提出了一個新的adadcl推薦方法,使用參數(shù)化掩碼生成器實現(xiàn)了自適應的具有全局語義增強的圖神經(jīng)網(wǎng)絡架構,引入的跨視圖對比學習任務從多角度進行表示增強,設計的負采樣評級函數(shù)能針對正樣本自適應的選擇合適的負樣本硬度,提高了模型的魯棒性和泛化性。
119、本發(fā)明的附加方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。