本申請涉及生成式推薦,具體的說是基于大語言模型的隱空間解碼生成式推薦方法及系統。
背景技術:
1、由于大語言模型(llm)具有強大的能力,目前研究者們致力于將其應用于推薦系統中,從而產生了當下最流行的基于大語言模型的推薦范式。與傳統推薦不同,該范式在?"語言空間?"中重新設計了推薦系統,即在?"語言空間?"中,任務和相關實體(即用戶和商品)都是用自然語言來描述的。在該范式中,大語言模型通常以生成的方式執行推薦任務--微調大語言模型直接在語言空間中生成(解碼出)商品。這種方式與大語言模型的生成特性非常吻合,可有效利用大語言模型的強大生成能力來實現可觀的成果。
2、在語言空間中解碼推薦商品時,推理效率面臨著巨大的挑戰。如圖2中(a)所示,在對語言空間中進行解碼時,大語言模型必須自回歸地生成其表示(例如標題,由多個標記組成,每個標記的生成都取決于前一個標記),這將產生大量的時間成本。更糟糕的是,每個推薦請求通常都需要生成一個商品列表,故而推理成本與生成的商品數量成線性關系。雖然現有的grounding技術可以通過將每個生成的商品表示映射到多個實際商品上來降低大語言模型要生成商品的數量,但過度減少生成商品的數量是不切實際的,因為僅僅將少數幾個商品映射到一個較長的推薦列表會降低推薦性能。因此,要實現較高的大語言模型的推薦性能,需要增加比生成單個商品高出數倍的推理成本,這是不現實的。
技術實現思路
1、在本實施例中提供了基于大語言模型的隱空間解碼生成式推薦方法、系統、電子設備及存儲介質,能夠直接在隱空間而非語言空間中解碼商品,以低成本實現優異的推薦性能。
2、第一方面,本發明實施例提供基于大語言模型的隱空間解碼生成式推薦方法,所述基于大語言模型的隱空間解碼生成式推薦方法包括:
3、(1)、構建記憶模塊,通過用戶-商品交互數據集生成訓練樣本的隱狀態與真實商品的匹配對并存儲,所述隱狀態由大語言模型提取輸入指令的最后一層最后一個隱狀態得到;
4、(2)、候選商品表示生成,從所述記憶模塊中聚合與同一商品關聯的隱狀態,生成候選商品的隱空間表示;
5、(3)、商品解碼,計算測試樣本的隱狀態與候選商品表示的相似度,基于相似度排序生成推薦列表。
6、在一個可選的實施例中,所述記憶模塊的構建過程包括:
7、將用戶交互歷史轉換為固定模板的指令數據;
8、通過大語言模型對指令數據進行編碼,提取最后一層最后一個隱狀態。
9、在一個可選的實施例中,所述步驟(2)中的聚合包括全局聚合策略和局部聚合策略。
10、在一個可選的實施例中,所述全局聚合策略包括:
11、對記憶模塊中同一商品的所有隱狀態取平均值,形成全局商品表示。
12、在一個可選的實施例中,所述局部聚合策略包括:
13、基于測試樣本隱狀態,從記憶模塊中檢索最相似的m個隱狀態;
14、對檢索到的隱狀態按商品分組并聚合,生成用戶相關的候選商品表示。
15、在一個可選的實施例中,所述檢索最相似的m個隱狀態通過計算l2距離的倒數實現,l2距離定義為測試樣本隱狀態與記憶模塊中隱狀態的歐氏距離。
16、在一個可選的實施例中,所述局部聚合策略中,m的取值根據測試場景動態調整,當用戶交互密集場景下增加m值以提高個性化,在稀疏場景下降低m值以減少噪聲。
17、與現有技術相比,本發明的基于大語言模型的隱空間解碼生成式推薦方法的有益效果如下:
18、本發明可以應用到基于大語言模型的生成式推薦平臺上,不僅能夠顯著降低大語言模型的解碼商品的開銷,而且能保持優秀的推薦性能。本發明的l2d方法直接從大語言模型的隱空間進行解碼,即只需要大語言模型前向傳播一次獲得用戶輸入的隱狀態,避免了自回歸方式的解碼。利用記憶模塊的(隱狀態,真實商品)匹配對在隱空間中生成商品的表示。對于每個商品,它聚合與該商品配對的相關隱狀態,以創建該商品的表示。該方式能夠很有效的建模一個商品的特征。利用當前用戶的狀態信息,檢索出最相關的m個隱狀態,這些隱藏狀態構成的真實商品包含用戶的個性化信息,經過聚合操作,能夠形成個性化的商品表示。
19、第二方面,本發明實施例提供基于大語言模型的隱空間解碼生成式推薦系統,包括:
20、記憶模塊,被配置為:通過用戶-商品交互數據集生成訓練樣本的隱狀態與真實商品的匹配對并存儲,所述隱狀態由大語言模型提取輸入指令的最后一層最后一個隱狀態得到;
21、候選商品表示生成模塊,被配置為:從所述記憶模塊中聚合與同一商品關聯的隱狀態,生成候選商品的隱空間表示;
22、商品解碼推薦模塊,被配置為:計算測試樣本的隱狀態與候選商品表示的相似度,基于相似度排序生成推薦列表。
23、第三方面,本發明實施例提供一種電子設備,包括處理器、通信接口、存儲器和總線,其中,處理器,通信接口,存儲器通過總線完成相互間的通信,處理器可以調用存儲器中的邏輯指令,以執行如第一方面所提供的方法的步驟。
24、第四方面,本發明實施例提供一種非瞬時計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執行時實現如第一方面所述的基于大語言模型的隱空間解碼生成式推薦方法的步驟。
25、與現有技術相比,本發明的基于大語言模型的隱空間解碼生成式推薦系統、電子設備及存儲介質的有益效果與第一方面所述的基于大語言模型的隱空間解碼生成式推薦方法相同,故此處不再贅述。
1.基于大語言模型的隱空間解碼生成式推薦方法,其特征在于,所述基于大語言模型的隱空間解碼生成式推薦方法包括:
2.根據權利要求1所述的基于大語言模型的隱空間解碼生成式推薦方法,其特征在于,所述記憶模塊的構建過程包括:
3.根據權利要求1所述的基于大語言模型的隱空間解碼生成式推薦方法,其特征在于,所述步驟(2)中的聚合包括全局聚合策略和局部聚合策略。
4.根據權利要求3所述的基于大語言模型的隱空間解碼生成式推薦方法,其特征在于,所述全局聚合策略包括:
5.根據權利要求3所述的基于大語言模型的隱空間解碼生成式推薦方法,其特征在于,所述局部聚合策略包括:
6.根據權利要求5所述的基于大語言模型的隱空間解碼生成式推薦方法,其特征在于,所述檢索最相似的m個隱狀態通過計算l2距離的倒數實現,l2距離定義為測試樣本隱狀態與記憶模塊中隱狀態的歐氏距離。
7.根據權利要求5所述的基于大語言模型的隱空間解碼生成式推薦方法,其特征在于,所述局部聚合策略中,m的取值根據測試場景動態調整,當用戶交互密集場景下增加m值以提高個性化,在稀疏場景下降低m值以減少噪聲。
8.基于大語言模型的隱空間解碼生成式推薦系統,其特征在于,包括:
9.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現如權利要求1至7中任一項所述的基于大語言模型的隱空間解碼生成式推薦方法。
10.一種非瞬時計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該計算機程序被處理器執行時實現如權利要求1至7中任一項所述的基于大語言模型的隱空間解碼生成式推薦方法的步驟。