專利名稱:一種發送推薦信息的方法及裝置的制作方法
技術領域:
本發明涉及互聯網技術領域,具體的說,涉及一種發送推薦信息的方法及裝置。
背景技術:
目前,由于互聯網和即時通訊技術的迅速發展,互聯網用戶的數量也隨之逐漸增大。為了滿足用戶個性化需求,微博,博客,QQ空間等這樣的社區為用戶提供了個人中心頁面,用戶能夠根據自身的興趣、愛好、習慣等需求,發表日志、上傳照片等個性化的操作,同時,也能夠將用戶關系鏈中各好友的動態信息推薦給用戶,使得用戶能夠更加方便的了解好友的近期狀況。通常在現有方案中,針對個人中心頁面中用戶關系鏈內各好友所產生的動態信息,可以按照時間順序推送給用戶,但用戶不能保證能夠及時登錄個人中心頁面對所感興趣的動態信息進行查看,由于動態內容會隨著時間的推進而滾屏,因此,用戶很有可能錯過自己關注的動態信息。還有一種現有方案是采用基于用戶關系鏈的范圍進行推送,具體是將登錄用戶的關系鏈中各好友的關系鏈信息推薦給登錄用戶,使得用戶可以推展自身的用戶關系鏈。但這種信息推薦方式,由于用戶關系鏈的復雜性,并不利于登錄用戶找到志趣相投的朋友,因此,也不利于社區關系鏈的進一步拓展。
發明內容
本發明實施例提供一種發送推薦信息的方法及裝置,能夠提高推薦信息的精準度,減少不相關內容的推送。本發明一方面提供了一種發送推薦信息的方法,包括:建立用戶屬性集合,所述用戶屬性集合包括基于內容的集合以及基于用戶關系的集合;根據所述用戶屬性集合確定要發送的推薦信息;發送所述推薦信息。進一步的,所述建立用戶屬性集合,包括:根據用戶行為信息建立所述基于內容的集合;所述用戶行為信息包括用戶個人屬性、用戶發表日志的內容以及用戶瀏覽過的日志內容中任意一種或多種;根據用戶關系信息建立所述基于用戶關系的集合;所述用戶關系信息包括用戶的好友ID以及與好友交互的頻率信息。進一步的,所述根據所述用戶屬性集合確定要發送的推薦信息,包括:確定所述基于內容的集合與數據庫中每個文檔模型的內容相似度;確定所述用戶關系的集合與數據庫中每個文檔作者的基于用戶關系的集合的用戶相似度;根據所述內容相似度以及用戶相似度,從所述數據庫中確定所述推薦信息;
其中,根據所述內容相似度以及用戶相似度,從所述數據庫中確定所述推薦信息,包括:將所述內容相似度與所述用戶相似度進行線性疊加;根據所述線性疊加值對數據庫中的內容進行排序,按照排序順序確定所述推薦信
肩、O進一步的,所述方法還包括:根據用戶訂閱內容列表從所述數據庫中確定所述用戶的訂閱內容數據;在所述用戶的訂閱內容數據以及優質內容數據中,確定初始推薦信息,以便根據所述用戶屬性集合在所述初始推薦信息中確定要發送的推薦信息。進一步的,所述發送所述推薦信息,包括:采用直接發送所述推薦信息的方式,或者,根據所述推薦信息的排序順序進行發送的方式,發送所述推薦信息。本發明另一方面提供了一種發送推薦信息的裝置,包括:數據配置模塊,用于建立用戶屬性集合,所述用戶屬性集合包括基于內容的集合以及基于用戶關系的集合;數據控制模塊,用于根據所述數據配置模塊建立的用戶屬性集合確定要發送的推薦信息;數據發送模塊,用于發送所述數據控制模塊確定的所述推薦信息。優選的,所述數據配置模塊具體用于:根據用戶行為信息建立所述基于內容的集合;所述用戶行為信息包括用戶個人屬性、用戶發表日志的內容以及用戶瀏覽過的日志內容中任意一種或多種;根據用戶關系信息建立所述基于用戶關系的集合;所述用戶關系信息包括用戶的好友ID以及與好友交互的頻率信息。優選的,所述數據控制模塊進一步包括:內容相似度確定單元,用于確定所述基于內容的集合與數據庫中每個文檔模型的內各相似度;用戶相似度確定單元,用于確定所述用戶關系的集合與數據庫中每個文檔作者的基于用戶關系的集合的用戶相似度;推薦信息確定單元,用于根據所述內容相似度以及用戶相似度,從所述數據庫中確定所述推薦信息;其中,所述推薦信息確定單元具體用于:將所述內容相似度與所述用戶相似度進行線性疊加;根據所述線性疊加值對數據庫中的內容進行排序,按照排序順序確定所述推薦信息。優選的,所述裝置還包括:數據篩選模塊,用于根據用戶訂閱內容列表從所述數據庫中確定所述用戶的訂閱內容數據;在所述用戶的訂閱內容數據以及優質內容數據中,確定初始推薦信息,以便所述數據控制模塊根據所述用戶屬性集合在所述初始推薦信息中確定要發送的推薦信息。優選的,所述數據發送模塊具體用于:采用直接發送所述推薦信息的方式,或者,根據所述推薦信息的排序順序進行發送的方式,發送所述推薦信息。由上述本發明提供的技術方案可以看出,本發明實施例通過建立用戶屬性集合,所述用戶屬性集合包括基于內容的集合以及基于用戶關系的集合;并根據所述用戶屬性集合確定要推送的推薦信息,并發送所述推薦信息。本發明技術方案的實現,能夠在海量內容中篩選出跟用戶相關并且喜愛的信息,減少不相關內容的推送,從而提高信息的推送精準度,同時也能夠增加用戶對推薦信息的關注度,有利于用戶關系鏈的擴展。
為了更清楚地說明本發明實施例的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域的普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他附圖。圖1為本發明實施例一種發送推薦信息的方法流程圖;圖2為本發明實施例一種發送推薦信息的裝置結構示意圖。
具體實施例方式下面結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明的保護范圍。本發明實施例提供了一種發送推薦信息的方法及裝置,通過建立基于內容的集合及用戶關系的集合,能夠在存儲有海量數據的數據庫中篩選出跟用戶相關并且感興趣的信息,不僅提高了推薦信息的精準度,還能夠增加用戶對推薦信息的點擊量及用戶間的互動頻率,從而便于進一步拓展社區關系鏈。下面將結合附圖對本發明實施例作進一步地詳細描述。如圖1所示,本發明實施例提出一種發送推薦信息的方法,技術方案可以包括:101、建立用戶屬性集合,所述用戶屬性集合包括基于內容的集合以及基于用戶關系的集合;102、根據所述用戶屬性集合確定要發送的推薦信息;103、發送所述推薦信息。可見,上述本發明實施例提出的發送推薦信息的方法,主要包括建立用戶屬性集合和根據用戶屬性集合確定推薦信息的兩個過程。下面對這兩個過程進行詳細說明。在本發明的一個可選實施例中,在步驟101之前,所述方法還可以包括步驟100 (圖1中未示出):根據用戶訂閱內容列表從數據庫中確定所述用戶的訂閱內容數據;在所述用戶的訂閱內容數據以及優質內容數據中,確定初始推薦信息,以便根據用戶屬性集合在初始推薦信息中確定要發送的推薦信息。具體的說,根據用戶訂閱內容列表從數據庫中確定用戶的訂閱內容數據,該過程可以采用現有方法來實現,例如:目前用戶的訂閱內容就是用戶QQ好友或微博follow關系的用戶所產生的內容,用戶上線后,根據用戶關系鏈,采用將對方的內容拉取過來的方式獲取所述用戶訂閱的內容數據,由于該獲取方式可以采用現有技術來實現,本發明在此不做贅述。進一步的說,本發明實施例中用戶的訂閱內容數據可以包括用戶關系鏈中好友所發布的日志、文章、照片、視頻等內容中的任意一種或多種。具體的說,本發明實施例中將數據庫中存儲的海量數據中,具體有如下特征的數據作為優質內容數據:(I)文檔的標題含有語義信息,且標題長度不宜過短,文檔中的文本內容較長,信
息含量豐富;(2)具備一定的文本內容并且含有圖片或多媒體內容的頁面,且所述頁面具有瀏覽量、評論量、轉載量、分享量中任意一種或幾種大于預定值,其中所述預定值要根據經驗值來設定。綜上所述,采用步驟100的目的是在微博,博客,QQ空間等這樣的社區數據庫存儲的海量數據中初步篩選出與用戶相關的數據,將這些數據作為初步推薦信息,以便縮小推薦信息的篩選范圍,減少數據處理量,提高數據的處理效率。在本發明的一個可選實施例中,步驟101的過程具體包括:根據用戶行為信息建立所述基于內容的集合;所述用戶行為信息包括用戶個人屬性、用戶發表日志的內容以及用戶瀏覽過的日志內容中任意一種或多種;根據用戶關系信息建立所述基于用戶關系的集合;所述用戶關系信息包括用戶的好友ID以及與好友交互的頻率信息。具體的,所述基于內容的集合可以具體為基于關鍵詞的內容集合;其中,建立基于關鍵詞的內容集合可以采用現有方案實現,例如:針對數據庫中篩選出的優質內容數據進行分類、打標簽等操作,再對應到所屬關鍵詞下;或者,對于優質內部數據中含有關鍵詞的,在所屬類別中進行檢索,即可獲得基于內容的集合。由于該過程屬于現有方案,本發明實施例在此不做贅述。具體的,本發明實施例中用戶個人屬性包括用戶在個人社區中填寫的,如:興趣、愛好、特長、職業等信息,本實施例中不限定用戶個人屬性的具體范圍,能夠體現用戶自身興趣愛好的信息均可以作為用戶個人屬性。具體的,在建立基于內容的集合時,還可以考慮在線用戶(登錄個人中心頁面的用戶)對推薦信息的點擊情況,將用戶所關注的內容用關鍵字記錄下來,從而確定用戶所關注的推薦信息的范圍。在本發明實施例中,推薦信息可以為feeds內容,feeds內容是指將用戶可能需要的內容聚合起來推送給他閱讀的內容。具體的,本發明實施例建立基于用戶關系的集合過程中,所述用戶與好友交互的頻率信息可以包括用戶對用戶關系鏈中好友空間的訪問頻率,以及與好友聊天的頻率,以便能夠確定用戶所關注的好友范圍。在本發明的一個可選實施例中,步驟102具體可以包括:確定所述基于內容的集合與數據庫中每個文檔模型的內容相似度;確定所述用戶關系的集合與數據庫中每個文檔作者的基于用戶關系的集合的用戶相似度;根據所述內容相似度以及用戶相似度,從所述數據庫中確定要發送的推薦信息。具體的說,本發明實施例中所述文檔模型即向量空間模塊,因此所述文檔模型的建立方法可以參考向量空間模型(VSM:Vector Space Model)的建立方法,具體是對文本內容的處理簡化為向量空間中的向量運算,并且以空間上的相似度表達語義的相似度,具有直觀易懂的特點。進一步的說,當文檔被表示為文檔空間的向量,就可以通過計算向量之間的相似性來度量文檔間的相似性,因此本發明實施例中確定基于內容的集合與數據庫中每個文檔模型內容相似度,可以采用文本處理中最常用的余弦距離相似性度量方式來實現;此外,本發明實施例中確定所述內容相似度的方式還可以采用其他現有方案來實現,如:歐氏距離等。具體的說,本發明實施例中采用余弦距離方式計算所述內容相似度時,所述內容相似度可以表示為:Rankl = sim(C(people), C(feed))其中,C(people)為用戶基于內容的集合,C(feed)為文檔基于內容的集合。確定所述用戶相似度,也可以采用余弦距離等現有方式實現,同樣以余弦距離計算方式為例,所述用戶相似度可以表示為:Rank2 = sim(U (people), U (feed_author))其中,U(people)為用戶基于用戶關系的集合,U(feed_author)為feeds內容的作者基于用戶關系的集合。在本發明的一個可選實施例中,所述方法還可以包括:將所述內容相似度與所述用戶相似度進行線性疊加;根據所述線性疊加值對數據庫中的內容進行排序,按照排序順序確定要發送的推薦信息。具體的說,本發明實施例中,將所述內容相似度以及用戶相似度進行線性疊加,獲得feeds內容的排序值,所述線性疊加結果可以通過如下方式表示:Rank = a * Rankl+(l_a) * Rank2,0 < a < I ;其中,a表示權重系數,用于調整用戶相似度和內容相似度所占的權重,具體可以根據實際需要進行調整,一般可以設置為0.5 ;Rankl表示內容相似度,Rank2表示用戶相似度。具體的,本發明實施例中具體可以根據獲得的線性疊加結果Rank值,按照從大到小的順序來確定向登錄個人中心頁面的用戶推薦信息。在本發明的一個可選實施例中,發送所述推薦信息的方法包括:采用直接發送所述推薦信息的方式,或者,根據所述推薦信息的排序順序進行發送的方式,發送所述推薦信息。由上述本發明實施例可以看出,本發明實施例提出的技術方案,通過針對用戶建立基于內容的集合以及基于用戶關系的集合,在確定推薦信息的過程中可以同時兼顧用戶關系鏈信息以及用戶社區的行為信息,能夠提高feeds內容的推送精確度,打破了傳統基于用戶關系鏈或按照時間推送的推薦方式,減少了不相關內容的推薦。
如圖2所示,本發明實施例還提供了一種發送推薦信息的裝置,技術方案包括:數據配置模塊21,用于建立用戶屬性集合,所述用戶屬性集合包括基于內容的集合以及基于用戶關系的集合;數據控制模塊22,用于根據所述數據配置模塊建立的用戶屬性集合定要發送的推薦信息;數據發送模塊23,用于發送所述數據控制模塊確定的所述推薦信息。在本發明的一個可選實施例中,所述裝置還可以包括:數據篩選模塊20,用于根據用戶訂閱內容列表從所述數據庫中確定所述用戶的訂閱內容數據;在所述用戶的訂閱內容數據以及優質內容數據中,確定要初始推薦信息,以便數據控制模塊根據用戶屬性集合在初始推薦信息中確定要發送的推薦信息。具體的說,所述數據篩選模塊根據用戶訂閱內容列表從數據庫中確定用戶訂閱內容的可以采用現有方法來實現;用戶的訂閱內容數據可以包括用戶關系鏈中好友所發布的日志、文章、照片、視頻等內容中的任意一種或多種。在本發明的一個可選實施例中,所述數據配置模塊21具體用于:根據用戶行為信息建立所述基于內容的集合;所述用戶行為信息包括用戶個人屬性、用戶發表日志的內容以及用戶瀏覽過的日志內容中任意一種或多種;根據用戶關系信息建立所述基于用戶關系的集合;所述用戶關系信息包括用戶的好友ID以及與好友交互的頻率信息。具體的,所述基于內容的集合可以具體為基于關鍵詞的內容集合,建立基于關鍵詞的內容集合的具體過程可以采用現有方案實現。具體的,本發明實施例中用戶個人屬性信息可以包括用戶在個人社區中填寫的,如:興趣、愛好、特長、職業等信息。具體的,在建立基于內容的集合時,還可以考慮在線用戶對f推薦信息的點擊情況,將用戶所關注的內容的用關鍵字記錄下來,從而確定用戶所關注的feeds內容的范圍。具體的,本發明實施例建立基于用戶關系集合過程中,所述用戶與好友交互的頻率信息可以包括用戶對用戶關系鏈中好友空間的訪問頻率,以及與好友聊天的頻率,以便能夠確定用戶所關注的好友信息。在本發明的一個可選實施例中,所述數據控制模塊22進一步包括:內容相似度確定單元221,用于確定所述基于內容的集合與數據庫中每個文檔模型的內容相似度;用戶相似度確定單元222,用于確定所述用戶關系的集合與數據庫中每個文檔作者的基于用戶關系的集合的用戶相似度;推薦信息確定單元223,用于根據所述內容相似度以及用戶相似度,從所述數據庫中確定要發送的推薦信息;其中,所述推薦信息確定單元223具體用于:將所述內容相似度與所述用戶相似度進行線性疊加;根據所述線性疊加值對數據庫中的內容進行排序,按照排序順序確定推薦信息。具體的,本發明實施例中確定所述內容相似度以及所述用戶相似度,可以采用余弦距離等現有方式實現;
具體的說,本發明實施例中,可以將采用余弦距離算法計算出的所述內容相似度以及用戶相似度進行線性疊加,獲得feeds中內容的排序值。此外,本發明實施例中數據發送模塊,可以采用直接發送所述推薦信息的方式,或者,根據所述推薦信息的排序順序進行發送的方式,發送所述推薦信息。需要說明的是,本發明實施例是基于圖1所示的方法實施例獲得的裝置實施例,包含了與圖1實施例相同的技術特征,其中,本發明實施例中各功能模塊與圖1實施例中各步驟存在對應關系,因此,本發明實施例中涉及的具體技術方案可以參見上述圖1實施例中的相關描述,在此不做贅述。綜上所述,本發明實施例一種發送推薦信息的方法及裝置,通過針對用戶建立基于內容的集合以及基于用戶關系的集合,在確定要推薦給用戶信息的過程中可以同時兼顧用戶關系鏈信息以及用戶社區的行為信息,能夠在海量的feeds信息中確定與用戶興趣相關的推薦信息,提高了 feeds信息的推送精確度,解決了現有技術中根據用戶關系鏈或按照時間推送的信息推薦方式不能滿足登錄個人中心頁面用戶的需求。以上所述,僅為本發明較佳的具體實施方式
,但本發明的保護范圍并不局限于此,任何熟悉本技術領域的技術人員在本發明揭露的技術范圍內,可輕易想到的變化或替換,都應涵蓋在本發明的保護范圍之內。因此,本發明的保護范圍應該以權利要求書的保護范圍為準。
權利要求
1.一種發送推薦信息的方法,其特征在于,包括: 建立用戶屬性集合,所述用戶屬性集合包括基于內容的集合以及基于用戶關系的集合; 根據所述用戶屬性集合確定要發送的推薦信息; 發送所述推薦信息。
2.根據權利要求1所述方法,其特征在于,所述建立用戶屬性集合,包括: 根據用戶行為信息建立所述基于內容的集合;所述用戶行為信息包括用戶個人屬性、用戶發表日志的內容以及用戶瀏覽過的日志內容中的任意一種或多種; 根據用戶關系信息建立所述基于用戶關系的集合;所述用戶關系信息包括用戶的好友ID以及與好友交互的頻率信息。
3.根據權利要求2所述的方法,其特征在于,所述根據所述用戶屬性集合確定要發送的推薦信息,包括: 確定所述基于內容的集合與數據庫中每個文檔模型的內容相似度; 確定所述基于用戶關系的集合與數據庫中每個文檔作者的基于用戶關系的集合的用戶相似度; 根據所述內容相似度以及用戶相似度,從所述數據庫中確定所述推薦信息; 其中,根據所述內容相似度以及用`戶相似度,從所述數據庫中確定所述推薦信息,包括: 將所述內容相似度與所述用戶相似度進行線性疊加; 根據所述線性疊加值對數據庫中的內容進行排序,按照排序順序確定所述推薦信息。
4.根據權利要求1所述的方法,其特征在于,所述方法還包括: 根據用戶訂閱內容列表從所述數據庫中確定所述用戶的訂閱內容數據; 在所述用戶的訂閱內容數據以及優質內容數據中,確定初始推薦信息,以便根據所述用戶屬性集合在所述初始推薦信息中確定要發送的推薦信息。
5.根據權利要求1至4中任一所述的方法,其特征在于,所述發送所述推薦信息,包括: 采用直接發送所述推薦信息的方式,或者,根據所述推薦信息的排序順序進行發送的方式,發送所述推薦信息。
6.一種發送推薦信息的裝置,其特征在于,包括: 數據配置模塊,用于建立用戶屬性集合,所述用戶屬性集合包括基于內容的集合以及基于用戶關系的集合; 數據控制模塊,用于根據所述數據配置模塊建立的用戶屬性集合確定要發送的推薦信息; 數據發送模塊,用于發送所述數據控制模塊確定的所述推薦信息。
7.根據權利要求6所述的裝置,其特征在于,所述數據配置模塊具體用于: 根據用戶行為信息建立所述基于內容的集合;所述用戶行為信息包括用戶個人屬性、用戶發表日志的內容以及用戶瀏覽過的日志內容中任意一種或多種; 根據用戶關系信息建立所述基于用戶關系的集合;所述用戶關系信息包括用戶的好友ID以及與好友交互的頻率信息。
8.根據權利要求7所述的裝置,其特征在于,所述數據控制模塊進一步包括: 內容相似度確定單元,用于確定所述基于內容的集合與數據庫中每個文檔模型的內容相似度; 用戶相似度確定單元,用于確定所述用戶關系的集合與數據庫中每個文檔作者的基于用戶關系的集合的用戶相似度; 推薦信息確定單元,用于根據所述內容相似度以及用戶相似度,從所述數據庫中確定所述推薦信息。
9.根據權利要求8所述的裝置,其特征在于,所述推薦信息確定單元具體用于: 將所述內容相似度與所述用戶相似度進行線性疊加;根據所述線性疊加值對數據庫中的內容進行排序,按照排序順序確定所述推薦信息。
10.根據權利要求6所述的裝置,其特征在于,所述裝置還包括: 數據篩選模塊,用于根據用戶訂閱內容列表從所述數據庫中確定所述用戶的訂閱內容數據;在所述用戶的訂閱內容數據以及優質內容數據中,確定初始推薦信息,以便所述數據控制模塊根據所述用戶屬性集合在所述初始推薦信息中確定要發送的推薦信息。
11.根據權利要求6至10中任一所述的裝置,其特征在于,所述數據發送模塊具體用于: 采用直接發送所述推薦信息的方式,或者,根據所述推薦信息的排序順序進行發送的方式,發送所述推薦信息。
全文摘要
本發明公開了一種發送推薦信息的方法及裝置,其中,該發送推薦信息的方法包括建立用戶屬性集合,所述用戶屬性集合包括基于內容的集合以及基于用戶關系的集合;根據所述用戶屬性集合確定要發送的推薦信息;發送所述推薦信息。本發明還公開了一種發送推薦信息的裝置,包括數據配置模塊、數據發送模塊以及數據控制模塊。本發明技術方案的實現,能夠幫助用戶在海量內容中篩選出與用戶相關的信息,提高推薦信息的精準度,減少不相關內容的推送。
文檔編號G06F17/30GK103116589SQ20111036582
公開日2013年5月22日 申請日期2011年11月17日 優先權日2011年11月17日
發明者徐芳, 廖宇奇, 王亮, 文勖, 何建國 申請人:騰訊科技(深圳)有限公司