
本發明實施例涉及流量識別技術,尤其涉及一種基于流量分析識別用戶行為對象的方法和裝置。
背景技術:
:近年來,數據業務呈現爆炸式的增長,對用戶的數據流進行識別則是運營商進行網絡管理和服務優化的重要研究內容。目前,數據流識別主要是采用機器學習的方法來實現,具體為:根據數據流中包含的用戶上網日志和用戶網絡通信數據包等,分析數據流的持續時長、端口號、包長和時間間隔等統計特征,并根據統計特征對數據流進行分類識別,從而研究用戶的興趣偏好,例如,針對端口號的分布,采用信息熵特征和數據挖掘技術對多種數據流進行分類識別;或者,通過考察數據流的持續時長和時間間隔的相關系數對語音流量進行分類識別等。但是,對于經過端口地址轉換、隱私保護等技術處理過的數據流,運營商無法通過分析用戶網絡通信數據包來獲取數據流的統計特征,即運營商無法通過數據流識別來研究用戶的興趣偏好,導致運營商不能根據用戶的興趣偏好為用戶提供數據業務,嚴重影響了數據業務的服務質量。技術實現要素:本發明實施例提供一種基于流量分析識別用戶行為對象的方法和裝置,使得運營商可以根據行為對象研究用戶的興趣偏好,從而根據用戶的興趣偏好為用戶提供數據業務,提高數據業務的服務質量。第一方面,本發明實施例提供一種基于流量分析識別用戶行為對象的方法,包括:獲取用戶數據流中的上網日志;根據預設的用戶知識庫,識別所述上網日志對應的上網行為,并對所述上網日志進行語義化標注,得到標注后的上網日志;其中,所述標注后的上網日志包括用戶標識、上網時間、行 為名稱和行為對象;根據所述標注后的上網日志中的上網時間和行為名稱,確定所述標注后的上網日志中的第一日志和第二日志為關聯事件;其中,所述第二日志對應的行為對象為空;根據所述關聯事件生成中間事件,所述中間事件包括所述用戶標識、所述第二日志對應的上網時間和所述第一日志對應的行為對象。其中,用戶數據流為運營商服務器獲取到的用戶的移動終端的數據流,用戶知識庫中包括URL的解析規則、關鍵字符串與行為ID之間的對應關系、行為ID與行為名稱之間的對應關系、關鍵字符串與行為對象之間的對應關系等,上網日志對應的上網行為至少包括行為名稱和行為對象,語義化標注指的是為上網日志的上網行為打標簽,關聯事件為行為之間具有必然聯系、且連續發生的多個事件,行為對象為空指的是根據用戶知識庫無法獲取到該上網日志對應的行為對象,中間事件用于研究用戶的偏好信息。本實施例提供的基于流量分析識別用戶行為對象的方法,根據用戶數據流中的上網日志識別用戶的行為和行為對象,便于運營商根據行為對象研究用戶的興趣偏好,從而根據用戶的興趣偏好為用戶提供數據業務,提高數據業務的服務質量。結合第一方面,在第一方面的第一種可能實現方式中,所述根據所述標注后的上網日志中的上網時間和行為名稱,確定所述標注后的上網日志中的第一日志和第二日志為關聯事件,具體為:根據所述第二日志對應的行為名稱,確定所述第二日志為關鍵事件;根據所述第一日志對應的上網時間和所述第二日志對應的上網時間,確定所述第一日志和所述第二日志為連續產生的上網日志。在本實施例中,關鍵事件為用于決定用戶偏好的事件,運營商服務器確定關鍵事件后,再確定第一日志和第二日志為連續產生的上網日志,從而找出關聯事件,由于關聯事件中的行為對象為空,根據第一日志和第二日志之間的關聯關系可以推測出關鍵事件中的行為對象,從而可以根據關鍵事件的行為對象研究用戶偏好,為用戶提供感興趣的數據業務,方便用戶及時獲取所需的信息。結合第一方面或第一方面的第一種可能實現方式,在第一方面的第二種可能實現方式中,所述預設的用戶知識庫包括URL解析規則庫、行為知識庫和對象知識庫;所述根據預設的用戶知識庫,識別所述上網日志對應的上網行為,并對所述上網日志進行語義化標注,得到標注后的上網日 志,具體為:根據所述URL解析規則庫,解析所述上網日志,識別所述上網日志對應的上網行為;根據所述上網日志對應的上網行為和所述行為知識庫,確定所述上網日志對應的行為名稱;根據所述上網日志對應的上網行為和和對象知識庫,確定所述上網日志對應的行為對象;將確定的行為名稱和行為對象,添加到所述上網日志中生成所述標注后的上網日志。其中,URL解析庫用于存儲URL的解析規則,解析規則具體包括不同的關鍵字符串與不同的行為ID或者行為對象類別之間的對應關系;行為知識庫包括行為ID與行為名稱之間的對應關系,用于識別上網日志對應的行為名稱;對象知識庫包括關鍵字符串與行為對象之間的對應關系,用于識別上網日志對應的行為對象。在本實施例中,根據用戶知識庫中的URL解析規則庫、行為知識庫和對象知識庫對上網日志中的關鍵字符串進行解析,確定上網日志對應的用戶的行為和行為對象,處理過程簡單精確,有利于運營商快速準確的獲取用戶的偏好信息,為用戶提供更佳的數據業務。結合第一方面的任一種可能實現方式,在第一方面的第三種可能實現方式中,所述上網日志為商務類上網日志。結合第一方面的第三種可能實現方式,在第一方面的第四種可能實現方式中,所述第一日志對應的行為名稱為瀏覽,所述第二日志對應的行為名稱為加入購物車或者提交訂單??蛇x地,結合第一方面的任一種可能實現方式,在第一方面的第五種可能實現方式中,所述根據預設的用戶知識庫,識別所述上網日志對應的上網行為,并對所述上網日志進行語義化標注,得到標注后的上網日志之后,所述方法還包括:根據所述標注后的上網日中對應的行為名稱,從所述標注后的上網日志中提取目標事件;則所述根據所述標注后的上網日志中的上網時間和行為名稱,確定所述標注后的上網日志中的第一日志和第二日志為關聯事件,具體為:根據所述標注后的上網日志中的上網時間和行為名稱,確定目標事件中的第一日志和第二日志為關聯事件。在本實施例中,目標事件為各行為之間相關聯、且能決定用戶偏好的多個事件,從標注后的上網日志中提取目標事件,僅對目標事件進行分析,能更快速度的確定關聯事件,有效提高了識別用戶行為對象的效率。可選地,結合第一方面的第五種可能實現方式,在第一方面的第六種可能實現方式中,所述從所述標注后的上網日志中提取目標事件之后,所述方法還包括:將預設時間周期內的所述用戶數據流劃分多個數據流分段,其中,每個數據流分段均以關鍵事件作為數據流的終點。在本實施例中,以關鍵事件為特征為用戶數據流進行劃分,相當于對用戶數據流近似”歸類”的作用,方便對用戶數據流進行管理。第二方面,本發明實施例提供一種基于流量分析識別用戶行為對象的裝置,包括:獲取模塊,用于獲取用戶數據流中的上網日志;識別模塊,用于根據預設的用戶知識庫,識別所述上網日志對應的上網行為,并對所述上網日志進行語義化標注,得到標注后的上網日志;其中,所述標注后的上網日志包括用戶標識、上網時間、行為名稱和行為對象;確定模塊,用于根據所述標注后的上網日志中的上網時間和行為名稱,確定所述標注后的上網日志中的第一日志和第二日志為關聯事件;其中,所述第二日志對應的行為對象為空;生成模塊,用于根據所述關聯事件生成中間事件,所述中間事件包括所述用戶標識、所述第二日志對應的上網時間和所述第一日志對應的行為對象。本實施例的裝置用于執行第一方面提供的基于流量分析識別用戶行為對象的方法,其實現原理和有益效果類似,此處不再贅述。結合第二方面,在第二方面的第一種可能實現方式中,所述確定模塊具體用于根據所述第二日志對應的行為名稱,確定所述第二日志為關鍵事件;并根據所述第一日志對應的上網時間和所述第二日志對應的上網時間,確定所述第一日志和所述第二日志為連續產生的上網日志。本實施例中,確定模塊的用于執行第一方面的第一種可能實現方式提供的方法,其實現原理和有益效果類似,此處不再贅述。結合第二方面或第二方面的第一種可能實現方式,在第二方面的第二種可能實現方式中,所述預設的用戶知識庫包括URL解析規則庫、行為知識庫和對象知識庫;所述識別模塊具體用于根據所述URL解析規則庫,解析所述上網日志,識別所述上網日志對應的上網行為;根據所述上網日志對應的的上網行為和所述行為知識庫,確定所述上網日志對應的行為名稱;根據所述上網日志對應的上網行為和和對象知識庫,確定所述上網日志對應的行為對象;將確定的行為名稱和行為對象,添加到所述上網日志中生成所述標注后 的上網日志。本實施例的裝置用于執行第一方面的第二種可能實現方式提供的方法,其實現原理和有益效果類似,此處不再贅述。結合第二方面的任一種可能實現方式,在第二方面的第三種可能實現方式中,所述上網日志為商務類上網日志。結合第二方面的第三種可能實現方式,在第二方面的第四種可能實現方式中,所述第一日志對應的行為名稱為瀏覽,所述第二日志對應的行為名稱為加入購物車或者提交訂單??蛇x地,結合第二方面的任一種可能實現方式,在第二方面的第五種可能實現方式中,所述確定模塊還用于根據所述標注后的上網日中對應的行為名稱,從所述標注后的上網日志中提取目標事件;并根據所述標注后的上網日志中的上網時間和行為名稱,確定所述目標事件中的第一日志和第二日志為關聯事件。本實施例的裝置用于執行第一方面的第五種可能實現方式提供的方法,其實現原理和有益效果類似,此處不再贅述??蛇x地,結合第二方面的第五種可能實現方式,在第二方面的第六種可能實現方式中,所述確定模塊還用于將預設時間周期內的所述用戶數據流劃分多個數據流分段,其中,每個數據流分段均以關鍵事件作為數據流的終點。本實施例的裝置用于執行第一方面的第六種可能實現方式提供的方法,其實現原理和有益效果類似,此處不再贅述。第三方面,本發明實施例提供一種服務器,包括存儲器,用于存儲計算機可執行程序代碼;收發器,以及處理器,與所述存儲器和所述收發器耦合;其中所述程序代碼包括指令,當所述處理器執行所述指令時,所述指令使所述網元執行以下操作:獲取用戶數據流中的上網日志;根據預設的用戶知識庫,識別所述上網日志對應的上網行為,并對所述上網日志進行語義化標注,得到標注后的上網日志;其中,所述標注后的上網日志包括用戶標識、上網時間、行為名稱和行為對象;根據所述標注后的上網日志中的上網時間和行為名稱,確定所述標注后的上網日志中的第一日志和第二日志為關聯事件;其中,所述第二日志對應的行為對象為空;根據所述關聯事件生成中間事件,所述中間事件包括所述用戶標識、所述第二日志對應的上網時間和所述第一日志對應的行為對象。所述存儲器用于存儲所述用戶知識庫和所述中間事件。本實施例的服務 器用于執行第一方面提供的基于流量分析識別用戶行為對象的方法,其實現原理和有益效果類似,此處不再贅述。第四方面,本發明的實施例提供一種存儲指令的非瞬時計算機可讀介質,所述指令可由一個或多個處理器執行以完成以下操作:獲取用戶數據流中的上網日志;根據預設的用戶知識庫,識別所述上網日志對應的上網行為,并對所述上網日志進行語義化標注,得到標注后的上網日志;其中,所述標注后的上網日志包括用戶標識、上網時間、行為名稱和行為對象;根據所述標注后的上網日志中的上網時間和行為名稱,確定所述標注后的上網日志中的第一日志和第二日志為關聯事件;其中,所述第二日志對應的行為對象為空;根據所述關聯事件生成中間事件,所述中間事件包括所述用戶標識、所述第二日志對應的上網時間和所述第一日志對應的行為對象。所述存儲器用于存儲所述用戶知識庫和所述中間事件。附圖說明為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。圖1為本發明實施例提供的基于流量分析識別用戶行為對象的方法的應用場景示意圖;圖2為本發明實施例一提供的基于流量分析識別用戶行為對象的方法的流程圖;圖3為本發明實施例二提供的基于流量分析識別用戶行為對象的方法的流程圖;圖4為本發明實施例三提供的基于流量分析識別用戶行為對象的裝置結構示意圖;圖5為本發明實施例五提供的服務器的結構示意圖。具體實施方式為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例?;诒景l明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。圖1為本發明實施例提供的基于流量分析識別用戶行為對象的方法的應用場景示意圖。如圖1所示,該場景包括數據源1、大數據中心2和行為分析,其中,行為分析可以包括時空行為分析3、通信行為分析4和互聯網行為分析5等,互聯網行為分析可以包括商務類行為分析6、社交類行為分析7等。數據源1為運營商獲取到的用戶的移動終端的數據流,例如,移動運營商通過服務GPRS支持節點(ServingGPRSSupportNode,簡稱SGSN,其中,GPRS為通用分組無線服務技術,英文全稱為GeneralPacketRadioService)與SGSN之間、以及SGSN與網關GPRS支持節點(GatewayGPRSSupportNode,簡稱GGSN)之間的Gn接口獲取到的用戶的移動終端的數據流。大數據中心2為運營商數據的集中管理控制中心,將數據源1中的數據經過加工處理,進行相關數據的匯總和存儲。行為分析是對大數據中心2中經過匯總的相關數據進行分析,獲取用戶的相關信息,例如,獲取用戶的興趣偏好信息等,后續向用戶的移動終端APP推送一些用戶感興趣的信息。本發明提供的基于流量分析識別用戶行為對象的方法主要針對用戶的商務類行為進行分析,從而研究用戶的偏好,該方法也可以用于分析用戶的其它行為,例如,社交類行為等,本發明中并不以此為限。圖2為本發明實施例一提供的基于流量分析識別用戶行為對象的方法的流程圖。本實施例的執行主體可以為運營商服務器,如圖2所示,該方法包括以下步驟:步驟101、獲取用戶數據流中的上網日志。在本實施例中,用戶數據流為運營商服務器獲取到的用戶的移動終端的數據流,例如,移動用戶A的手機上淘寶APP的上網日志。表1為本發明提供的一種上網日志的結構。如表1所示,上網日志可以包括用戶標識、統一資源定位符(UniformResourceLocator,簡稱URL)、Header(UA)、訪問時間、CellID、流量、時長等信息,其中,用戶標識可以為用戶的電話號碼、 登錄名稱等可以標識用戶的信息;URL為用戶的移動終端訪問的網站的地址;Header(UA)為上網日志的標頭,標頭(header)是服務器以超文本傳輸協議(HyperTextTransferProtocol,簡稱HTTP)協義傳輸超級文本標記語言(HyperTextMarkupLanguage,簡稱HTML)數據到瀏覽器前所送出的字串,Header(UA)中的UA為用戶代理,Header(UA)函數中包括用戶使用的瀏覽器信息,具體可以包括硬件平臺、系統軟件、應用軟件等信息;CellID表示為用戶的移動終端提供服務的小區標識,通過CellID可以定位出用戶的移動終端所在的位置;流量為用戶的移動終端訪問該網站時所使用的流量信息,訪問時間為訪問網站的起始時間,時長表示用戶的移動終端停留在該網站的持續時間,根據訪問時間和時長可以確定該上網日志的起始時間和結束時間。表1用戶標識URLHeader(UA)訪問時間CellID流量時長步驟102、根據預設的用戶知識庫,識別上網日志對應的上網行為,并對上網日志進行語義化標注,得到標注后的上網日志;其中,標注后的上網日志包括用戶標識、上網時間、行為名稱和行為對象。在本實施例中,用戶知識庫中包括URL的解析規則、關鍵字符串與行為ID之間的對應關系、行為ID與行為名稱之間的對應關系、關鍵字符串與行為對象之間的對應關系等。具體的,用戶知識庫可以包括URL解析規則庫、對象知識庫、媒體知識庫、行為知識庫;其中,URL解析規則庫用于表征URL的解析規則,例如,根據關鍵字符串解析出用戶的行為ID、行為對象的類別、媒體工具的類別等,由于URL規則解析庫解析出的是行為ID、行為對象類別、媒體工具類別,因此,需要進一步的根據對象知識庫、行為知識庫、媒體知識庫對用戶的行為名稱、具體的行為對象和媒體工具進行識別。對象知識庫用于對用戶的行為對象進行識別,例如,識別出行為對象為女裝、手機、奶粉等;媒體知識庫用于對用戶使用的媒體工具進行識別,例如,識別出用戶使用淘寶APP;行為知識庫用于對用戶的行為名稱進行識別,例如,識別出用戶的行為名稱為登錄、搜索、瀏覽、加入購物車等。需要說明的是,本實施例中,還可以根據需求在用戶知識庫中添加其他的知識庫,本發明中并不以此為限。在本實施例中,上網日志對應的上網行為至少包括行為名稱和行為對象,例如,用戶上淘寶搜索手機,則該上網日志對應的上網行為中的行為名稱為搜索,行為對象為手機。語義化標注指的是為上網日志的上網行為打標簽,例如,若根據用戶知識庫識別出上網日志對應的行為ID為10002,則行為ID對應的語義化標注為搜索商品。下面以用戶在網上購物為例,詳細說明步驟102的方案。表2為本實施例提供的一則上網日志,表2中僅示出了表1所示的上網日志中的用戶標識、訪問時間和URL,其中,用戶標識為用戶的電話號碼。表3為本實施例提供的一則標注后的上網日志。如表2所示,該上網日志中包括用戶的電話號碼、訪問該網站的訪問時間、時長和URL,其中,URL中的黑色字體為關鍵字符串,根據用戶知識庫中的URL規則解析庫對該關鍵字符串進行解析,識別出該上網日志對應的上網行為,例如,根據search.**.com可以解析出用戶的行為名稱為搜索,根據iphone6s可以獲得行為對象為iphone6s手機,如表3所示,標注后的上網日志包括用戶的手機號碼、訪問時間(為了便于說明,將訪問時間和時長等價替換成起始時間和結束時間,下同)、行為名稱和行為對象。表2表3可選地,在本實施例中,標注后的上網日中還可以包括預分類、用戶位置、APP等信息,其中,預分類用于對用戶的行為對象進行歸類,例如,該用戶關注的為母音用品、數碼產品等,用戶位置用于表示用戶的移動終端所在的位置,APP包括用戶使用的客戶端、瀏覽器等信息。步驟103、根據標注后的上網日志中的上網時間和行為名稱,確定標注后的上網日志中的第一日志和第二日志為關聯事件;其中,第二日志對應的行為對象為空。在本實施例中,如表3所示,上網時間包括起始時間和結束時間。關聯事件為行為之間具有必然聯系、且連續發生的多個事件,行為對象為空指的是根據用戶知識庫無法獲取到該上網日志對應的行為對象,由于數據隱私保護,上網日志中的URL中用于解析行為對象的關鍵字符串會缺失,因此,該上網日志對應的行為對象為空。表4為本實施例提供的一組標注后的上網日志。如表4所示,按照時間順序將這4個標注后的上網日志分別標記為事件1、事件2、事件3和事件4,根據網上購物的特點,用戶在加入購物車之前一定先瀏覽商品,因此,瀏覽商品與加入購物車之間具有必然聯系,并且,事件3和事件4為兩個連續發生的事件,因此,事件3和事件4為關聯事件,其中,由于經過數據加密,無法根據上網日志識別出加入購物車的行為對象。表4步驟104、根據關聯事件生成中間事件,中間事件包括用戶標識、第二日志對應的上網時間和第一日志對應的行為對象。在本實施例中,中間事件用于研究用戶的偏好信息,根據中間事件,可以研究用戶在某個時期的興趣偏好,從而后續為用戶推送相關的信息。例如,如表4所示,第一日志為事件3,第二日志為事件4,則該中間事件中的用戶標識為電話號碼15300000123,上網時間為2014111020:05:04-2014111020:07:08,行為對象為iphone6s,則根據該中間事件可知用戶在2014年11月10日關注了iphone6s手機,后續可以為該用戶的電話號碼為15300000123的手機上的淘寶、京東等購物類APP推送有關iphone6s手機的相關信息。本實施例提供的基于流量分析識別用戶行為對象的方法,運營商服務器獲取用戶數據流中的日志,根據預設的用戶知識庫,識別上網日志對應的上網行為,并對上網日志進行語義化標注,得到包括用戶標識、上網時間、行為名稱和行為對象的標注后的上網日志,根據標注后的上網日志中的上網時間和行為名稱,確定標注后的上網日志中的第一日志和第二日志為關聯事件,再根據關聯事件生成中間事件,使得運營商通過分析中間事件中的行為對象,研究用戶的興趣偏好,并根據用戶的興趣偏好為用戶提供數據業務,從而提高數據業務的服務質量。圖3為本發明實施例二提供的基于流量分析識別用戶行為對象的方法的流程圖。圖3為圖2所示實施例的一種具體實現方式,主要涉及圖2所示實施例中的步驟102和步驟103的具體實現方式,如圖3所示,該方法包括以下步驟:步驟201、獲取用戶數據流中的上網日志。在本實施例中,步驟201和圖2所示實施例中的步驟101的實現原理相同,此處不再贅述。可選地,上網日志為商務類上網日志。在本實施例中,可以對用戶數據流中的上網日志進行篩選,獲取用戶數據流中的商務類上網日志,例如,可以篩選出用戶A的手機上淘寶、天貓、京東等APP的上網日志,從而針對用戶的商務類上網日志進行分析??蛇x地,在本實施例中,預設的用戶知識庫包括URL解析規則庫、行為知識庫和對象知識庫;則圖2所示實施例中的步驟102的具體實現方法包括 步驟202至步驟205。步驟202、根據URL解析規則庫,解析上網日志,識別上網日志對應的上網行為。在本實施例中,URL解析庫用于存儲URL的解析規則,該解析規則具體可以包括不同的關鍵字符串與不同的行為ID或者行為對象類別之間的對應關系。以表2為例,可以基于http://、?、&等特殊標識來識別關鍵字符串,根據URL解析庫解析關鍵字符串search.**.com可以獲得對應的行為ID為10001,解析關鍵字符串mobileSearch可以獲知對應的行為對象類別為手機等。步驟203、根據上網日志對應的上網行為和行為知識庫,確定上網日志對應的行為名稱。在本實施例中,該行為知識庫中保存了行為ID與行為名稱之間的對應關系,用于識別上網日志對應的行為名稱,表5為本發明提供的一種商務類行為知識庫。參照表2和表5,根據表2中的URL中的關鍵字符串search.**.com解析出的行為ID為10001,則根據行為知識庫確定該上網日志對應的行為名稱為登錄。表5步驟204、根據上網日志的上網行為和和對象知識庫,確定上網日志對應的行為對象。在本實施例中,對象知識庫用于識別上網日志對應的具體的行為對象,由于根據URL規則解析庫識別出行為對象的預分類,還需要根據對 象知識庫進一步地識別用戶關注的具體的商品信息。例如,URL解析庫識別出用戶關注商品的類別為手機、母嬰產品、食品等,在表2所示的上網日志中,URL規則解析庫通過關鍵字符串mobileSearch識別出用戶關注的商品類別為手機,對象知識庫根據iphone6s識別出用戶搜索的商品具體為iphone6s手機。步驟205、將確定的行為名稱和行為對象,添加到上網日志中生成標注后的上網日志。在本實施例中,根據確定的行為名稱和行為對象對上網日志進行語義化標注,形成標注后的上網日志,標注后的上網日志的形式如表4所示??蛇x地,圖2所示實施例中的步驟103的實現方法可以包括步驟206和步驟207。步驟206、根據第二日志對應的行為名稱,確定第二日志為關鍵事件。在本實施例中,關鍵事件為用于決定用戶偏好的事件,例如,用戶在網上購物時,如果將某件商品加入購物車或者提交訂單,則說明用戶需要或者喜歡這件商品,因此,根據加入購物車或者提交訂單對應的商品信息可以確定用戶的偏好。步驟207、根據第一日志對應的上網時間和第二日志對應的上網時間,確定第一日志和第二日志為連續產生的上網日志。在本實施例中,確定關聯事件不僅包括確定關鍵事件,還需要確定第一日志和第二日志為連續產生的上網日志。如表4所示,確定加入購物車對應的標注后的上網日志為關鍵事件之后,根據標注后的上網日志的時間,可知,第三條標注后的上網日志和第四條標注后的上網日志為兩條連續產生的上網日志,因此,第三條標注后的上網日志和第四條標注后的上網日志為關聯事件??蛇x地,若以網上購物為例,由于在加入購物車或者提交訂單之前,用戶必然先進行瀏覽,查看商品信息,則在本實施例中,第一日志對應的行為名稱為瀏覽,第二日志對應的行為名稱為加入購物車或者提交訂單。步驟208、根據關聯事件生成中間事件,中間事件包括用戶標識、第二日志對應的上網時間和第一日志對應的行為對象。在本實施例中,步驟208的方法實現原理與圖2所示實施例中的步驟104 的方法實現原理相同,此處不再贅述。本實施例提供的基于流量分析識別用戶行為對象的方法,運營商服務器獲取用戶數據流中的日志,根據URL解析規則庫,解析上網日志,識別上網日志對應的上網行為,并根據上網日志對應的上網行為、行為知識庫、對象知識庫分別確定上網日志對應的行為名稱和行為對象,將確定的行為名稱和行為對象,添加到上網日志中,生成標注后的上網日志,并根據標注后的上網日志中第二日志對應的行為名稱,確定第二日志為關鍵事件,根據第一日志對應的上網時間和第二日志對應的上網時間,且確定第一日志和第二日志為連續產生的上網日志,從而確定第一日志和第二日志為關聯事件,根據關聯事件生成中間事件,使得運營商通過分析中間事件中的行為對象,研究用戶的興趣偏好,并根據用戶的興趣偏好為用戶提供數據業務,從而提高數據業務的服務質量。可選地,在上述圖2或圖3所示實施例的基礎上,得到標注后的上網日志之后,還可以包括:根據上網日志對應的行為名稱,從標注后的上網日志中提取目標事件,則根據標注后的上網日志中的上網時間和行為名稱,確定標注后的上網日志中的第一日志和第二日志為關聯事件,具體為:根據標注后的上網日志中的上網時間和行為名稱,確定目標事件中的第一日志和第二日志為關聯事件。在本實施例中,目標事件為各行為之間相關聯、且能決定用戶偏好的多個事件。例如,以網上購物為例,目標事件可以包括搜索商品、瀏覽商品、加入購物車、提交訂單、確認收貨等事件,從而僅對目標事件進行分析,能更快速度的確定關聯事件,提高識別用戶行為對象的效率??蛇x地,從標注后的上網日志中提取目標事件之后,還可以包括:將預設時間周期內的用戶數據流劃分多個數據流分段,其中,每個數據流分段均以關鍵事件作為數據流的終點。在本實施例中,可以以加入購物車、提交訂單等關鍵事件作為每個數據流的終點,將一天的用戶數據流劃分為多個數據流,這樣劃分出來的每段數據流可以看作分別以加入購物車、提交訂單等事件為特征的數據段,最終起到對數據流近似”歸類”的作用,方便對用戶數據流進行管理。圖4為本發明實施例三提供的基于流量分析識別用戶行為對象的裝置結 構示意圖。如圖4所示,該裝置包括獲取模塊11、識別模塊12、確定模塊13和生成模塊14。獲取模塊11用于獲取用戶數據流中的上網日志。識別模塊12用于根據預設的用戶知識庫,識別上網日志對應的上網行為,并對上網日志進行語義化標注,得到標注后的上網日志;其中,標注后的上網日志包括用戶標識、上網時間、行為名稱和行為對象。確定模塊13用于根據標注后的上網日志中的上網時間和行為名稱,確定標注后的上網日志中的第一日志和第二日志為關聯事件;其中,第二日志對應的行為對象為空。生成模塊14用于根據關聯事件生成中間事件,中間事件包括用戶標識、第二日志對應的上網時間和第一日志對應的行為對象。本實施例的裝置,可以用于執行圖2所示方法實施例的技術方案,其實現原理和技術效果類似,此處不再贅述。在圖4所示實施例的基礎上,在本發明實施例四提供的基于流量分析識別用戶行為對象的裝置中,確定模塊13具體用于根據第二日志對應的行為名稱,確定第二日志為關鍵事件;并根據第一日志對應的上網時間和第二日志對應的上網時間,確定第一日志和第二日志為連續產生的上網日志??蛇x地,預設的用戶知識庫包括URL解析規則庫、行為知識庫和對象知識庫。識別模塊12具體用于根據URL解析規則庫,解析上網日志,識別上網日志對應的上網行為;根據上網日志對應的的上網行為和行為知識庫,確定上網日志對應的行為名稱;根據上網日志對應的上網行為和和對象知識庫,確定上網日志對應的行為對象;將確定的行為名稱和行為對象,添加到上網日志中生成標注后的上網日志??蛇x地,上網日志為商務類上網日志??蛇x地,第一日志對應的行為名稱為瀏覽,第二日志對應的行為名稱為加入購物車或者提交訂單。本實施例的裝置,可以用于執行圖3所示方法實施例的技術方案,其實現原理和技術效果類似,此處不再贅述。圖5為本發明實施例五提供的服務器的結構示意圖。所述服務器包含一個或多個端口508,與收發器(transceiver)506相耦合。收發器506可以是發射器,接收器或其組合,從其他網絡節點通過端口508發送或接收數據包。處理器502耦合到收發器506,用于處理數據包。處理器502可包含一個或多 個多核處理器和/或存儲器504。處理器502可以是一個通用處理器,專用集成電路(applicationspecificintegratedcircuit,ASIC),或數字信號處理器(DSP)。存儲器504可為非瞬時性的存儲介質,與處理器502相耦合,用于保存不同類型的數據。存儲器504可包含只讀存儲器(readonlymemory,ROM),隨機存取存儲器(randomaccessmemory,RAM)或者可存儲信息和指令的其他類型的動態存儲設備,也可以是磁盤存儲器。存儲器504可用于保存實現圖2或圖3所述相關方法的指令。另一個實施例中,服務器包括存儲器504,處理器502和收發器506以及與收發器耦合的一個或多個端口508。存儲器504,用于存儲計算機可執行程序代碼;處理器502與所述存儲器504和所述收發器506耦合;其中所述程序代碼包括指令,當所述處理器執行所述指令時,所述指令使所述網元執行以下操作:獲取用戶數據流中的上網日志;根據預設的用戶知識庫,識別所述上網日志對應的上網行為,并對所述上網日志進行語義化標注,得到標注后的上網日志;其中,所述標注后的上網日志包括用戶標識、上網時間、行為名稱和行為對象;根據所述標注后的上網日志中的上網時間和行為名稱,確定所述標注后的上網日志中的第一日志和第二日志為關聯事件;其中,所述第二日志對應的行為對象為空;根據所述關聯事件生成中間事件,所述中間事件包括所述用戶標識、所述第二日志對應的上網時間和所述第一日志對應的行為對象。本實施例的服務,可以用于執行圖2或3所示方法實施例的技術方案,其實現原理和技術效果類似,此處不再贅述。本領域普通技術人員可以理解:實現上述各方法實施例的全部或部分步驟可以通過程序指令相關的硬件來完成。前述的程序可以存儲于一計算機可讀取存儲介質中。該程序在執行時,執行包括上述各方法實施例的步驟;而前述的存儲介質包括:只讀存儲器(Read-OnlyMemory,簡稱ROM)、隨機存取存儲器(randomaccessmemory,簡稱RAM)、磁碟或者光盤等各種可以存儲程序代碼的介質。最后應說明的是:以上各實施例僅用以說明本發明的技術方案,而非對 其限制;盡管參照前述各實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分或者全部技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發明各實施例技術方案的范圍。當前第1頁1 2 3