本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種對用戶登錄進(jìn)行風(fēng)險評估的方法及裝置。
背景技術(shù):
用戶登錄:大型網(wǎng)站會有很多用戶,用戶為了使用自己在網(wǎng)站上的賬號所需要的確認(rèn)身份的操作叫做登錄。
登錄日志中含有很多信息,如登錄時間,登錄方式,登錄設(shè)備,登錄地址,登錄瀏覽器,登錄請求時長,登錄結(jié)果,登錄賬號等信息。把同一賬號的登錄信息全部存儲在數(shù)據(jù)庫里。當(dāng)用戶登錄時,在數(shù)據(jù)庫里取日志,然后逐個比對當(dāng)前登錄日志和取出的日志。并依此判定此次登錄是否異常。
現(xiàn)有技術(shù)對于賬號a,在數(shù)據(jù)庫中以a為表名存儲其所有登錄日志。每次當(dāng)a登錄時,從數(shù)據(jù)庫中取出所有日志,并將此次日志l和數(shù)據(jù)庫日志逐條逐字段比對。對每個字段設(shè)定一個臨界值(c1,c2,c3….),當(dāng)l中的一個字段在數(shù)據(jù)庫日志對應(yīng)字段中出現(xiàn)的比例低于臨界值時,將此字段判定為異常。如此判斷所有字段,若異常的字段占字段總數(shù)的比例高于總臨界值c時則此次登錄判定為異常。
現(xiàn)有技術(shù)需要從數(shù)據(jù)庫中取出所有日志,這對于龐大的賬號系統(tǒng)的網(wǎng)站是不可接受的,因為此操作極為耗時。在判定過程中需要遍歷所有日志也很耗時。且此方法過于依賴人為設(shè)定的臨界值(c,c1,c2…),導(dǎo)致自動化程度不夠高,響應(yīng)不夠及時。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供一種對用戶登錄進(jìn)行風(fēng)險評估的方法及裝置,以加速用戶登錄風(fēng)險評估的速度,同時提高用戶登錄風(fēng)險評估的自動化程度。
一方面,本發(fā)明實施例提供了一種對用戶登錄進(jìn)行風(fēng)險評估的方法,所述方法包括:
獲取用戶當(dāng)前登錄的日志數(shù)據(jù);
根據(jù)所述用戶當(dāng)前登錄的日志數(shù)據(jù),獲取用戶唯一身份標(biāo)志uid和用戶當(dāng)前登錄的屬性字段信息;
根據(jù)獲取的所述uid,從數(shù)據(jù)庫中獲取所述uid對應(yīng)的預(yù)設(shè)用戶模型,所述預(yù)設(shè)用戶模型中存儲有所述uid對應(yīng)的若干屬性字段;
利用所述用戶當(dāng)前登錄的屬性字段信息和所述預(yù)設(shè)用戶模型中的相應(yīng)屬性字段,獲取所述用戶當(dāng)前登錄的風(fēng)險系數(shù);
根據(jù)所述用戶當(dāng)前登錄的風(fēng)險系數(shù)對所述用戶當(dāng)前登錄進(jìn)行風(fēng)險評估。
另一方面,本發(fā)明實施例提供了一種對用戶登錄進(jìn)行風(fēng)險評估的裝置,所述裝置包括:
日志數(shù)據(jù)獲取單元,用于獲取用戶當(dāng)前登錄的日志數(shù)據(jù);
屬性字段獲取單元,用于根據(jù)所述用戶當(dāng)前登錄的日志數(shù)據(jù),獲取用戶唯一身份標(biāo)志uid和用戶當(dāng)前登錄的屬性字段信息;
用戶模型獲取單元,用于根據(jù)獲取的所述uid,從數(shù)據(jù)庫中獲取所述uid對應(yīng)的預(yù)設(shè)用戶模型,所述預(yù)設(shè)用戶模型中存儲有所述uid對應(yīng)的若干屬性字段;
風(fēng)險系數(shù)獲取單元,用于利用所述用戶當(dāng)前登錄的屬性字段信息和所述預(yù)設(shè)用戶模型中的相應(yīng)屬性字段,獲取所述用戶當(dāng)前登錄的風(fēng)險系數(shù);
風(fēng)險評估單元,用于根據(jù)所述用戶當(dāng)前登錄的風(fēng)險系數(shù)對所述用戶當(dāng)前登錄進(jìn)行風(fēng)險評估。
上述技術(shù)方案具有如下有益效果:數(shù)據(jù)庫需要存儲的僅僅是每個用戶的用戶模型,所需要的存儲空間大大減小,并且風(fēng)險評估的過程大大提速了,還實現(xiàn)了自動化的風(fēng)險評估和判斷。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例一種對用戶登錄進(jìn)行風(fēng)險評估的方法流程圖;
圖2為本發(fā)明實施例一種對用戶登錄進(jìn)行風(fēng)險評估的裝置結(jié)構(gòu)示意圖;
圖3為本發(fā)明實施例另一種對用戶登錄進(jìn)行風(fēng)險評估的裝置結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
如圖1所示,為本發(fā)明實施例一種對用戶登錄進(jìn)行風(fēng)險評估的方法流程圖,所述方法包括:
101、獲取用戶當(dāng)前登錄的日志數(shù)據(jù);
102、根據(jù)所述用戶當(dāng)前登錄的日志數(shù)據(jù),獲取用戶唯一身份標(biāo)志uid和用戶當(dāng)前登錄的屬性字段信息;
103、根據(jù)獲取的所述uid,從數(shù)據(jù)庫中獲取所述uid對應(yīng)的預(yù)設(shè)用戶模型,所述預(yù)設(shè)用戶模型中存儲有所述uid對應(yīng)的若干屬性字段;
104、利用所述用戶當(dāng)前登錄的屬性字段信息和所述預(yù)設(shè)用戶模型中的相應(yīng)屬性字段,獲取所述用戶當(dāng)前登錄的風(fēng)險系數(shù);
105、根據(jù)所述用戶當(dāng)前登錄的風(fēng)險系數(shù)對所述用戶當(dāng)前登錄進(jìn)行風(fēng)險評估。
優(yōu)選地,所述屬性字段包括如下之一或者任意組合:登錄入口、登錄設(shè)備、登錄時間、登錄方式、登錄地址、登錄瀏覽器、登錄請求時長、登錄結(jié)果、登錄賬號。
優(yōu)選地,所述uid對應(yīng)的預(yù)設(shè)用戶模型中還存儲有每一個屬性字段包括的各屬性字段分類項及其比重值。
優(yōu)選地,所述利用所述用戶當(dāng)前登錄的屬性字段信息和所述預(yù)設(shè)用戶模型中的相應(yīng)屬性字段,獲取所述用戶當(dāng)前登錄的風(fēng)險系數(shù),包括:
針對所述用戶當(dāng)前登錄的每一個屬性字段信息,在所述預(yù)設(shè)用戶模型的相應(yīng)屬性字段中查找對應(yīng)的屬性字段分類項及其比重值,使用查找到的比重值除以所述預(yù)設(shè)用戶模型中的相應(yīng)屬性字段包括的所有屬性字段分類項的比重值之和,得到所述屬性字段分類項的分?jǐn)?shù);
計算所述用戶當(dāng)前登錄的所有屬性字段信息分別對應(yīng)的各屬性字段分類項的分?jǐn)?shù)平均值,將該分?jǐn)?shù)平均值作為所述用戶當(dāng)前登錄的風(fēng)險系數(shù)。
優(yōu)選地,所述方法還包括:根據(jù)所述用戶當(dāng)前登錄的日志數(shù)據(jù)對數(shù)據(jù)庫中對應(yīng)的預(yù)設(shè)用戶模型進(jìn)行更新,包括:根據(jù)所述用戶當(dāng)前登錄的屬性字段信息在所述預(yù)設(shè)用戶模型的相應(yīng)屬性字段中查找對應(yīng)的屬性字段分類項及其比重值,將查找到的比重值加1,并將該相應(yīng)屬性字段包括的所有屬性字段分類項的比重值乘以預(yù)設(shè)的權(quán)重系數(shù)。
對應(yīng)于上述方法實施例,如圖2所示,為本發(fā)明實施例一種對用戶登錄進(jìn)行風(fēng)險評估的裝置結(jié)構(gòu)示意圖,所述裝置包括:
日志數(shù)據(jù)獲取單元21,用于獲取用戶當(dāng)前登錄的日志數(shù)據(jù);
屬性字段獲取單元22,用于根據(jù)所述用戶當(dāng)前登錄的日志數(shù)據(jù),獲取用戶唯一身份標(biāo)志uid和用戶當(dāng)前登錄的屬性字段信息;
用戶模型獲取單元23,用于根據(jù)獲取的所述uid,從數(shù)據(jù)庫中獲取所述uid對應(yīng)的預(yù)設(shè)用戶模型,所述預(yù)設(shè)用戶模型中存儲有所述uid對應(yīng)的若干屬性字段;
風(fēng)險系數(shù)獲取單元24,用于利用所述用戶當(dāng)前登錄的屬性字段信息和所述預(yù)設(shè)用戶模型中的相應(yīng)屬性字段,獲取所述用戶當(dāng)前登錄的風(fēng)險系數(shù);
風(fēng)險評估單元25,用于根據(jù)所述用戶當(dāng)前登錄的風(fēng)險系數(shù)對所述用戶當(dāng)前登錄進(jìn)行風(fēng)險評估。
優(yōu)選地,所述屬性字段包括如下之一或者任意組合:登錄入口、登錄設(shè)備、登錄時間、登錄方式、登錄地址、登錄瀏覽器、登錄請求時長、登錄結(jié)果、登錄賬號。
優(yōu)選地,所述uid對應(yīng)的預(yù)設(shè)用戶模型中還存儲有每一個屬性字段包括的各屬性字段分類項及其比重值。
優(yōu)選地,所述風(fēng)險系數(shù)獲取單元24,具體用于針對所述用戶當(dāng)前登錄的每一個屬性字段信息,在所述預(yù)設(shè)用戶模型的相應(yīng)屬性字段中查找對應(yīng)的屬性字段分類項及其比重值,使用查找到的比重值除以所述預(yù)設(shè)用戶模型中的相應(yīng)屬性字段包括的所有屬性字段分類項的比重值之和,得到所述屬性字段分類項的分?jǐn)?shù);計算所述用戶當(dāng)前登錄的所有屬性字段信息分別對應(yīng)的各屬性字段分類項的分?jǐn)?shù)平均值,將該分?jǐn)?shù)平均值作為所述用戶當(dāng)前登錄的風(fēng)險系數(shù)。
優(yōu)選地,如圖3所示,為本發(fā)明實施例另一種對用戶登錄進(jìn)行風(fēng)險評估的裝置結(jié)構(gòu)示意圖,所述裝置還包括:用戶模型更新單元26,用于根據(jù)所述用戶當(dāng)前登錄的日志數(shù)據(jù)對數(shù)據(jù)庫中對應(yīng)的預(yù)設(shè)用戶模型進(jìn)行更新,具體用于根據(jù)所述用戶當(dāng)前登錄的屬性字段信息在所述預(yù)設(shè)用戶模型的相應(yīng)屬性字段中查找對應(yīng)的屬性字段分類項及其比重值,將查找到的比重值加1,并將該相應(yīng)屬性字段包括的所有屬性字段分類項的比重值乘以預(yù)設(shè)的權(quán)重系數(shù)。
上述技術(shù)方案具有如下有益效果:數(shù)據(jù)庫需要存儲的僅僅是每個用戶的用戶模型,所需要的存儲空間大大減小,并且風(fēng)險評估的過程大大提速了,還實現(xiàn)了自動化的風(fēng)險評估和判斷。
以下通過應(yīng)用實例對本發(fā)明實施例進(jìn)行詳細(xì)說明:
在大型網(wǎng)站的賬號系統(tǒng)中我們不能全部取用日志,要想辦法提高做出判斷的速度和準(zhǔn)確度,并且還要提升自動化的程度。因此精煉數(shù)據(jù)所得的用戶模型便是一個很好的選擇。
本發(fā)明應(yīng)用實例對于每個用戶,構(gòu)建用戶唯一身份標(biāo)志(uid)為主鍵的用戶模型并存儲于數(shù)據(jù)庫中。用戶模型是不斷在變化的。每時每刻都在產(chǎn)生的流式的登錄日志,經(jīng)篩選產(chǎn)生登錄日志,并依據(jù)一定的算法,可以利用用戶模型和當(dāng)次登錄數(shù)據(jù)來更新模型。當(dāng)有需要判斷是否為惡意登錄的登錄數(shù)據(jù)的時候,從數(shù)據(jù)庫里讀取用戶模型并根據(jù)用戶模型和數(shù)據(jù)按照一定數(shù)學(xué)規(guī)則運算來得到判斷結(jié)果。
若登錄日志里有uid,及本次登錄的登錄入口,登錄設(shè)備兩個用戶當(dāng)前登錄的屬性字段信息。則用戶模型的結(jié)構(gòu)可以是這樣的結(jié)構(gòu):
這是用戶模型的一個可能的結(jié)構(gòu)。首先存儲了uid,所述uid對應(yīng)的預(yù)設(shè)用戶模型中還存儲有每一個屬性字段包括的各屬性字段分類項及其比重值。在entry(入口)項里存儲使用過的各個登錄入口及其比重值(如郵箱登錄的比重值為32.2,而使用app登錄的比重值只有0.6)。接下來存儲最近登錄的設(shè)備信息及其比重值。
如何構(gòu)建這樣的用戶模型呢?首先對流式登錄日志篩選,符合條件的登錄數(shù)據(jù)被寫成{uid:23142,entry:mail,device:pc}的形式。然后根據(jù)uid讀取數(shù)據(jù)庫中的預(yù)設(shè)用戶模型,若沒有預(yù)設(shè)用戶模型則新建。如此次登錄的entry是mail,則在預(yù)設(shè)用戶模型里entry中的mail的值加1(沒有則新建mail:1),然后再對entry中的所有值乘以0.995(權(quán)重系數(shù));這一步是為了讓用戶最近的登錄的重要性大于很早以前的登錄,并且也有控制數(shù)據(jù)規(guī)模的作用。以此方法處理device,再存儲預(yù)設(shè)用戶模型至數(shù)據(jù)庫,完成更新操作。
風(fēng)險評估的辦法:根據(jù)用戶當(dāng)前登錄的日志數(shù)據(jù),獲取用戶唯一身份標(biāo)志uid和用戶當(dāng)前登錄的屬性字段信息,把要評估的數(shù)據(jù)寫成{uid:23142,entry:app,device:galaxys7}的形式。從數(shù)據(jù)庫里讀取uid對應(yīng)的預(yù)設(shè)用戶模型(如上述的預(yù)設(shè)用戶模型,所述預(yù)設(shè)用戶模型中存儲有所述uid對應(yīng)的若干屬性字段);利用所述用戶當(dāng)前登錄的屬性字段信息和所述預(yù)設(shè)用戶模型中的相應(yīng)屬性字段,獲取所述用戶當(dāng)前登錄的風(fēng)險系數(shù):對entry字段比對:這次登錄的entry是app,則在預(yù)設(shè)用戶模型entry項里找到app對應(yīng)的比重值0.6,再用0.6除以entry下所有比重值的和:0.6/(32.2+2.1+0.6)=0.0017(分)。計算所述用戶當(dāng)前登錄的所有屬性字段信息對應(yīng)的屬性字段分類項的分?jǐn)?shù)平均值,將該分?jǐn)?shù)平均值作為所述用戶當(dāng)前登錄的風(fēng)險系數(shù):對device項做同樣的操作得到entry分?jǐn)?shù):40.4/(75.9+40+40.4)=0.2584(分),然后將所有分?jǐn)?shù)的平均值作為所述用戶當(dāng)前登錄的風(fēng)險系數(shù)(0.1301)。最后,根據(jù)所述用戶當(dāng)前登錄的風(fēng)險系數(shù)對所述用戶當(dāng)前登錄進(jìn)行風(fēng)險評估:風(fēng)險系數(shù)越接近0則風(fēng)險越大,反之,風(fēng)險系數(shù)越大則風(fēng)險越小。
由于流式日志的速度很快,量很大,每個用戶的模型將是一個逐漸完善的過程,模型建立的時間越長,則風(fēng)險評估的越準(zhǔn)確。
本發(fā)明應(yīng)用實例技術(shù)方案帶來的有益效果:在本方法中,數(shù)據(jù)庫需要存儲的僅僅是每個用戶的用戶模型,所需要的存儲空間大大減小,并且風(fēng)險評估的過程大大提速了,還實現(xiàn)了自動化的風(fēng)險評估和判斷。
應(yīng)該明白,公開的過程中的步驟的特定順序或?qū)哟问鞘纠苑椒ǖ膶嵗;谠O(shè)計偏好,應(yīng)該理解,過程中的步驟的特定順序或?qū)哟慰梢栽诓幻撾x本公開的保護(hù)范圍的情況下得到重新安排。所附的方法權(quán)利要求以示例性的順序給出了各種步驟的要素,并且不是要限于所述的特定順序或?qū)哟巍?/p>
在上述的詳細(xì)描述中,各種特征一起組合在單個的實施方案中,以簡化本公開。不應(yīng)該將這種公開方法解釋為反映了這樣的意圖,即,所要求保護(hù)的主題的實施方案需要比清楚地在每個權(quán)利要求中所陳述的特征更多的特征。相反,如所附的權(quán)利要求書所反映的那樣,本發(fā)明處于比所公開的單個實施方案的全部特征少的狀態(tài)。因此,所附的權(quán)利要求書特此清楚地被并入詳細(xì)描述中,其中每項權(quán)利要求獨自作為本發(fā)明單獨的優(yōu)選實施方案。
為使本領(lǐng)域內(nèi)的任何技術(shù)人員能夠?qū)崿F(xiàn)或者使用本發(fā)明,上面對所公開實施例進(jìn)行了描述。對于本領(lǐng)域技術(shù)人員來說;這些實施例的各種修改方式都是顯而易見的,并且本文定義的一般原理也可以在不脫離本公開的精神和保護(hù)范圍的基礎(chǔ)上適用于其它實施例。因此,本公開并不限于本文給出的實施例,而是與本申請公開的原理和新穎性特征的最廣范圍相一致。
上文的描述包括一個或多個實施例的舉例。當(dāng)然,為了描述上述實施例而描述部件或方法的所有可能的結(jié)合是不可能的,但是本領(lǐng)域普通技術(shù)人員應(yīng)該認(rèn)識到,各個實施例可以做進(jìn)一步的組合和排列。因此,本文中描述的實施例旨在涵蓋落入所附權(quán)利要求書的保護(hù)范圍內(nèi)的所有這樣的改變、修改和變型。此外,就說明書或權(quán)利要求書中使用的術(shù)語“包含”,該詞的涵蓋方式類似于術(shù)語“包括”,就如同“包括,”在權(quán)利要求中用作銜接詞所解釋的那樣。此外,使用在權(quán)利要求書的說明書中的任何一個術(shù)語“或者”是要表示“非排它性的或者”。
本領(lǐng)域技術(shù)人員還可以了解到本發(fā)明實施例列出的各種說明性邏輯塊(illustrativelogicalblock),單元,和步驟可以通過電子硬件、電腦軟件,或兩者的結(jié)合進(jìn)行實現(xiàn)。為清楚展示硬件和軟件的可替換性(interchangeability),上述的各種說明性部件(illustrativecomponents),單元和步驟已經(jīng)通用地描述了它們的功能。這樣的功能是通過硬件還是軟件來實現(xiàn)取決于特定的應(yīng)用和整個系統(tǒng)的設(shè)計要求。本領(lǐng)域技術(shù)人員可以對于每種特定的應(yīng)用,可以使用各種方法實現(xiàn)所述的功能,但這種實現(xiàn)不應(yīng)被理解為超出本發(fā)明實施例保護(hù)的范圍。
本發(fā)明實施例中所描述的各種說明性的邏輯塊,或單元都可以通過通用處理器,數(shù)字信號處理器,專用集成電路(asic),現(xiàn)場可編程門陣列或其它可編程邏輯裝置,離散門或晶體管邏輯,離散硬件部件,或上述任何組合的設(shè)計來實現(xiàn)或操作所描述的功能。通用處理器可以為微處理器,可選地,該通用處理器也可以為任何傳統(tǒng)的處理器、控制器、微控制器或狀態(tài)機(jī)。處理器也可以通過計算裝置的組合來實現(xiàn),例如數(shù)字信號處理器和微處理器,多個微處理器,一個或多個微處理器聯(lián)合一個數(shù)字信號處理器核,或任何其它類似的配置來實現(xiàn)。
本發(fā)明實施例中所描述的方法或算法的步驟可以直接嵌入硬件、處理器執(zhí)行的軟件模塊、或者這兩者的結(jié)合。軟件模塊可以存儲于ram存儲器、閃存、rom存儲器、eprom存儲器、eeprom存儲器、寄存器、硬盤、可移動磁盤、cd-rom或本領(lǐng)域中其它任意形式的存儲媒介中。示例性地,存儲媒介可以與處理器連接,以使得處理器可以從存儲媒介中讀取信息,并可以向存儲媒介存寫信息。可選地,存儲媒介還可以集成到處理器中。處理器和存儲媒介可以設(shè)置于asic中,asic可以設(shè)置于用戶終端中。可選地,處理器和存儲媒介也可以設(shè)置于用戶終端中的不同的部件中。
在一個或多個示例性的設(shè)計中,本發(fā)明實施例所描述的上述功能可以在硬件、軟件、固件或這三者的任意組合來實現(xiàn)。如果在軟件中實現(xiàn),這些功能可以存儲與電腦可讀的媒介上,或以一個或多個指令或代碼形式傳輸于電腦可讀的媒介上。電腦可讀媒介包括電腦存儲媒介和便于使得讓電腦程序從一個地方轉(zhuǎn)移到其它地方的通信媒介。存儲媒介可以是任何通用或特殊電腦可以接入訪問的可用媒體。例如,這樣的電腦可讀媒體可以包括但不限于ram、rom、eeprom、cd-rom或其它光盤存儲、磁盤存儲或其它磁性存儲裝置,或其它任何可以用于承載或存儲以指令或數(shù)據(jù)結(jié)構(gòu)和其它可被通用或特殊電腦、或通用或特殊處理器讀取形式的程序代碼的媒介。此外,任何連接都可以被適當(dāng)?shù)囟x為電腦可讀媒介,例如,如果軟件是從一個網(wǎng)站站點、服務(wù)器或其它遠(yuǎn)程資源通過一個同軸電纜、光纖電纜、雙絞線、數(shù)字用戶線(dsl)或以例如紅外、無線和微波等無線方式傳輸?shù)囊脖话谒x的電腦可讀媒介中。所述的碟片(disk)和磁盤(disc)包括壓縮磁盤、鐳射盤、光盤、dvd、軟盤和藍(lán)光光盤,磁盤通常以磁性復(fù)制數(shù)據(jù),而碟片通常以激光進(jìn)行光學(xué)復(fù)制數(shù)據(jù)。上述的組合也可以包含在電腦可讀媒介中。
以上所述的具體實施方式,對本發(fā)明的目的、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步詳細(xì)說明,所應(yīng)理解的是,以上所述僅為本發(fā)明的具體實施方式而已,并不用于限定本發(fā)明的保護(hù)范圍,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。