本發明涉及數據處理,特別是涉及一種確定同一用戶的方法、介質及設備。
背景技術:
1、隨著移動互聯網的迅猛發展,用戶的數字生活已經跨越了單一設備單一服務平臺的界限,延伸至多種設備、多個服務平臺之上,使得用戶在多個服務平臺上的活動日益頻繁,其中,每個服務平臺都擁有多個數據端口,以滿足用戶在不同場景下的登錄和使用需求,為了確保用戶在不同數據端口的體驗連貫性和數據一致性,進行跨端口進行同一用戶技術識別成為移動互聯網時代不可或缺的一項關鍵技術,它不僅能夠保障用戶基于同一服務平臺在不同數據端口之間的體驗連貫性和數據一致性,還能夠為服務提供商提供全面的用戶畫像和行為分析數據,因此基于不同數據端的數據確認同一用戶成為當下亟需解決的問題。
技術實現思路
1、針對上述技術問題,本發明采用的技術方案為一種確定同一用戶的方法,所述方法包括如下步驟:
2、獲取目標服務平臺對應的目標關聯數據列表,其中,所述目標關聯數據列表包括若干個目標關聯數據,所述目標關聯數據為通過目標服務平臺對應的多個數據端口上傳的數據。
3、根據目標關聯數據列表,獲取第一目標數據列表,其中,所述第一目標數據列表包括若干個第一目標數據,所述第一目標數據為從目標關聯數據列表中獲取到的存在指定標識的目標關聯數據。
4、基于第一目標數據列表,將第一目標數據列表中指定標識一致的所有第一目標數據對應的目標用戶進行關聯以確定關聯用戶,關聯用戶用于表示相關聯的用戶為同一用戶。
5、根據目標關聯數據列表,獲取第二目標數據列表,其中,所述第二目標數據列表包括若干個第二目標數據,所述第二目標數據為從目標關聯數據列表中獲取到的不存在指定標識的目標關聯數據。
6、在第一目標數據列表和第二目標數據列表的基礎上,若第二目標數據中包括的若干個特征數據和一第一目標數據中包括的若干個對應特征數據符合預設對比規則,則將該第二目標數據對應的用戶和該第一目標數據對應的用戶確定為關聯用戶。
7、本發明還提供了一種非瞬時性計算機可讀存儲介質,所述非瞬時性計算機可讀存儲介質中存儲有至少一條指令或至少一段程序,至少一條指令或至少一段程序由處理器加載并執行以實現上述的確定同一用戶的方法。
8、本發明還提供了一種電子設備,包括處理器和上述的非瞬時性計算機可讀存儲介質。
9、本發明至少具有以下有益效果:獲取目標服務平臺對應的目標關聯數據列表,根據目標關聯數據列表,獲取第一目標數據列表,基于第一目標數據列表,將第一目標數據列表中指定標識一致的所有第一目標數據對應的目標用戶進行關聯以確定關聯用戶,關聯用戶用于表示相關聯的用戶為同一用戶,根據目標關聯數據列表,獲取第二目標數據列表,在第一目標數據列表和第二目標數據列表的基礎上,若第二目標數據中包括的若干個特征數據和一第一目標數據中包括的若干個對應特征數據符合預設對比規則,則將該第二目標數據對應的用戶和該第一目標數據對應的用戶確定為關聯用戶,可知,判斷用戶之間相似性時,對用戶對應的若干特征的數據賦予不同的權重,同時,基于用戶對應特征數量的不同,采用不同的方式獲取每個特征對應的權重,提高了獲取到數據端用戶對應特征向量的準確性,使得獲取到的同一用戶的準確性較高。
1.一種確定同一用戶的方法,其特征在于,所述方法包括如下步驟:
2.根據權利要求1所述的確定同一用戶的方法,其特征在于,每個目標關聯數據對應一個數據端口,其中,所述數據端口為供用戶登錄和使用的端口。
3.根據權利要求1所述的確定同一用戶的方法,其特征在于,所述指定標識為表征目標用戶身份的唯一標識,其中,所述目標用戶為使用目標關聯數據對應的數據端口與目標服務平臺連接的用戶。
4.根據權利要求1所述的確定同一用戶的方法,其特征在于,若第二目標數據中包括的若干個特征數據和一第一目標數據中包括的若干個對應特征數據符合預設對比規則,則將該第二目標數據對應的用戶和該第一目標數據對應的用戶確定為關聯用戶包括如下步驟:
5.根據權利要求4所述的確定同一用戶的方法,其特征在于,獲取目標關聯數據列表對應的目標特征向量列表包括如下步驟:
6.根據權利要求4所述的確定同一用戶的方法,其特征在于,所述預設條件為相似度不小于預設相似度閾值,其中,所述預設相似度閾值的取值范圍為0.7至0.8。
7.一種非瞬時性計算機可讀存儲介質,所述非瞬時性計算機可讀存儲介質中存儲有至少一條指令或至少一段程序,其特征在于,所述至少一條指令或所述至少一段程序由處理器加載并執行以實現如權利要求1-6中任意一項所述的確定同一用戶的方法。
8.一種電子設備,其特征在于,包括處理器和權利要求7中所述的非瞬時性計算機可讀存儲介質。