麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

具有團伙欺詐風險的壽險理賠案件的識別方法及裝置與流程

文檔序號:11178244閱讀:403來源:國知局
具有團伙欺詐風險的壽險理賠案件的識別方法及裝置與流程

本發明涉及計算機技術領域,尤其涉及一種具有團伙欺詐風險的壽險理賠案件的識別方法及裝置。



背景技術:

目前,在壽險領域,很多壽險理賠欺詐案件有一定的關聯性,也就是說,壽險理賠存在團伙欺詐風險,例如,醫生與客戶之間、醫生與壽險業務員之間、客戶與壽險業務員之間、客戶與客戶之間可能存在著構成壽險理賠團伙欺詐案件的風險。目前,業界還沒有一個行之有效的方案能夠識別這類團伙欺詐的風險,雖然,有些壽險相關企業會安排有豐富經驗的理賠調查審核人員對壽險理賠案件進行欺詐風險調查與審核。然而,即使是經驗豐富的理賠調查審核人員也無法識別出不同的壽險理賠案件的內在關聯性,即人工調查審核的方式無法有效識別出壽險理賠的團伙欺詐風險。



技術實現要素:

本發明的主要目的在于提供一種具有團伙欺詐風險的壽險理賠案件的識別方法及裝置,旨在有效識別出具有團伙欺詐風險的壽險理賠案件。

為實現上述目的,本發明提供的一種具有團伙欺詐風險的壽險理賠案件的識別方法,所述方法包括以下步驟:

若收到待分析風險的壽險理賠案件,分析該壽險理賠案件中是否具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征;所述關鍵特征組合為從預設的各個壽險理賠團伙欺詐案件中按照預設規則提取出的關鍵風險特征的組合;

若該待分析風險的壽險理賠案件中具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征,則確定該待分析風險的壽險理賠案件為具有團伙欺詐風險的壽險理賠案件。

優選地,所述關鍵特征組合按照如下方式確定:

獲取預設數量的屬于團伙欺詐的壽險理賠案件的樣本數據,將同一個壽險理賠團伙欺詐案件下的壽險理賠案件的樣本數據歸為同一個樣本數據集合,將不同的壽險理賠團伙欺詐案件下的壽險理賠案件的樣本數據歸為不同的樣本數據集合;

從各個樣本數據集合中確定出各個樣本數據集合各自對應的共有特征集合;

按照預先確定的關聯規則確定出所有共有特征集合中相關聯的特征組合,并將該特征組合作為關鍵特征組合。

優選地,所述按照預先確定的關聯規則確定出所有共有特征集合中相關聯的特征組合,并將該特征組合作為關鍵特征組合的步驟包括:

將所有共有特征集合中的特征按預設組合方式進行組合,得到多個特征組合,并對各個特征組合按照預先確定的關聯規則確定出對應的關聯指標值;

若有特征組合對應的關聯指標值大于對應的預設閾值,則確定該特征組合為關鍵特征組合。

優選地,所述關聯指標值包括支持度和信任度,所述對各個特征組合按照預先確定的關聯規則確定出對應的關聯指標值的步驟包括:

針對一個包含第一特征與第二特征的特征組合,計算同時具有所述第一特征以及所述第二特征的壽險理賠案件樣本數據占預設數量的壽險理賠案件樣本數據的百分比,以作為該特征組合的支持度;

計算同時具有所述第一特征以及所述第二特征的壽險理賠案件樣本數據占具有所述第一特征的壽險理賠案件樣本數據的百分比,以作為該特征組合的信任度。

優選地,所述關聯指標值包括支持度和信任度,所述預設閾值包括預設支持度閾值和預設信任度閾值,所述若有特征組合對應的關聯指標值大于預設閾值,則確定該特征組合為關鍵特征組合的步驟包括:

若有特征組合對應的支持度大于預設支持度閾值,且對應的信任度大于預設信任度閾值,則確定該特征組合為關鍵特征組合。

此外,為實現上述目的,本發明還提供一種具有團伙欺詐風險的壽險理賠案件的識別裝置,所述識別裝置包括:

分析模塊,用于若收到待分析風險的壽險理賠案件,分析該壽險理賠案件中是否具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征;所述關鍵特征組合為從預設的各個壽險理賠團伙欺詐案件中按照預設規則提取出的關鍵風險特征的組合;

風險確定模塊,用于若該待分析風險的壽險理賠案件中具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征,則確定該待分析風險的壽險理賠案件為具有團伙欺詐風險的壽險理賠案件。

優選地,所述識別裝置還包括:

獲取模塊,用于獲取預設數量的屬于團伙欺詐的壽險理賠案件的樣本數據,將同一個壽險理賠團伙欺詐案件下的壽險理賠案件的樣本數據歸為同一個樣本數據集合,將不同的壽險理賠團伙欺詐案件下的壽險理賠案件的樣本數據歸為不同的樣本數據集合;

共有特征確定模塊,用于從各個樣本數據集合中確定出各個樣本數據集合各自對應的共有特征集合;

關聯確定模塊,用于按照預先確定的關聯規則確定出所有共有特征集合中相關聯的特征組合,并將該特征組合作為關鍵特征組合。

優選地,所述關聯確定模塊還用于:

將所有共有特征集合中的特征按預設組合方式進行組合,得到多個特征組合,并對各個特征組合按照預先確定的關聯規則確定出對應的關聯指標值;若有特征組合對應的關聯指標值大于對應的預設閾值,則確定該特征組合為關鍵特征組合。

優選地,所述關聯指標值包括支持度和信任度,所述關聯確定模塊還用于:

針對一個包含第一特征與第二特征的特征組合,計算同時具有所述第一特征以及所述第二特征的壽險理賠案件樣本數據占預設數量的壽險理賠案件樣本數據的百分比,以作為該特征組合的支持度;計算同時具有所述第一特征以及所述第二特征的壽險理賠案件樣本數據占具有所述第一特征的壽險理賠案件樣本數據的百分比,以作為該特征組合的信任度。

優選地,所述關聯指標值包括支持度和信任度,所述預設閾值包括預設支持度閾值和預設信任度閾值,所述關聯確定模塊還用于:

若有特征組合對應的支持度大于預設支持度閾值,且對應的信任度大于預設信任度閾值,則確定該特征組合為關鍵特征組合。

本發明提出的具有團伙欺詐風險的壽險理賠案件的識別方法及裝置,通過分析壽險理賠案件中是否具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征,來確定該待分析風險的壽險理賠案件是否為具有團伙欺詐風險的壽險理賠案件。由于所述關鍵特征組合為從預設的各個壽險理賠團伙欺詐案件中按照預設規則提取出的關鍵風險特征的組合,若該待分析風險的壽險理賠案件具有該關鍵特征組合中的關鍵風險特征,則說明該待分析風險的壽險理賠案件很可能為壽險理賠團伙欺詐案件,即可自動識別該待分析風險的壽險理賠案件為具有團伙欺詐風險的壽險理賠案件,相比人工識別的方式更加簡單、快速、準確。

附圖說明

圖1為本發明具有團伙欺詐風險的壽險理賠案件的識別方法一實施例的流程示意圖;

圖2為本發明具有團伙欺詐風險的壽險理賠案件的識別方法一實施例中確定關鍵特征組合的流程示意圖;

圖3為本發明具有團伙欺詐風險的壽險理賠案件的識別裝置第一實施例的功能模塊示意圖;

圖4為本發明具有團伙欺詐風險的壽險理賠案件的識別裝置第二實施例的功能模塊示意圖。

本發明目的的實現、功能特點及優點將結合實施例,參照附圖做進一步說明。

具體實施方式

為了使本發明所要解決的技術問題、技術方案及有益效果更加清楚、明白,以下結合附圖和實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發明,并不用于限定本發明。

本發明提供一種具有團伙欺詐風險的壽險理賠案件的識別方法。

參照圖1,圖1為本發明具有團伙欺詐風險的壽險理賠案件的識別方法一實施例的流程示意圖。

在一實施例中,該具有團伙欺詐風險的壽險理賠案件的識別方法包括:

步驟s10,若收到待分析風險的壽險理賠案件,分析該壽險理賠案件中是否具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征;所述關鍵特征組合為從預設的各個壽險理賠團伙欺詐案件中按照預設規則提取出的關鍵風險特征的組合。

本實施例中,接收用戶發出的對壽險理賠案件的風險分析請求,例如,接收用戶在手機、平板電腦、自助終端設備等終端上輸入相關信息(例如,壽險理賠案件的申請人身份信息、壽險業務員信息、理賠參與方的私人關系信息、理賠金額等)后發送的對壽險理賠案件的風險分析請求,如可接收用戶在手機、平板電腦、自助終端設備等終端中預先安裝的壽險理賠案件風險分析應用程序上輸入相關信息后發送來的風險分析請求,或接收用戶在手機、平板電腦、自助終端設備等終端中的瀏覽器系統上輸入相關信息后發送來的風險分析請求。

在接收到對壽險理賠案件的風險分析請求后,分析該壽險理賠案件中是否具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征,如分析該壽險理賠案件的相關特征如申請人身份信息、壽險業務員信息、理賠參與方的私人關系信息、理賠金額等是否為預先確定的關鍵特征組合中的關鍵風險特征。其中,所述關鍵特征組合為從預設的各個壽險理賠團伙欺詐案件中按照預設規則提取出的關鍵風險特征的組合,例如,在壽險理賠團伙欺詐案件中,醫生與客戶之間、醫生與壽險業務員之間、客戶與壽險業務員之間、客戶與客戶之間都有可能存在著構成壽險理賠團伙欺詐案件的風險,從歷史數據中獲取多個壽險理賠團伙欺詐案件樣本,并對多個壽險理賠團伙欺詐案件樣本中的特征進行分析,如可計算多個壽險理賠團伙欺詐案件樣本中相互關聯的特征的出現次數,也可計算多個壽險理賠團伙欺詐案件樣本中相互關聯的特征在預設時間段內的出現頻率,等等,在此不做限定。可將多個壽險理賠團伙欺詐案件樣本中出現次數超過一定次數的相互關聯的特征作為關鍵特征組合,或將多個壽險理賠團伙欺詐案件樣本中在預設時間段內的出現頻率超過一定頻率的相互關聯的特征作為關鍵特征組合。例如,若多個壽險理賠團伙欺詐案件樣本中y1醫院與y2壽險業務員一起出現的次數超過預設次數(如3次),則可將y1醫院與y2壽險業務員的組合作為關鍵特征組合。在接收到對壽險理賠案件的風險分析請求后,即可分析該壽險理賠案件中是否包含關鍵特征組合中的關鍵風險特征如y1醫院、y2壽險業務員。

步驟s20,若該待分析風險的壽險理賠案件中具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征,則確定該待分析風險的壽險理賠案件為具有團伙欺詐風險的壽險理賠案件。

若分析出該待分析風險的壽險理賠案件中具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征,如包含y1醫院和/或y2壽險業務員,則說明該待分析風險的壽險理賠案件中包含高團伙欺詐風險的特征,則自動確定并識別待分析風險的壽險理賠案件為高團伙欺詐風險的壽險理賠案件。

本實施例通過分析壽險理賠案件中是否具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征,來確定該待分析風險的壽險理賠案件是否為具有團伙欺詐風險的壽險理賠案件。由于所述關鍵特征組合為從預設的各個壽險理賠團伙欺詐案件中按照預設規則提取出的關鍵風險特征的組合,若該待分析風險的壽險理賠案件具有該關鍵特征組合中的關鍵風險特征,則說明該待分析風險的壽險理賠案件很可能為壽險理賠團伙欺詐案件,即可自動識別該待分析風險的壽險理賠案件為具有團伙欺詐風險的壽險理賠案件,相比人工識別的方式更加簡單、快速、準確。

進一步地,在其他實施例中,如圖2所示,所述關鍵特征組合按照如下步驟確定:

步驟s30,獲取預設數量的屬于團伙欺詐的壽險理賠案件的樣本數據,將同一個壽險理賠團伙欺詐案件下的壽險理賠案件的樣本數據歸為同一個樣本數據集合,將不同的壽險理賠團伙欺詐案件下的壽險理賠案件的樣本數據歸為不同的樣本數據集合,以獲取一定數量的壽險理賠團伙欺詐案件的樣本數據集合。例如,若壽險理賠團伙欺詐案件x所關聯的壽險理賠案件包括x1、x2、x3和x4四個壽險理賠案件,則將x1、x2、x3和x4對應的壽險理賠數據歸為同一個與該壽險理賠團伙欺詐案件x相對應的樣本數據集合。

步驟s40,從各個樣本數據集合中確定出各個樣本數據集合各自對應的共有特征集合,例如,若有a、b兩個不同壽險理賠團伙欺詐案件的樣本數據集合,則從樣本數據集合a中確定出a對應的共有特征集合a,從樣本數據集合b中確定出b對應的共有特征集合b。其中,所述共有特征是屬于同一個壽險理賠團伙欺詐案件下的所有壽險理賠案件所共同包含的特征,例如,該共有特征可以是y1醫院、y2壽險業務員、y3工作單位、y4私人關系、y5年齡區間及/或y6籍貫等。

步驟s50,按照預先確定的關聯規則確定出所有共有特征集合中相關聯的特征組合,并將該特征組合作為關鍵特征組合。例如,可將所有共有特征集合中的特征中共同出現次數做多的特征組合作為關鍵特征組合。

在一種可選的實施方式中,上述步驟s50可以包括:

將所有共有特征集合中的特征按預設組合方式進行組合,該預設組合方式包括但不限于兩兩組合、多對多組合等,得到多個特征組合,并對各個特征組合按照預先確定的關聯規則確定出對應的關聯指標值;若有特征組合對應的關聯指標值大于對應的預設閾值,則確定該特征組合為關鍵特征組合。

其中,關聯規則是形如x→y的蘊涵式,其中,x和y分別稱為關聯規則的先導(antecedent或left-hand-side,lhs)和后繼(consequent或right-hand-side,rhs),在本實施例中,x和y可以是特征組合中的各個特征,所述關聯指標值包括支持度(support)和信任度(confidence)。例如,針對一個包含第一特征x與第二特征y的特征組合,計算同時具有所述第一特征x以及所述第二特征y的壽險理賠案件樣本數據占預設數量的壽險理賠案件樣本數據的百分比,以作為該特征組合的支持度,即該特征組合在預設數量的壽險理賠案件樣本數據中的支持度是預設數量的壽險理賠案件樣本數據中同時包含第一特征x、第二特征y的百分比,即概率。計算同時具有所述第一特征x以及所述第二特征y的壽險理賠案件樣本數據占具有所述第一特征x的壽險理賠案件樣本數據的百分比,以作為該特征組合的信任度,即該特征組合在預設數量的壽險理賠案件樣本數據中的信任度是預設數量的壽險理賠案件樣本數據中在已經包含第一特征x的情況下,包含第二特征y的百分比,即條件概率。可根據實際應用的需要預先設定預設支持度閾值和預設信任度閾值,若有特征組合對應的支持度大于預設支持度閾值,且對應的信任度大于預設信任度閾值,則確定該特征組合為關鍵特征組合;若有特征組合對應的支持度小于或者等于預設支持度閾值,及/或,對應的信任度小于或者等于預設信任度閾值,則確定該特征組合不是關鍵特征組合,從而控制對該待分析風險的壽險理賠案件是否為具有團伙欺詐風險的壽險理賠案件的分析結果。

例如,若所有共有特征集合i={y1醫院、y2壽險業務員、y3工作單位、y4私人關系},在預設數量為6個的壽險理賠案件樣本數據中有5個壽險理賠案件樣本數據包含y1醫院,有3個壽險理賠案件樣本數據同時包含y1醫院和y2壽險業務員。則對于包含y1醫院與y2壽險業務員的特征組合來說,該特征組合的支持度為同時具有y1醫院與y2壽險業務員的壽險理賠案件樣本數據占預設數量的壽險理賠案件樣本數據的百分比,即3/6=0.5;該特征組合的置信度為同時具有y1醫院與y2壽險業務員的壽險理賠案件樣本數據占具有y1醫院的壽險理賠案件樣本數據的百分比,即3/5=0.6。若預先設定支持度閾值α=0.4,信任度閾值β=0.5,則判斷由于y1醫院與y2壽險業務員的特征組合對應的支持度0.5大于預設支持度閾值0.4,且對應的信任度0.6大于預設信任度閾值0.5,因此,可確定y1醫院與y2壽險業務員的特征組合為關鍵特征組合。

本實施例中,由于壽險理賠團伙欺詐案件中通常都是由多個特征如多個參與方進行團伙欺詐,因此,通過關聯規則從多個壽險理賠團伙欺詐案件的共有特征中找到相關聯的關鍵特征組合,可保證找到的關鍵特征組合中的關鍵特征為慣用的用于進行團伙欺詐的特征。利用找到的關鍵特征組合中的關鍵特征來對壽險理賠案件進行風險分析,能在判斷該待分析風險的壽險理賠案件中具有一個或多個關鍵特征組合中的關鍵風險特征時,自動識別該待分析風險的壽險理賠案件為具有團伙欺詐風險的壽險理賠案件。相比人工識別的方式,本實施例能識別出不同的壽險理賠案件的內在關聯性,使得對壽險理賠案件的團伙欺詐風險分析更加準確有效。

本發明進一步提供一種具有團伙欺詐風險的壽險理賠案件的識別裝置。

參照圖3,圖3為本發明具有團伙欺詐風險的壽險理賠案件的識別裝置第一實施例的功能模塊示意圖。

在第一實施例中,該具有團伙欺詐風險的壽險理賠案件的識別裝置包括:

分析模塊01,用于若收到待分析風險的壽險理賠案件,分析該壽險理賠案件中是否具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征;所述關鍵特征組合為從預設的各個壽險理賠團伙欺詐案件中按照預設規則提取出的關鍵風險特征的組合;

本實施例中,接收用戶發出的對壽險理賠案件的風險分析請求,例如,接收用戶在手機、平板電腦、自助終端設備等終端上輸入相關信息(例如,壽險理賠案件的申請人身份信息、壽險業務員信息、理賠參與方的私人關系信息、理賠金額等)后發送的對壽險理賠案件的風險分析請求,如可接收用戶在手機、平板電腦、自助終端設備等終端中預先安裝的壽險理賠案件風險分析應用程序上輸入相關信息后發送來的風險分析請求,或接收用戶在手機、平板電腦、自助終端設備等終端中的瀏覽器系統上輸入相關信息后發送來的風險分析請求。

在接收到對壽險理賠案件的風險分析請求后,分析該壽險理賠案件中是否具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征,如分析該壽險理賠案件的相關特征如申請人身份信息、壽險業務員信息、理賠參與方的私人關系信息、理賠金額等是否為預先確定的關鍵特征組合中的關鍵風險特征。其中,所述關鍵特征組合為從預設的各個壽險理賠團伙欺詐案件中按照預設規則提取出的關鍵風險特征的組合,例如,在壽險理賠團伙欺詐案件中,醫生與客戶之間、醫生與壽險業務員之間、客戶與壽險業務員之間、客戶與客戶之間都有可能存在著構成壽險理賠團伙欺詐案件的風險,從歷史數據中獲取多個壽險理賠團伙欺詐案件樣本,并對多個壽險理賠團伙欺詐案件樣本中的特征進行分析,如可計算多個壽險理賠團伙欺詐案件樣本中相互關聯的特征的出現次數,也可計算多個壽險理賠團伙欺詐案件樣本中相互關聯的特征在預設時間段內的出現頻率,等等,在此不做限定。可將多個壽險理賠團伙欺詐案件樣本中出現次數超過一定次數的相互關聯的特征作為關鍵特征組合,或將多個壽險理賠團伙欺詐案件樣本中在預設時間段內的出現頻率超過一定頻率的相互關聯的特征作為關鍵特征組合。例如,若多個壽險理賠團伙欺詐案件樣本中y1醫院與y2壽險業務員一起出現的次數超過預設次數(如3次),則可將y1醫院與y2壽險業務員的組合作為關鍵特征組合。在接收到對壽險理賠案件的風險分析請求后,即可分析該壽險理賠案件中是否包含關鍵特征組合中的關鍵風險特征如y1醫院、y2壽險業務員。

風險確定模塊02,用于若該待分析風險的壽險理賠案件中具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征,則確定該待分析風險的壽險理賠案件為具有團伙欺詐風險的壽險理賠案件。

若分析出該待分析風險的壽險理賠案件中具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征,如包含y1醫院和/或y2壽險業務員,則說明該待分析風險的壽險理賠案件中包含高團伙欺詐風險的特征,則自動確定并識別待分析風險的壽險理賠案件為高團伙欺詐風險的壽險理賠案件。

本實施例通過分析壽險理賠案件中是否具有一個或多個預先確定的關鍵特征組合中的關鍵風險特征,來確定該待分析風險的壽險理賠案件是否為具有團伙欺詐風險的壽險理賠案件。由于所述關鍵特征組合為從預設的各個壽險理賠團伙欺詐案件中按照預設規則提取出的關鍵風險特征的組合,若該待分析風險的壽險理賠案件具有該關鍵特征組合中的關鍵風險特征,則說明該待分析風險的壽險理賠案件很可能為壽險理賠團伙欺詐案件,即可自動識別該待分析風險的壽險理賠案件為具有團伙欺詐風險的壽險理賠案件,相比人工識別的方式更加簡單、準確。

如圖4所示,本發明第二實施例提出一種具有團伙欺詐風險的壽險理賠案件的識別裝置,在上述實施例的基礎上,所述識別裝置還包括:

獲取模塊03,用于獲取預設數量的屬于團伙欺詐的壽險理賠案件的樣本數據,將同一個壽險理賠團伙欺詐案件下的壽險理賠案件的樣本數據歸為同一個樣本數據集合,將不同的壽險理賠團伙欺詐案件下的壽險理賠案件的樣本數據歸為不同的樣本數據集合,以獲取一定數量的壽險理賠團伙欺詐案件的樣本數據集合。例如,若壽險理賠團伙欺詐案件x所關聯的壽險理賠案件包括x1、x2、x3和x4四個壽險理賠案件,則將x1、x2、x3和x4對應的壽險理賠數據歸為同一個與該壽險理賠團伙欺詐案件x相對應的樣本數據集合。

共有特征確定模塊04,用于從各個樣本數據集合中確定出各個樣本數據集合各自對應的共有特征集合,例如,若有a、b兩個不同壽險理賠團伙欺詐案件的樣本數據集合,則從樣本數據集合a中確定出a對應的共有特征集合a,從樣本數據集合b中確定出b對應的共有特征集合b。其中,所述共有特征是屬于同一個壽險理賠團伙欺詐案件下的所有壽險理賠案件所共同包含的特征,例如,該共有特征可以是y1醫院、y2壽險業務員、y3工作單位、y4私人關系、y5年齡區間及/或y6籍貫等。

關聯確定模塊05,用于按照預先確定的關聯規則確定出所有共有特征集合中相關聯的特征組合,并將該特征組合作為關鍵特征組合。例如,可將所有共有特征集合中的特征中共同出現次數做多的特征組合作為關鍵特征組合。

在一種可選的實施方式中,上述關聯確定模塊05可以用于:

將所有共有特征集合中的特征按預設組合方式進行組合,該預設組合方式包括但不限于兩兩組合、多對多組合等,得到多個特征組合,并對各個特征組合按照預先確定的關聯規則確定出對應的關聯指標值;若有特征組合對應的關聯指標值大于對應的預設閾值,則確定該特征組合為關鍵特征組合。

其中,關聯規則是形如x→y的蘊涵式,其中,x和y分別稱為關聯規則的先導(antecedent或left-hand-side,lhs)和后繼(consequent或right-hand-side,rhs),在本實施例中,x和y可以是特征組合中的各個特征,所述關聯指標值包括支持度(support)和信任度(confidence)。例如,針對一個包含第一特征x與第二特征y的特征組合,計算同時具有所述第一特征x以及所述第二特征y的壽險理賠案件樣本數據占預設數量的壽險理賠案件樣本數據的百分比,以作為該特征組合的支持度,即該特征組合在預設數量的壽險理賠案件樣本數據中的支持度是預設數量的壽險理賠案件樣本數據中同時包含第一特征x、第二特征y的百分比,即概率。計算同時具有所述第一特征x以及所述第二特征y的壽險理賠案件樣本數據占具有所述第一特征x的壽險理賠案件樣本數據的百分比,以作為該特征組合的信任度,即該特征組合在預設數量的壽險理賠案件樣本數據中的信任度是預設數量的壽險理賠案件樣本數據中在已經包含第一特征x的情況下,包含第二特征y的百分比,即條件概率。可根據實際應用的需要預先設定預設支持度閾值和預設信任度閾值,若有特征組合對應的支持度大于預設支持度閾值,且對應的信任度大于預設信任度閾值,則確定該特征組合為關鍵特征組合;若有特征組合對應的支持度小于或者等于預設支持度閾值,及/或,對應的信任度小于或者等于預設信任度閾值,則確定該特征組合不是關鍵特征組合,從而控制對該待分析風險的壽險理賠案件是否為具有團伙欺詐風險的壽險理賠案件的分析結果。

例如,若所有共有特征集合i={y1醫院、y2壽險業務員、y3工作單位、y4私人關系},在預設數量為6個的壽險理賠案件樣本數據中有5個壽險理賠案件樣本數據包含y1醫院,有3個壽險理賠案件樣本數據同時包含y1醫院和y2壽險業務員。則對于包含y1醫院與y2壽險業務員的特征組合來說,該特征組合的支持度為同時具有y1醫院與y2壽險業務員的壽險理賠案件樣本數據占預設數量的壽險理賠案件樣本數據的百分比,即3/6=0.5;該特征組合的置信度為同時具有y1醫院與y2壽險業務員的壽險理賠案件樣本數據占具有y1醫院的壽險理賠案件樣本數據的百分比,即3/5=0.6。若預先設定支持度閾值α=0.4,信任度閾值β=0.5,則判斷由于y1醫院與y2壽險業務員的特征組合對應的支持度0.5大于預設支持度閾值0.4,且對應的信任度0.6大于預設信任度閾值0.5,因此,可確定y1醫院與y2壽險業務員的特征組合為關鍵特征組合。

本實施例中,由于壽險理賠團伙欺詐案件中通常都是由多個特征如多個參與方進行團伙欺詐,因此,通過關聯規則從多個壽險理賠團伙欺詐案件的共有特征中找到相關聯的關鍵特征組合,可保證找到的關鍵特征組合中的關鍵特征為慣用的用于進行團伙欺詐的特征。利用找到的關鍵特征組合中的關鍵特征來對壽險理賠案件進行風險分析,能在判斷該待分析風險的壽險理賠案件中具有一個或多個關鍵特征組合中的關鍵風險特征時,自動識別該待分析風險的壽險理賠案件為具有團伙欺詐風險的壽險理賠案件。相比人工識別的方式,本實施例能識別出不同的壽險理賠案件的內在關聯性,使得對壽險理賠案件的團伙欺詐風險分析更加準確有效。

需要說明的是,在本文中,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。

通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到上述實施例方法可借助軟件加必需的通用硬件平臺的方式來實現,當然也可以通過硬件來實現,但很多情況下前者是更佳的實施方式。基于這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,該計算機軟件產品存儲在一個存儲介質(如rom/ram、磁碟、光盤)中,包括若干指令用以使得一臺終端設備(可以是手機,計算機,服務器,空調器,或者網絡設備等)執行本發明各個實施例所述的方法。

以上參照附圖說明了本發明的優選實施例,并非因此局限本發明的權利范圍。上述本發明實施例序號僅僅為了描述,不代表實施例的優劣。另外,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執行所示出或描述的步驟。

本領域技術人員不脫離本發明的范圍和實質,可以有多種變型方案實現本發明,比如作為一個實施例的特征可用于另一實施例而得到又一實施例。凡在運用本發明的技術構思之內所作的任何修改、等同替換和改進,均應在本發明的權利范圍之內。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 威信县| 古田县| 桑植县| 长武县| 陆良县| 宣汉县| 黑河市| 吴桥县| 五大连池市| 巴南区| 鹤岗市| 叶城县| 高雄市| 十堰市| 建平县| 奎屯市| 衡阳县| 香河县| 连城县| 日喀则市| 达州市| 外汇| 安达市| 嘉祥县| 呼图壁县| 邹平县| 永年县| 阳东县| 顺平县| 东平县| 应城市| 卓资县| 滨州市| 鄢陵县| 台北县| 神木县| 迭部县| 墨玉县| 廊坊市| 兰坪| 天津市|