一種基于社交網絡的互聯網班車線路優化方法與流程

文檔序號：11143620閱讀：來源：國知局

技術特征：

1.一種基于社交網絡的互聯網班車線路優化方法，其特征在于，所述方法包括如下步驟：

步驟一，社交軟件數據采集步驟，所述社交軟件數據采集包括獲取社交軟件的信息數據，并從中采集到與班車線路有關的信息。

在本步驟中，通過設置抓取條件的方式從獲取所述社交軟件提供的開放接口，抓取發布的微博中的相關信息數據；所述條件包括地理位置信息、時間信息、朋友關聯關系。

步驟二、對所述數據采集步驟采集到的數據進行挖掘，得到用戶不同出行時段的OD點(起終點)。

在本步驟中，利用K-means聚類算法對所述采集到的所述相關信息數據進行挖掘；在本步驟中將采集到所述數據中的的第i個數據定義為向量：

x_i＝(x_i1，x_i2，x_i3)，其中x_i表示向量，x_i1表示第i個點的經度，x_i2表示第i個點的緯度，x_i3表示第i個點的時間；

在計算地點聚類中心之前先利用時間進行分類，根據所述社交軟件的發布時間x_i3將數據集分割為上班集與下班集；當x_i3∈(5，9)時，將x_i點放進上班集進行地點聚類，當x_i3∈(16，20)時，將x_i點放進下班集中進行地點聚類，其余數據點視為無效點被過濾掉；這一步實現了初步的數據過濾與分類，有利于后續步驟的聚類；

然后進行第一次地點聚類，分別在上班集和下班集中各選出3個點作為備選點，即確定聚類中心數k＝3；先定義上班集的第k個地點聚類中心為：

其中，該公式的意義是將參與了第k個上班集地點聚類的點的經緯度計算平均值，計算出的經緯度作為第k個上班集的聚類中心的坐標；所述n為所采集的有效數據點的個數；

定義第i個點x_i與第k個聚類中心μ_k之間的距離為：

$<mrow> <msub> <mi>D</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> </msub> <mo>=</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>μ</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>μ</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> </mrow>$

則所述第一次地點聚類的計算步驟包括上班集聚類和下班集聚類，所述上上班集聚類包括：(1)先隨機初始化聚類均值μ₁、μ₂、μ₃；(2)對每個點x_i都找到使D_ik最小的k，將i點聚到該中心，并設置該分配系數z_ik＝1；(3)如果所有的z_ik與上一次迭代沒有變化，則停止聚類，輸出μ₁、μ₂、μ₃；(4)否則按照①式更新μ₁、μ₂、μ₃；

用與所述上班集聚類同樣的辦法可以得到下班集的三個聚類中心ρ₁、ρ₂、ρ₃；

步驟三、目標用戶關系挖掘，在找到目標用戶之后，根據其微博的朋友關系，尋找與其出行規律相似的用戶，從而進一步擴大目標用戶的范圍。

遍歷目標用戶的朋友圈關系，找出滿足預定條件的所有重點朋友，然后計算出每一個朋友s的上班集聚類中心μ_s＝(μ₁、μ₂、μ₃)和下班集聚類中心ρ_s＝(ρ₁、ρ₂、ρ₃)；然后余弦相似度可以定義上班集線路相似度計算每一個重點朋友s與目標用戶d(μ_d、ρ_d)的線路相似度：

$<mrow> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mi>θ</mi> <mo>=</mo> <mfrac> <mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>μ</mi> <mi>s</mi> </msub> <mo>,</mo> <msub> <mi>ρ</mi> <mi>s</mi> </msub> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mrow> <mo>(</mo> <msub> <mi>μ</mi> <mi>d</mi> </msub> <mo>,</mo> <msub> <mi>ρ</mi> <mi>d</mi> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>μ</mi> <mi>s</mi> </msub> <mo>,</mo> <msub> <mi>ρ</mi> <mi>s</mi> </msub> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mrow> <mo>(</mo> <msub> <mi>μ</mi> <mi>s</mi> </msub> <mo>,</mo> <msub> <mi>ρ</mi> <mi>s</mi> </msub> <mo>)</mo> </mrow> </mrow> </msqrt> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>μ</mi> <mi>d</mi> </msub> <mo>,</mo> <msub> <mi>ρ</mi> <mi>d</mi> </msub> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mrow> <mo>(</mo> <msub> <mi>μ</mi> <mi>d</mi> </msub> <mo>,</mo> <msub> <mi>ρ</mi> <mi>d</mi> </msub> <mo>)</mo> </mrow> </mrow> </msqrt> </mrow> </mfrac> </mrow>$

所述cosθ為閾值，如果cosθ大于預定的數值，則認為朋友s和目標用戶d的線路相似，將所有相似的朋友放進一個新的集合中，進行第四步的二次聚類；

步驟四、對目標用戶群體進行聚類，得到用戶群最終的聚類中心(μ_k，ρ_k)，此值即可作為互聯網班車線路的OD點。

在本步驟中，利用K-means聚類算法對所述采集到的所述相關信息數據進行挖掘；將步驟三得到的用戶群的(μ、ρ)按照上班集與下班集分為兩個集合，分別計算兩個聚類點；由于經過步驟三的相似度判斷，所以在本步驟中設定聚類中心數為1，設μ＝(μ₁，μ₂，...，μ_3n)，當k＝1時，根據步驟二的公式可以推出最終的上班集聚類中心為：

同理可以算出下班集聚類中心為：

$<mrow> <msub> <mi>ρ</mi> <mi>k</mi> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>3</mn> <mi>n</mi> </mrow> </mfrac> <munderover> <mo>Σ</mo> <mi>i</mi> <mrow> <mn>3</mn> <mi>n</mi> </mrow> </munderover> <msub> <mi>ρ</mi> <mi>i</mi> </msub> </mrow>$

最終得到第k個用戶群的OD點為(μ_k，ρ_k)，以根據這個點來增設互聯網班車線路。

2.根據權利要求1所述的方法，其特征在于，所述社交網絡包括微博。

3.根據權利要求1所訴的方法，其特征在于，在所述步驟三中，所述預定條件包括：條件1，和目標用戶是互相關注關系；條件2，和目標用戶在微博中頻繁互動；條件3，和目標用戶有共同的朋友。以上條件1、條件2、條件3之間可以是和的關系，也可以是或的關系。

完整全部詳細技術資料下載

當前第2頁1 2 3

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

互聯網社交平臺相關技術

麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種基于社交網絡的互聯網班車線路優化方法與流程