麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

網絡關鍵詞識別處理方法和裝置制造方法

文檔序號:6519331閱讀:266來源:國知局
網絡關鍵詞識別處理方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種網絡關鍵詞識別處理方法和裝置。該網絡關鍵詞識別處理方法包括:獲取當前時間周期內網絡中關鍵詞帶來的第一訪問人次數(shù);獲取多個歷史時間周期內關鍵詞帶來的第二訪問人次數(shù);計算第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值;以及基于比例值對關鍵詞進行識別。通過本發(fā)明,解決了相關技術中對關鍵詞的識別準確度比較低的問題,進而達到了對關鍵詞的識別準確度比較高效果。
【專利說明】網絡關鍵詞識別處理方法和裝置
【技術領域】
[0001]本發(fā)明涉及互聯(lián)網領域,具體而言,涉及一種網絡關鍵詞識別處理方法和裝置。
【背景技術】
[0002]站外搜索導航來源是網站的重要來源渠道之一,其中,關鍵詞所帶來的訪問人次是可見性優(yōu)化工作的重要參考依據(jù)。關鍵詞質量好壞將直接或間接地影響網站廣告投放及營銷決策,熱門關鍵詞的識別方法則是判斷關鍵詞好壞的核心。
[0003]通常,人們認為持續(xù)帶來高訪問人次的關鍵詞具有較高的質量,屬于熱門關鍵詞,而持續(xù)帶來低訪問人次的關鍵詞的質量也較低,屬于非熱門關鍵詞,因此在相關技術中采用統(tǒng)計關鍵詞在不同時期訪問人次絕對數(shù)值的方法識別熱門關鍵詞。此外,考慮到熱門這一概念具有時效性,即關鍵詞在很短時期突然涌現(xiàn)出極高的訪問人次,而在通常時間訪問人次均處于較低水平,這種關鍵詞可能伴隨某個熱門事件或是網站活動產生,單單通過比較訪問人次的絕對數(shù)值使得對關鍵詞的識別準確度比較低。
[0004]因此,在相關技術中也提出了一種方案,該方案識別這種熱門關鍵詞的方式是計算關鍵詞帶來訪問人次的環(huán)比,通過環(huán)比比值大小進行熱門關鍵詞的識別。
[0005]發(fā)明人發(fā)現(xiàn),造成識別熱門關鍵詞方法不同的重要原因在于對熱門關鍵詞的定義不同,基于訪問人次絕對數(shù)值的計算方法定義熱門關鍵詞為帶來訪問人次數(shù)多的關鍵詞,而基于訪問人次環(huán)比的計算方法定義熱門關鍵詞為帶來訪問人次增長幅度大的關鍵詞。如果定義前者為持續(xù)熱門關鍵詞(圖1中A折線),后者為異動熱門關鍵詞(圖1中B折線),同時定義非熱門關鍵詞為冷門關鍵詞(圖1中C折線)。無論持續(xù)熱門關鍵詞還是異動熱門關鍵詞,都對網站流量、轉化率等指標很有幫助。鑒于此,本發(fā)明從實際角度出發(fā)提出了同時涵蓋兩種熱門關鍵詞的識別方法,并給出了嚴謹?shù)乃季S過程和邏輯方法。
[0006]針對相關技術中對關鍵詞的識別準確度比較低的問題,目前尚未提出有效的解決方案。

【發(fā)明內容】

[0007]本發(fā)明的主要目的在于提供一種網絡關鍵詞識別處理方法和裝置,以解決相關技術中對關鍵詞的識別準確度比較低問題。
[0008]為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種網絡關鍵詞識別處理方法。該方法包括:獲取當前時間周期內網絡中關鍵詞帶來的第一訪問人次數(shù);獲取多個歷史時間周期內關鍵詞帶來的第二訪問人次數(shù);計算第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值;以及基于比例值對關鍵詞進行識別。
[0009]進一步地,基于比例值對關鍵詞進行識別包括:利用比例值和第一訪問人次數(shù)得出當前時間周期的關鍵詞訪問熱度值;以及根據(jù)關鍵詞熱度值對關鍵詞進行識別。
[0010]進一步地,根據(jù)關鍵詞熱度值對關鍵詞進行識別包括:獲取多個時間周期內的關鍵詞熱度值;獲取多個時間周期內的關鍵詞熱度值與當前時間周期內關鍵詞熱度值的對應關系;根據(jù)對應關系加權計算出當前時間周期內的關鍵詞遞延熱度值;以及根據(jù)關鍵詞訪問熱度值和關鍵詞遞延熱度值得到當前時間周期的關鍵詞熱度值。
[0011]進一步地,當前時間周期的關鍵詞訪問熱度值通過以下方式進行計算:r=(m*C+x*n)/(n+C);其中,C表示設定的訪問人次常數(shù),η表示預先設定的關鍵詞訪問人次數(shù),X表示預先設定的關鍵詞的訪問人次得分,m為所有關鍵詞的訪問人次平均得分,r表示當前時間周期的關鍵詞訪問熱度值。
[0012]進一步地,在基于比例值對關鍵詞進行識別之后,網絡關鍵詞識別處理方法還包括:計算每個關鍵詞于每段時間周期內的增幅;以及計算每個關鍵詞在不同的時間周期之間的增幅是否具有遞延性。
[0013]為了實現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種網絡關鍵詞識別處理裝置。該裝置包括:第一獲取單元,用于獲取當前時間周期內網絡中關鍵詞帶來的第一訪問人次數(shù);第二獲取單元,用于獲取多個歷史時間周期內關鍵詞帶來的第二訪問人次數(shù);第一計算單元,用于計算第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值;以及識別單元,用于基于比例值對關鍵詞進行識別。
[0014]進一步地,識別單元包括:計算模塊,用于利用比例值和第一訪問人次數(shù)得出當前時間周期的關鍵詞訪問熱度值;以及識別模塊,用于根據(jù)關鍵詞熱度值對關鍵詞進行識別。
[0015]進一步地,識別模塊包括:第一獲取子模塊,用于獲取多個時間周期內的關鍵詞熱度值;第二獲取子模塊,用于獲取多個時間周期內的關鍵詞熱度值與當前時間周期內關鍵詞熱度值的對應關系;第一計算子模塊,用于根據(jù)對應關系加權計算出當前時間周期內的關鍵詞遞延熱度值;以及第二計算子模塊,用于根據(jù)關鍵詞訪問熱度值和關鍵詞遞延熱度值得到當前時間周期的關鍵詞熱度值。
[0016]進一步地,計算模塊還用于通過以下方式進行計算:r=(m*C+x*n)/(n+C);其中,C表示設定的訪問人次常數(shù),η表示預先設定的關鍵詞訪問人次數(shù),X表示預先設定的關鍵詞的訪問人次得分,m為所有關鍵詞的訪問人次平均得分,r表示當前時間周期的關鍵詞訪問熱度值。
[0017]進一步地,在基于比例值對關鍵詞進行識別之后,網絡關鍵詞識別處理裝置還包括:第二計算單元,用于計算每個關鍵詞于每段時間周期內的增幅;以及第三計算單元,用于計算每個關鍵詞在不同的時間周期之間的增幅是否具有遞延性。
[0018]通過本發(fā)明,采用獲取當前時間周期內網絡中關鍵詞帶來的第一訪問人次數(shù);獲取多個歷史時間周期內關鍵詞帶來的第二訪問人次數(shù);計算第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值;以及基于比例值對關鍵詞進行識別,解決了相關技術中對關鍵詞的識別準確度比較低的問題,進而達到了對關鍵詞的識別準確度比較高效果O
【專利附圖】

【附圖說明】
[0019]構成本申請的一部分的附圖用來提供對本發(fā)明的進一步理解,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構成對本發(fā)明的不當限定。在附圖中:
[0020]圖1是根據(jù)相關技術的關鍵詞分類的示意圖;
[0021]圖2是根據(jù)本發(fā)明第一實施例的網絡關鍵詞識別處理方法的流程圖;[0022]圖3是根據(jù)本發(fā)明第二實施例的網絡關鍵詞識別處理方法的流程圖;
[0023]圖4是根據(jù)本發(fā)明第三實施例的網絡關鍵詞識別處理方法的流程圖;
[0024]圖5是根據(jù)本發(fā)明第四實施例的網絡關鍵詞識別處理方法的流程圖;
[0025]圖6是根據(jù)本發(fā)明第一實施例的網絡關鍵詞識別處理裝置的示意圖;
[0026]圖7是根據(jù)本發(fā)明第二實施例的網絡關鍵詞識別處理裝置的示意圖;以及
[0027]圖8是根據(jù)本發(fā)明第三實施例的網絡關鍵詞識別處理裝置的示意圖。
【具體實施方式】
[0028]需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本發(fā)明。
[0029]為了使本【技術領域】的人員更好地理解本發(fā)明方案,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分的實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應當屬于本發(fā)明保護的范圍。
[0030]需要說明的是,本發(fā)明的說明書和權利要求書及上述附圖中的術語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用的數(shù)據(jù)在適當情況下可以互換,以便這里描述的本發(fā)明的實施例例如能夠以除了在這里圖示或描述的那些以外的順序實施。此外,術語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對于這些過程、方法、產品或設備固有的其它步驟或單元。
[0031]根據(jù)本發(fā)明的實施例,提供了一種網絡關鍵詞識別處理方法,該網絡關鍵詞識別處理方法用于識別關鍵詞的熱門程度。需要說明的是,該網絡關鍵詞識別處理方法可以運行在計算機處理設備上。
[0032]需要說明的是,關鍵詞包括熱門關鍵詞和冷門關鍵詞,當關鍵詞的熱度超過預定值時,關鍵詞為熱門關鍵詞,否則當關鍵詞的熱度未超過預定值時,關鍵詞為冷門關鍵詞,其中,熱門關鍵詞又包括持續(xù)熱門關鍵詞和異動熱門關鍵詞。持續(xù)熱門關鍵詞是指在很長一段時間內,關鍵詞的點擊量和搜索量等都持續(xù)較大。異動熱門關鍵詞是指在很長一段時間內,關鍵詞的點擊量和搜索量在該段時間內的某個子時間段內突然變大。
[0033]圖2是根據(jù)本發(fā)明第一實施例的網絡關鍵詞識別處理方法的流程圖。
[0034]如圖2所示,該方法包括如下的步驟SlOl至步驟S104:
[0035]步驟S101,獲取當前時間周期內網絡中關鍵詞帶來的第一訪問人次數(shù)。
[0036]在本發(fā)明實施例中,時間周期可以預先設定,例如,時間周期可以是一周,即,時間周期可以是7個工作日。網絡中關鍵詞可以是用戶在使用互聯(lián)網時訪問到的關鍵詞,其中包括用戶點擊、搜索的任何關鍵詞和通過點擊、搜索等操作關聯(lián)到的任何關鍵詞。具體地,可以通過網站上的腳本文件獲取網絡中的關鍵詞,進而獲取當前時間周期內該網絡中關鍵詞帶來的第一訪問人次數(shù)。
[0037]例如,假設時間周期長度為一周,并且當前時間周期為2013年的第十周,則可以通過網站上的腳本文件獲取網絡中的“ABC”這個關鍵詞的第一訪問人次數(shù),其中,第一訪問人次數(shù)是指“ABC”在2013年的第十周的訪問總量。
[0038]進一步地,在本發(fā)明實施例中,第一訪問人次數(shù)可以包括一個或者多個,其中,第一訪問人次數(shù)與當前時間周期一一對應。例如,當當前時間周期為2013年的第九周時,第一訪問人次數(shù)為2013年的第九周的訪問總量;當當前時間周期為2013年的第十周時,第一訪問人次數(shù)為2013年的第十周的訪問總量。
[0039]步驟S102,獲取多個歷史時間周期內關鍵詞帶來的第二訪問人次數(shù)。
[0040]需要說明的是,步驟SlOl和步驟S102的執(zhí)行順序只是本發(fā)明實施例的示意執(zhí)行順序,實際上,步驟SlOl和步驟S102的執(zhí)行順序可以顛倒。需要說明的是,獲取多個歷史時間周期內關鍵詞帶來的第二訪問人次數(shù)即為獲取多個歷史時間周期內各個歷史時間周期的關鍵詞的訪問量總和。步驟S102中的“關鍵詞”與步驟SlOl中的“關鍵詞”為同一關鍵詞。在本發(fā)明實施例中,歷史時間周期與當前時間周期為相鄰的時間周期,并且歷史時間周期與當前時間周期為相對的時間周期。需要說明的是,歷史時間周期的個數(shù)可以預先設定,例如,多個歷史周期可以是根據(jù)當前時間周期向前推算一定個數(shù)的周期時間。
[0041]例如,假設2013年的第十周為當前時間周期,則多個歷史時間周期可以為2013年的第七周至第九周,獲取多個歷史時間周期內關鍵詞帶來的第二訪問人次數(shù)即為獲取2013年的第七周至第九周內關鍵詞帶來的訪問量總和。
[0042]進一步地,在本發(fā)明實施例中,第二訪問人次數(shù)可以包括一個或者多個。其中,第二訪問人次數(shù)與多個歷史時間周期一一對應。例如,當當前時間周期為2013年的第九周時,多個歷史時間周期可以是2013年的第六周至第八周,相應地第二訪問人次數(shù)即為2013年的第六周至第八周的訪問量總和;當當前時間周期為2013年的第十周時,多個歷史時間周期可以是2013年的第七周至第九周,相應地第二訪問人次數(shù)為2013年的第七周至第九周的訪問量總和。
[0043]步驟S103,計算第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值。
[0044]需要說明的是,在本發(fā)明實施例中,也可以計算第一訪問人次數(shù)占第二訪問人次數(shù)的比例值。在本發(fā)明實施例中,因為第一訪問人次數(shù)和第二訪問人次數(shù)均可以包括一個或者多個,所以相應地第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值也可以包括一個或者多個。
[0045]步驟S104,基于比例值對關鍵詞進行識別。
[0046]具體地,在本發(fā)明實施例中,當比例值越大時,關鍵詞的熱度就越大,否則當比例值越小時,關鍵詞的熱度就越小,當關鍵詞的熱度超過預定值時,關鍵詞即為熱門關鍵詞,否則,當關鍵詞的熱度未超過預定值時,關鍵詞即為冷門關鍵詞。需要說明的是,在本發(fā)明實施例中,優(yōu)選地,還可以基于比例值和絕對值對關鍵詞進行識別,其中,絕對值即為一個或者多個時間周期內關鍵詞的訪問量總和,其可以包括第一訪問人次數(shù)和第二訪問人次數(shù)。
[0047]進一步地,在本發(fā)明實施例中,由于第一訪問人次數(shù)、第二訪問人次數(shù)和第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值均可以包括一個或者多個,因此可以基于多個比例值和關鍵值對關鍵詞進行識別。具體地,當多個比例值差異較小并且多個比例值均較大時,關鍵詞的熱度變化不明顯并且熱度較高,該關鍵詞為持續(xù)熱門關鍵詞,而當多個比例值差異較小并且多個比例值均較小時,關鍵詞的熱度變化不明顯并且熱度較低,該關鍵詞為冷門關鍵詞,否則當多個比例值差異較大時,關鍵詞的熱度變化明顯,該關鍵詞為異動熱門關鍵詞。
[0048]通過本發(fā)明,采用獲取當前時間周期內網絡中關鍵詞帶來的第一訪問人次數(shù);獲取多個歷史時間周期內關鍵詞帶來的第二訪問人次數(shù);計算第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值;以及基于比例值對關鍵詞進行識別,解決了相關技術中對關鍵詞的識別準確度比較低的問題,進而達到了對關鍵詞的識別準確度比較高效
果O
[0049]圖3是根據(jù)本發(fā)明第二實施例的網絡關鍵詞識別處理方法的流程圖。
[0050]如圖3所示,該網絡關鍵詞識別處理方法包括如下的步驟S201至步驟S205,該實施例可以作為圖2所示實施例的優(yōu)選實施方式。
[0051]步驟S201至步驟S203,分別同圖2所示實施例的步驟SlOl和步驟S103,在此不
再贅述。
[0052]步驟S204,利用比例值和第一訪問人次數(shù)得出當前時間周期的關鍵詞訪問熱度值。
[0053]需要說明的是,在本發(fā)明實施例中,可以用得分表示比例值,即得分等于比例值。在本發(fā)明實施例中,關鍵詞訪問熱度值用于量化關鍵詞的訪問熱度,當前時間周期的關鍵詞訪問熱度值用于量化當前時間周期的關鍵詞的訪問熱度,其中,如果關鍵詞訪問熱度值越大,則關鍵詞的訪問熱度越高,相反,如果關鍵詞訪問熱度值越小,則關鍵詞的訪問熱度越低。在本發(fā)明實施例中,當前時間周期的關鍵詞訪問熱度值可以通過以下公式進行計算:
[0054]r= (m*C+x*n) / (n+C)
[0055]其中,r表示當前時間周期的關鍵詞訪問熱度值,m為所有關鍵詞的訪問人次平均得分,該訪問人次平均得分是指所有關鍵詞的第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值的平均值,C表示設定的訪問人次常數(shù),X表示預先設定的關鍵詞的訪問人次得分,該關鍵詞的訪問人次得分是指第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值,當比例值較大時,關鍵詞的訪問人次得分較高,否則,當比例值較小時,關鍵詞的訪問人次得分較低。η表示預先設定的關鍵詞訪問人次數(shù),該關鍵詞訪問人次數(shù)即為第一訪問人次數(shù)。
[0056]步驟S205,根據(jù)關鍵詞熱度值對關鍵詞進行識別。
[0057]具體地,在本發(fā)明實施例中,當關鍵詞熱度值越大時,關鍵詞的熱度就越大,否則當關鍵詞熱度值越小時,關鍵詞的熱度就越小,當關鍵詞的熱度值超過預定值時,關鍵詞即為熱門關鍵詞,否則,當關鍵詞的熱度值未超過預定值時,關鍵詞即為冷門關鍵詞。進一步地,在本發(fā)明實施例中,由于第一訪問人次數(shù)、第二訪問人次數(shù)和第一訪問人次數(shù)占第二訪問人次數(shù)的比例值均可以包括一個或者多個,因此可以基于多個比例值和絕對值對關鍵詞進行識別,進而可以基于多個關鍵詞熱度值對關鍵詞進行識別。具體地,當多個關鍵詞熱度值差異較小并且多個關鍵詞熱度值均較大時,關鍵詞的熱度變化不明顯并且該關鍵詞為持續(xù)熱門關鍵詞,當多個關鍵詞熱度值差異較小并且多個關鍵詞熱度值均較小時,關鍵詞的熱度變化不明顯并且該關鍵詞為冷門關鍵詞,否則當多個關鍵詞熱度值差異越大時,關鍵詞的熱度變化明顯,該關鍵詞為異動熱門關鍵詞。
[0058]通過本發(fā)明,采用步驟S204至步驟S205實現(xiàn)了基于比例值和第一訪問人次數(shù)對關鍵詞進行識別的目的,解決了相關技術中對關鍵詞的識別準確度比較低的問題,進而達到了對關鍵詞的識別準確度比較高效果。
[0059]圖4是根據(jù)本發(fā)明第三實施例的網絡關鍵詞識別處理方法的流程圖。
[0060]如圖4所示,該網絡關鍵詞識別處理方法包括如下的步驟S301至步驟S309,該實施例可以作為圖3所示實施例的優(yōu)選實施方式。
[0061]步驟S301至步驟S304,分別同圖3所示實施例的步驟S201和步驟S204,在此不
再贅述。
[0062]步驟S305,獲取多個時間周期內的關鍵詞熱度值。
[0063]例如,可以根據(jù)時間周期的關鍵詞訪問熱度值的計算公式分別獲取2013年第一周至第十周的關鍵詞訪問熱度值。在本發(fā)明實施例中,可以將獲取的多個時間周期內的關鍵詞熱度值存儲在關鍵詞熱度值列表中。
[0064]步驟S306,獲取多個時間周期內的關鍵詞熱度值與當前時間周期內關鍵詞熱度值的對應關系。
[0065]例如,當客戶端要分析2013年前十周的關鍵詞熱度時,并且如果假設當前時間周期為2013年第十周,則獲取多個時間周期內的關鍵詞熱度值與當前時間周期內關鍵詞熱度值的對應關系即為獲取2013年第一周至第九周的鍵詞熱度值與2013年第十周的關鍵詞熱度值的對應關系;如果假設當前時間周期為2013年第九周,則獲取多個時間周期內的關鍵詞熱度值與當前時間周期內關鍵詞熱度值的對應關系即為獲取2013年第一周至第八周的鍵詞熱度值與2013年第九周的關鍵詞熱度值的對應關系。
[0066]步驟S307,根據(jù)對應關系加權計算出當前時間周期內的關鍵詞遞延熱度值。
[0067]在本發(fā)明實施例中,當前時間周期內的關鍵詞遞延熱度值由當前時間周期的前一時間周期內的關鍵詞熱度值和權重系數(shù)確定,例如,當前時間周期為2013年第十周,當前時間周期的前一時間周期為2013年第九周,具體地,可以根據(jù)牛頓冷卻定律確定當前時間周期內的關鍵詞遞延熱度值,即,關鍵詞遞延熱度值=當前時間周期的前一時間周期內的關鍵詞熱度值*權重系數(shù),其中,權重系數(shù)=exp (-冷卻系數(shù)*間隔時間)。
[0068]步驟S308,根據(jù)關鍵詞訪問熱度值和關鍵詞遞延熱度值得到當前時間周期的關鍵詞熱度值。
[0069]在本發(fā)明實施例中,具體地,當前時間周期的關鍵詞熱度值=關鍵詞訪問熱度值+關鍵詞遞延熱度值。
[0070]通過本發(fā)明,采用步驟S306至步驟S308實現(xiàn)了根據(jù)關鍵詞熱度值對關鍵詞進行識別的目的,解決了相關技術中對關鍵詞的識別準確度比較低的問題,進而達到了對關鍵詞的識別準確度比較高效果。
[0071]圖5是根據(jù)本發(fā)明第四實施例的網絡關鍵詞識別處理方法的流程圖。
[0072]如圖5所示,該網絡關鍵詞識別處理方法包括如下的步驟S401至步驟S406,該實施例可以作為圖2所示實施例的優(yōu)選實施方式。
[0073]步驟S401至步驟S404,分別同圖2所示實施例的步驟SlOl和步驟S104,在此不再贅述。
[0074]步驟S405,計算每個關鍵詞于每段時間周期內的增幅。
[0075]在本發(fā)明實施例中,具體地,關鍵詞于每段時間周期內的增幅=(關鍵詞在當前時間周期內的第一訪問人次數(shù)-關鍵詞在當前時間周期的前一時間周期內的第一訪問人次數(shù))/關鍵詞在當前時間周期的前一時間周期內的第一訪問人次數(shù)。
[0076]例如,假設2013年第一周為初始時間周期,并且假設在2013年第一周關鍵詞“ABC”的第一訪問人次數(shù)為1000次,2013年第二周關鍵詞“ABC”的第一訪問人次數(shù)為1500次,則2013年第二周關鍵詞“ABC”的第一訪問人次數(shù)較2013年第一周關鍵詞“ABC”的第一訪問人次數(shù)的增幅為(1500-1000) /1000=0.5。
[0077]步驟S406,計算每個關鍵詞在不同的時間周期之間的增幅是否具有遞延性。
[0078]在本發(fā)明實施例中,可以通過計算每個關鍵詞在不同的時間周期之間的增幅的差值來計算每個關鍵詞在不同的時間周期之間的增幅的遞延性,其中,當上述差值未超過預設值時,則每個關鍵詞在不同的時間周期之間的增幅具有遞延性,當上述差值超過預設值時,則每個關鍵詞在不同的時間周期之間的增幅不具有遞延性。
[0079]根據(jù)本發(fā)明的實施例,提供了一種網絡關鍵詞識別處理裝置,該網絡關鍵詞識別處理裝置用于識別關鍵詞的熱門程度。需要說明的是,本發(fā)明實施例的網絡關鍵詞識別處理裝置也可以用于執(zhí)行本發(fā)明實施例的網絡關鍵詞識別處理方法,本發(fā)明實施例所提供的網絡關鍵詞識別處理方法可以通過本發(fā)明實施例的網絡關鍵詞識別處理裝置來執(zhí)行。
[0080]圖6是根據(jù)本發(fā)明第一實施例的網絡關鍵詞識別處理裝置的示意圖。
[0081]如圖6所示,該裝置包括:第一獲取單元10、第二獲取單元20、第一計算單元30和識別單元40。
[0082]第一獲取單元10用于獲取當前時間周期內網絡中關鍵詞帶來的第一訪問人次數(shù)。在本發(fā)明實施例中,時間周期可以預先設定,例如,時間周期可以是一周,即,時間周期可以是7個工作日。網絡中關鍵詞可以是用戶在使用互聯(lián)網時訪問到的關鍵詞,其中包括用戶點擊、搜索的任何關鍵詞和通過點擊、搜索等操作關聯(lián)到的任何關鍵詞。具體地,可以通過網站上的腳本文件獲取網絡中的關鍵詞,進而獲取當前時間周期內該網絡中關鍵詞帶來的第一訪問人次數(shù)。
[0083]例如,假設時間周期長度為一周,并且當前時間周期為2013年的第十周,則第一獲取單元10可以通過網站上的腳本文件獲取網絡中的“ABC”這個關鍵詞的第一訪問人次數(shù),其中,第一訪問人次數(shù)是指“ABC”在2013年的第十周的訪問總量。
[0084]進一步地,在本發(fā)明實施例中,第一訪問人次數(shù)可以包括一個或者多個,其中,第一訪問人次數(shù)與當前時間周期一一對應。例如,當當前時間周期為2013年的第九周時,第一訪問人次數(shù)為2013年的第九周的訪問總量;當當前時間周期為2013年的第十周時,第一訪問人次數(shù)為2013年的第十周的訪問總量。
[0085]第二獲取單元20用于獲取多個歷史時間周期內關鍵詞帶來的第二訪問人次數(shù)。需要說明的是,第二獲取單元20獲取多個歷史時間周期內關鍵詞帶來的第二訪問人次數(shù)即為獲取多個歷史時間周期內各個歷史時間周期的關鍵詞的訪問量總和。第一獲取單元10獲取的的“關鍵詞”與第二獲取單元20獲取的“關鍵詞”為同一關鍵詞。在本發(fā)明實施例中,歷史時間周期與當前時間周期為相鄰的時間周期,并且歷史時間周期與當前時間周期為相對的時間周期。需要說明的是,歷史時間周期的個數(shù)可以預先設定,例如,多個歷史周期可以是根據(jù)當前時間周期向前推算一定個數(shù)的周期時間。
[0086]例如,假設2013年的第十周為當前時間周期,則多個歷史時間周期可以為2013年的第七周至第九周,獲取多個歷史時間周期內關鍵詞帶來的第二訪問人次數(shù)即為獲取2013年的第七周至第九周內關鍵詞帶來的訪問量總和。
[0087]進一步地,在本發(fā)明實施例中,第二訪問人次數(shù)可以包括一個或者多個。其中,第二訪問人次數(shù)與多個歷史時間周期一一對應。例如,當當前時間周期為2013年的第九周時,多個歷史時間周期可以是2013年的第六周至第八周,相應地第二訪問人次數(shù)即為2013年的第六周至第八周的訪問量總和;當當前時間周期為2013年的第十周時,多個歷史時間周期可以是2013年的第七周至第九周,相應地第二訪問人次數(shù)為2013年的第七周至第九周的訪問量總和。
[0088]第一計算單元30用于計算第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值。需要說明的是,在本發(fā)明實施例中,第一計算單元30也可以計算第一訪問人次數(shù)占第二訪問人次數(shù)的比例值。在本發(fā)明實施例中,因為第一訪問人次數(shù)和第二訪問人次數(shù)均可以包括一個或者多個,所以相應地第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值也可以包括一個或者多個。
[0089]識別單元40用于基于比例值對關鍵詞進行識別。具體地,在本發(fā)明實施例中,當比例值越大時,關鍵詞的熱度就越大,否則當比例值越小時,關鍵詞的熱度就越小,當關鍵詞的熱度超過預定值時,關鍵詞即為熱門關鍵詞,否則,當關鍵詞的熱度未超過預定值時,關鍵詞即為冷門關鍵詞。需要說明的是,在本發(fā)明實施例中,優(yōu)選地,還可以基于比例值和絕對值對關鍵詞進行識別,其中,絕對值即為一個或者多個時間周期內關鍵詞的訪問量總和,其可以包括第一訪問人次數(shù)和第二訪問人次數(shù)。
[0090]進一步地,在本發(fā)明實施例中,由于第一訪問人次數(shù)、第二訪問人次數(shù)和第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值均可以包括一個或者多個,因此可以基于多個比例值和關鍵值對關鍵詞進行識別。具體地,當多個比例值差異較小并且多個比例值均較大時,關鍵詞的熱度變化不明顯并且熱度較高,該關鍵詞為持續(xù)熱門關鍵詞,而當多個比例值差異較小并且多個比例值均較小時,關鍵詞的熱度變化不明顯并且熱度較低,該關鍵詞為冷門關鍵詞,否則當多個比例值差異較大時,關鍵詞的熱度變化明顯,該關鍵詞為異動熱門關鍵詞。
[0091]通過本發(fā)明,解決了相關技術中對關鍵詞的識別準確度比較低的問題,進而達到了對關鍵詞的識別準確度比較高效果。
[0092]圖7是根據(jù)本發(fā)明第二實施例的網絡關鍵詞識別處理裝置的示意圖。
[0093]如圖7所示,該實施例可以作為圖6所示實施例的優(yōu)選實施方式,該網絡關鍵詞識別處理裝置包括:第一獲取單元10、第二獲取單元20、第一計算單元30和識別單元40,其中,識別單元40包括計算模塊401和識別模塊402。
[0094]第一獲取單元10、第二獲取單元20和第一計算單元30的作用與圖6所示實施例中的相同,在此不再贅述。
[0095]計算模塊401用于利用比例值和第一訪問人次數(shù)得出當前時間周期的關鍵詞訪問熱度值。需要說明的是,在本發(fā)明實施例中,可以用得分表示比例值,即得分等于比例值。在本發(fā)明實施例中,關鍵詞訪問熱度值用于量化關鍵詞的訪問熱度,當前時間周期的關鍵詞訪問熱度值用于量化當前時間周期的關鍵詞的訪問熱度,其中,如果關鍵詞訪問熱度值越大,則關鍵詞的訪問熱度越高,相反,如果關鍵詞訪問熱度值越小,則關鍵詞的訪問熱度越低。在本發(fā)明實施例中,當前時間周期的關鍵詞訪問熱度值可以通過以下公式進行計算:r=(m*C+x*n)/ (n+C),其中,r表示當前時間周期的關鍵詞訪問熱度值,m為所有關鍵詞的訪問人次平均得分,該訪問人次平均得分是指所有關鍵詞的第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值的平均值,C表示設定的訪問人次常數(shù),X表示預先設定的關鍵詞的訪問人次得分,該關鍵詞的訪問人次得分是指第一訪問人次數(shù)占第一訪問人次數(shù)與第二訪問人次數(shù)之和的比例值,當比例值較大時,關鍵詞的訪問人次得分較高,否則,當比例值較小時,關鍵詞的訪問人次得分較低。η表示預先設定的關鍵詞訪問人次數(shù),該關鍵詞訪問人次數(shù)即為第一訪問人次數(shù)。
[0096]識別模塊402用于根據(jù)關鍵詞熱度值對關鍵詞進行識別。具體地,在本發(fā)明實施例中,當關鍵詞熱度值越大時,關鍵詞的熱度就越大,否則當關鍵詞熱度值越小時,關鍵詞的熱度就越小,當關鍵詞的熱度值超過預定值時,關鍵詞即為熱門關鍵詞,否則,當關鍵詞的熱度值未超過預定值時,關鍵詞即為冷門關鍵詞。進一步地,在本發(fā)明實施例中,由于第一訪問人次數(shù)、第二訪問人次數(shù)和第一訪問人次數(shù)占第二訪問人次數(shù)的比例值均可以包括一個或者多個,因此可以基于多個比例值和絕對值對關鍵詞進行識別,進而可以基于多個關鍵詞熱度值對關鍵詞進行識別。具體地,當多個關鍵詞熱度值差異較小并且多個關鍵詞熱度值均較大時,關鍵詞的熱度變化不明顯并且該關鍵詞為持續(xù)熱門關鍵詞,當多個關鍵詞熱度值差異較小并且多個關鍵詞熱度值均較小時,關鍵詞的熱度變化不明顯并且該關鍵詞為冷門關鍵詞,否則當多個關鍵詞熱度值差異越大時,關鍵詞的熱度變化明顯,該關鍵詞為異動熱門關鍵詞。
[0097]在本發(fā)明實施例中,識別模塊可以包括第一獲取子模塊、第二獲取子模塊、第一計算子模塊和第二計算子模塊。
[0098]第一獲取子模塊用于獲取多個時間周期內的關鍵詞熱度值。
[0099]例如,可以根據(jù)時間周期的關鍵詞訪問熱度值的計算公式分別獲取2013年第一周至第十周的關鍵詞訪問熱度值。在本發(fā)明實施例中,可以將獲取的多個時間周期內的關鍵詞熱度值存儲在關鍵詞熱度值列表中。
[0100]第二獲取子模塊用于獲取多個時間周期內的關鍵詞熱度值與當前時間周期內關鍵詞熱度值的對應關系。
[0101]例如,當客戶端要分析2013年前十周的關鍵詞熱度時,并且如果假設當前時間周期為2013年第十周,則獲取多個時間周期內的關鍵詞熱度值與當前時間周期內關鍵詞熱度值的對應關系即為獲取2013年第一周至第九周的鍵詞熱度值與2013年第十周的關鍵詞熱度值的對應關系;如果假設當前時間周期為2013年第九周,則獲取多個時間周期內的關鍵詞熱度值與當前時間周期內關鍵詞熱度值的對應關系即為獲取2013年第一周至第八周的鍵詞熱度值與2013年第九周的關鍵詞熱度值的對應關系。
[0102]第一計算子模塊用于根據(jù)對應關系加權計算出當前時間周期內的關鍵詞遞延熱度值。在本發(fā)明實施例中,當前時間周期內的關鍵詞遞延熱度值由當前時間周期的前一時間周期內的關鍵詞熱度值和權重系數(shù)確定,例如,當前時間周期為2013年第十周,當前時間周期的前一時間周期為2013年第九周,具體地,可以根據(jù)牛頓冷卻定律確定當前時間周期內的關鍵詞遞延熱度值,即,關鍵詞遞延熱度值=當前時間周期的前一時間周期內的關鍵詞熱度值*權重系數(shù),其中,權重系數(shù)=exp (-冷卻系數(shù)*間隔時間)。
[0103]第二計算子模塊用于根據(jù)關鍵詞訪問熱度值和關鍵詞遞延熱度值得到當前時間周期的關鍵詞熱度值。在本發(fā)明實施例中,具體地,當前時間周期的關鍵詞熱度值=關鍵詞訪問熱度值+關鍵詞遞延熱度值。
[0104]通過本發(fā)明,實現(xiàn)了根據(jù)關鍵詞熱度值對關鍵詞進行識別的目的,解決了相關技術中對關鍵詞的識別準確度比較低的問題,進而達到了對關鍵詞的識別準確度比較高效
果O
[0105]通過本發(fā)明,實現(xiàn)了基于比例值和第一訪問人次數(shù)對關鍵詞進行識別的目的,解決了相關技術中對關鍵詞的識別準確度比較低的問題,進而達到了對關鍵詞的識別準確度比較高效果。
[0106]圖8是根據(jù)本發(fā)明第三實施例的網絡關鍵詞識別處理裝置的示意圖。
[0107]如圖8所示,該實施例可以作為圖6所示實施例的優(yōu)選實施方式,該網絡關鍵詞識別處理裝置除了包括:第一獲取單元10、第二獲取單元20、第一計算單元30和識別單元40之外,還包括包括第二計算單元50和第三計算單元60。
[0108]第一獲取單元10、第二獲取單元20、第一計算單元30和識別單元40的作用與圖6所示實施例中的相同,在此不再贅述。
[0109]第二計算單元50用于計算每個關鍵詞于每段時間周期內的增幅。在本發(fā)明實施例中,具體地,關鍵詞于每段時間周期內的增幅=(關鍵詞在當前時間周期內的第一訪問人次數(shù)-關鍵詞在當前時間周期的前一時間周期內的第一訪問人次數(shù))/關鍵詞在當前時間周期的前一時間周期內的第一訪問人次數(shù)。
[0110]例如,假設2013年第一周為初始時間周期,并且假設在2013年第一周關鍵詞“ABC”的第一訪問人次數(shù)為1000次,2013年第二周關鍵詞“ABC”的第一訪問人次數(shù)為1500次,則2013年第二周關鍵詞“ABC”的第一訪問人次數(shù)較2013年第一周關鍵詞“ABC”的第一訪問人次數(shù)的增幅為(1500-1000) /1000=0.5。
[0111]第三計算單元60用于計算每個關鍵詞在不同的時間周期之間的增幅是否具有遞延性。在本發(fā)明實施例中,第三計算單元60可以通過計算每個關鍵詞在不同的時間周期之間的增幅的差值來計算每個關鍵詞在不同的時間周期之間的增幅的遞延性,其中,當上述差值未超過預設值時,則每個關鍵詞在不同的時間周期之間的增幅具有遞延性,當上述差值超過預設值時,則每個關鍵詞在不同的時間周期之間的增幅不具有遞延性。
[0112]通過本發(fā)明,解決了相關技術中對關鍵詞的識別準確度比較低的問題,進而達到了對關鍵詞的識別準確度比較高效果。
[0113]需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計算機可執(zhí)行指令的計算機系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
[0114]顯然,本領域的技術人員應該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計算裝置來實現(xiàn),它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成的網絡上,可選地,它們可以用計算裝置可執(zhí)行的程序代碼來實現(xiàn),從而,可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結合。
[0115]以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領域的技術人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。
【權利要求】
1.一種網絡關鍵詞識別處理方法,其特征在于,包括: 獲取當前時間周期內網絡中關鍵詞帶來的第一訪問人次數(shù); 獲取多個歷史時間周期內所述關鍵詞帶來的第二訪問人次數(shù); 計算所述第一訪問人次數(shù)占所述第一訪問人次數(shù)與所述第二訪問人次數(shù)之和的比例值;以及 基于所述比例值對所述關鍵詞進行識別。
2.根據(jù)權利要求1所述的網絡關鍵詞識別處理方法,其特征在于,基于所述比例值對所述關鍵詞進行識別包括: 利用所述比例值和所述第一訪問人次數(shù)得出所述當前時間周期的關鍵詞訪問熱度值;以及 根據(jù)所述關鍵詞熱度值對所述關鍵詞進行識別。
3.根據(jù)權利要求2所述的網絡關鍵詞識別處理方法,其特征在于,根據(jù)所述關鍵詞熱度值對所述關鍵詞進行識別包括: 獲取多個時間周期內的關鍵詞熱度值; 獲取所述多個時間周期內的關鍵詞熱度值與所述當前時間周期內關鍵詞熱度值的對應關系; 根據(jù)所述對應關系加權計算出所述當前時間周期內的關鍵詞遞延熱度值;以及根據(jù)所述關鍵詞訪問熱度值和所述關鍵詞遞延熱度值得到所述當前時間周期的關鍵詞熱度值。
4.根據(jù)權利要求2所述的網絡關鍵詞識別處理方法,其特征在于,所述當前時間周期的關鍵詞訪問熱度值通過以下方式進行計算:
r= (m*C+x*n)/(n+C); 其中,C表示設定的訪問人次常數(shù),η表示預先設定的關鍵詞訪問人次數(shù),X表示預先設定的關鍵詞的訪問人次得分,m為所有關鍵詞的訪問人次平均得分,r表示所述當前時間周期的關鍵詞訪問熱度值。
5.根據(jù)權利要求1所述的網絡關鍵詞識別處理方法,其特征在于,在基于所述比例值對所述關鍵詞進行識別之后,所述網絡關鍵詞識別處理方法還包括: 計算每個所述關鍵詞于每段所述時間周期內的增幅;以及 計算每個所述關鍵詞在不同的所述時間周期之間的增幅是否具有遞延性。
6.一種網絡關鍵詞識別處理裝置,其特征在于,包括: 第一獲取單元,用于獲取當前時間周期內網絡中關鍵詞帶來的第一訪問人次數(shù);第二獲取單元,用于獲取多個歷史時間周期內所述關鍵詞帶來的第二訪問人次數(shù);第一計算單元,用于計算所述第一訪問人次數(shù)占所述第一訪問人次數(shù)與所述第二訪問人次數(shù)之和的比例值;以及 識別單元,用于基于所述比例值對所述關鍵詞進行識別。
7.根據(jù)權利要求6所述的網絡關鍵詞識別處理裝置,其特征在于,所述識別單元包括: 計算模塊,用于利用所述比例值和所述第一訪問人次數(shù)得出所述當前時間周期的關鍵詞訪問熱度值;以及 識別模塊,用于根據(jù)所述關鍵詞熱度值對所述關鍵詞進行識別。
8.根據(jù)權利要求7所述的網絡關鍵詞識別處理裝置,其特征在于,所述識別模塊包括: 第一獲取子模塊,用于獲取多個時間周期內的關鍵詞熱度值; 第二獲取子模塊,用于獲取所述多個時間周期內的關鍵詞熱度值與所述當前時間周期內關鍵詞熱度值的對應關系; 第一計算子模塊,用于根據(jù)所述對應關系加權計算出所述當前時間周期內的關鍵詞遞延熱度值;以及 第二計算子模塊,用于根據(jù)所述關鍵詞訪問熱度值和所述關鍵詞遞延熱度值得到所述當前時間周期的關鍵詞熱度值。
9.根據(jù)權利要求7所述的網絡關鍵詞識別處理裝置,其特征在于,所述計算模塊還用于通過以下方式進行計算:
r= (m*C+x*n)/(n+C); 其中,C表示設定的訪問人次常數(shù),η表示預先設定的關鍵詞訪問人次數(shù),X表示預先設定的關鍵詞的訪問人次得分,m為所有關鍵詞的訪問人次平均得分,r表示所述當前時間周期的關鍵詞訪問熱度值。
10.根據(jù)權利要求6所述的網絡關鍵詞識別處理裝置,其特征在于,在基于所述比例值對所述關鍵詞進行識別之后,所述網絡關鍵詞識別處理裝置還包括: 第二計算單元,用于計算每個所述關鍵詞于每段所述時間周期內的增幅;以及 第三計算單元,用于計算每個所述關鍵詞在不同的所述時間周期之間的增幅是否具有遞延性。
【文檔編號】G06F17/30GK103593444SQ201310576492
【公開日】2014年2月19日 申請日期:2013年11月15日 優(yōu)先權日:2013年11月15日
【發(fā)明者】何鑫 申請人:北京國雙科技有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 邵武市| 海淀区| 安徽省| 乐安县| 桦川县| 多伦县| 林周县| 恩平市| 桦甸市| 水富县| 云和县| 那坡县| 东明县| 兴隆县| 江安县| 鄄城县| 兴文县| 石嘴山市| 拜城县| 舞阳县| 樟树市| 香河县| 思南县| 方山县| 普宁市| 科尔| 新干县| 汶川县| 高淳县| 南充市| 中西区| 察隅县| 石景山区| 奉节县| 都安| 福清市| 宣恩县| 亚东县| 阿克| 静安区| 同江市|