1.一種基于社交網絡平臺的輿情分析方法,其特征在于:所述該基于社交網絡平臺的輿情分析方法,具體步驟如下:
S1:通過搜索引擎后臺的搜索日志,記錄網民IP地址、搜索時間、搜索詞和被點擊的結果網頁URL地址數據,通過統計分析用戶的搜索詞及搜索頻率,獲得數據集;
S2:對步驟S1中獲取的數據集中的自然語義文本處理為計算機可處理的結構化數據,并過濾掉重復的內容;
S3:經過預處理后的數據實施基于詞向量的聚類分析,采用優化后的均值聚類,進行聚類后將每類數據合為一個文檔集合;
S4:依據步驟S3中的文檔集合,抽取其中出現頻率較高的搜索詞和被點擊的結果網頁URL地址數據信息,得到相關熱度的輿情結果。
2.根據權利要求1所述的一種基于社交網絡平臺的輿情分析方法,其特征在于:所述步驟S2中,對數據集的處理方法為:
S21:過濾具有針對性的對話互動信息,盡可能的消除噪聲數據;
S22:將數據集中的內嵌外部鏈接URL中的信息抽取并添加到社交平臺信息中;
S23:去除數據集中的分詞、停用詞和非法字符,初步得到干擾度較少的數據集信息。
3.一種基于社交網絡平臺的輿情分析系統,其特征在于:所述該基于社交網絡平臺的輿情分析系統包括信息采集層、調度層、輿情分析單元、輿情數據存儲和輿情信息服務。
4.根據權利要求3所述的一種基于社交網絡平臺的輿情分析系統,其特征在于:所述信息采集層對互聯網信息中的論壇、新聞、網頁、博客、貼吧和社區的信息進行實時的監測和采集。
5.根據權利要求3所述的一種基于社交網絡平臺的輿情分析系統,其特征在于:所述調度層實現采集任務的下發和采集數據的去重,采集的范圍和頻率參數通過采集任務調度進行配置。
6.根據權利要求3所述的一種基于社交網絡平臺的輿情分析系統,其特征在于:所述輿情分析單元對采集的信息內容進行關鍵熱詞、趨勢分析、輿情管理、負面信息、專題檢測、連接分析、熱點發現、文本聚類和情感分析。
7.根據權利要求3所述的一種基于社交網絡平臺的輿情分析系統,其特征在于:所述輿情數據存儲內置存儲器,在存儲器中可存儲網頁快照和附件存儲。
8.根據權利要求3所述的一種基于社交網絡平臺的輿情分析系統,其特征在于:所述輿情信息服務具有輿情預警和輿情簡報功能,并提供專題服務。
9.根據權利要求8所述的一種基于社交網絡平臺的輿情分析系統,其特征在于:所述輿情預警設定了在指定時間內實例的負面信息達到相應數目的預警等級,具有對預警條件增刪改查功能,并能夠根據預警條件鑒定各實例的預警等級,輿情簡報以簡報的形式呈現每日每周重點輿情,且簡報有多種設計格式供選擇和編輯。