麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種基于改進TF?IDF關鍵詞提取算法的制作方法

文檔序號:11230422閱讀:來源:國知局

技術特征:

技術總結
本發明公開一種基于改進TF?IDF關鍵詞提取算法,其包括以下步驟:S1:將文本的輸入形式統一格式化;S2:對Stanford?NLP加載配置文件;S3:在配置文件中得到文本中的所有句子集合Sentences;S4:每次從Sentences中取一句子;S5:獲取當前的句子中所有詞語集合Tokens;S6:每次從Tokens中取一token;S7:得到當前token的字/詞語和詞性,并賦予不同詞性權值;S8:計算當前句子中字/詞語的總數及其位置百分比;S9:獲取文本中所有字/詞語集合Words;S10:每次從Words取一word;S11:計算當前word的TF和IDF;S12:計算所有word詞語的權重W,依據詞語的權重W選取關鍵詞。本發明增加詞性因子,提高提取準確度,解決構造Pat?tree等空間復雜的問題。

技術研發人員:金彪;方敏霞;沙晉明;熊金波;李璇;林劼
受保護的技術使用者:福建師范大學
技術研發日:2017.05.23
技術公布日:2017.09.08
當前第2頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 惠水县| 西藏| 平利县| 荔浦县| 子洲县| 乌兰浩特市| 昆明市| 军事| 青川县| 额济纳旗| 舟曲县| 平潭县| 庐江县| 蒙自县| 和顺县| 隆回县| 阜康市| 闸北区| 荆门市| 同德县| 长春市| 安龙县| 定州市| 齐齐哈尔市| 沅陵县| 荔波县| 札达县| 昌黎县| 海安县| 宣城市| 兴海县| 澄城县| 深水埗区| 东海县| 达拉特旗| 宣城市| 乌兰察布市| 天津市| 大名县| 修文县| 焦作市|