首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于TFIDF方法的中文关键词抽取算法
引用本文:徐文海,温有奎.一种基于TFIDF方法的中文关键词抽取算法[J].情报理论与实践,2008,31(2):298-302.
作者姓名:徐文海  温有奎
作者单位:西安电子科技大学,经济管理学院,陕西,西安,710071
摘    要:本文在海量智能分词基础之上,提出了一种基于向量空间模型和TFIDF方法的中文关键词抽取算法.该算法在对文本进行自动分词后,用TFIDF方法对文献空间中的每个词进行权重计算,然后根据计算结果抽取出科技文献的关键词.通过自编软件进行的实验测试表明该算法对中文科技文献的关键词自动抽取成效显著.

关 键 词:关键词抽取  向量空间模型  算法
收稿时间:2007-08-07
修稿时间:2007年8月7日

A Chinese Keyword Extraction Algorithm Based on TFIDF Method
Xu Wenhai et al.A Chinese Keyword Extraction Algorithm Based on TFIDF Method[J].Information Studies:Theory & Application,2008,31(2):298-302.
Authors:Xu Wenhai
Abstract:On the basis of Massive Intelligent Segmentation, this paper proposes a Chinese keyword extracting algorithm based on Vector Space Model and TFIDF method. After automatic segmentation of text, this algorithm calculates the weight of every word in document space with TFIDF method and extracts the keywords of scientific and technical documents according to the calculation result. The experimental test with self-compiled software indicates the algorithm improves the efficiency of automatic keyword extraction of Chinese scientific and technical documents obviously.
Keywords:keyword extraction  VSM  algorithm
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号