首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中文文本关键词自动抽取方法研究
引用本文:张雪英,Jürgen Krause.中文文本关键词自动抽取方法研究[J].情报学报,2008,27(4).
作者姓名:张雪英  Jürgen Krause
作者单位:1. 南京师范大学地理信息科学江苏省重点实验室,南京,210097
2. Social Science Information Centre, Bonn D-53113, Germany
基金项目:德国Social Science Information Centre资助项目,德国学术交流协会(DAAD)提供资助项目
摘    要:随着信息技术的发展,中文电子文本信息资源正以惊人的速度急剧增长.文本自动处理技术,通过自动组织海量文献信息资源,能够为用户提供简易有效的信息检索服务.关键词自动抽取是文本自动处理的基础和核心.汉语的特殊性加剧了中文文本关键词自动抽取的难度.本文提出了一种基于N-gram权重计算和关键词筛选算法的中文文本关键词自动抽取方法.该方法不依赖特定的数据集和中文分词技术,可以有效地抽取出任意单篇文本的关键词,而且通过参数调整,应用系统可以灵活地控制标引深度和标引专指度.实验表明,该方法简单、快速、断词错误率低,标引性能明显优于基于中文分词和TF/IDF的方法,可以满足大规模文本的在线处理要求.

关 键 词:中文文本  关键词抽取  文本表达

An Approach to Automatic Keyword Extraction in Chinese Text
Zhang Xueying,Jürgen Krause.An Approach to Automatic Keyword Extraction in Chinese Text[J].Journal of the China Society for Scientific andTechnical Information,2008,27(4).
Authors:Zhang Xueying  Jürgen Krause
Abstract:With the development of information technology,Chinese electronic text documents increase rapidly.Automatic text processing techniques can provide simple and efficient information services through the automatic organization of information resources.Automatic Keyword Extraction is proven to be one of their most important functions.It is generally believed that due to the inherent differences in languages,the previous approaches are always blocked by the problems of Chinese word segmentation has.This paper pr...
Keywords:Chinese text documents  keyword extraction  text representation  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号