首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于词性选择的文本预处理方法研究
引用本文:李英.基于词性选择的文本预处理方法研究[J].情报科学,2009(5).
作者姓名:李英
作者单位:河北北方学院,图书馆,河北,张家口075000  
摘    要:预处理是文本分类中的一个重要环节,预处理结果的好坏不仅关系到分类的准确度,而且关系到训练时间的长短和影响到分类的速度.采用一种基于词性选择的文本预处理方法进行文本预处理,该方法与传统方法进行了实验对比,结果显示,该方法降低了特征维数,同时保证了分类性能.实验表明该方法能够获得较好的分类效果.

关 键 词:文本分类  停用词  词性  文本预处理

Research on the Text Pretreatment Based on Part of Speech Selection
LI Ying.Research on the Text Pretreatment Based on Part of Speech Selection[J].Information Science,2009(5).
Authors:LI Ying
Institution:Library of Hebei North University;Zhangjiakou 075000;China
Abstract:The text pretreatment is in a text classification important link,the pretreatment result quality not only relates the classification the accuracy,moreover relates the training time the length and affects the classified speed.This article used one kind to carry on the text pretreatment based on the lexical category choice text pretreatment method,this method and the conventional routes have carried on the experiment contrast,finally demonstrated that this method reduced the characteristic dimension,simultane...
Keywords:text categorization  stop-words  part of speech  text pretreatment  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号