首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种混合文本分类方法研究
引用本文:白如江,王效岳.一种混合文本分类方法研究[J].图书情报工作,2009,53(14):115-148.
作者姓名:白如江  王效岳
作者单位:山东理工大学图书馆
基金项目:山东省自然科学基会项目 
摘    要:文本自动分类是信息检索领域的一个重要研究方向。一些标准的机器学习算法像支持向量机已经成功地运用到了这一领域。不幸的是高维的输入向量严重的影响了分类速度,而支持向量机核函数参数的确定影响到分类的精度。为了提高分类精度和分类速度,本文提出了一种混合分类算法,首先用粗糙集理论对向量进行约简,然后采用基因算法对支持向量机的核函数参数进行优化。实验证明我们提出的算法是有效的。

关 键 词:文本分类  支持向量机  粗糙集  遗传算法  
收稿时间:2009-01-09
修稿时间:2009-04-07

Study on A Hybrid Text Classification Method
Bai Rujiang,Wang Xiaoyue.Study on A Hybrid Text Classification Method[J].Library and Information Service,2009,53(14):115-148.
Authors:Bai Rujiang  Wang Xiaoyue
Institution:The Library of Shandong University of Technology,
Abstract:The kernel parameters setting for SVM in a training process impacts on the classification accuracy. Feature selection is another factor that impacts classification accuracy. The objective of this work is to reduce the dimension of feature vectors, optimizing the parameters to improve the SVM classification accuracy and speed. In order to improve classification speed, the study use rough sets theory to reduce the feature vector space. The paper presents a genetic algorithm approach for feature selection and parameters optimization to improve classification accuracy. Experimental results indicate that the method is more effective than traditional SVM  and other traditional methods.
Keywords:document classification support vector machinerough sets genetic algorithms
本文献已被 万方数据 等数据库收录!
点击此处可从《图书情报工作》浏览原始摘要信息
点击此处可从《图书情报工作》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号