首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于支持向量机的文本自动分类试验研究
引用本文:施洁斌.基于支持向量机的文本自动分类试验研究[J].现代图书情报技术,2004,20(7):27-29.
作者姓名:施洁斌
作者单位:浙江大学图书馆,杭州,310029
摘    要:提出了将支持向量机应用于文本自动分类的研究,与常用的K-最邻近法相比,无论是对训练数据集还是测试数据集均具有一定的优势,而且不同特征选择方法对支持向量机的影响要比K-最邻近法小。此外,从研究中的不同特征选择的评价函数来看,它们对分类有一定的影响,应用X2统计进行特征选择的分类正确率最高,其次是文本证据权,而期望交叉熵的效果最差,说明特征选择在文本自动分类中也是相当重要的。

关 键 词:文本自动分类  支持向量机  K-最邻近法  特征选择
收稿时间:2004-02-23

Study on Automatic Text Categorization with Support Vector Machine
Shi Jiebin.Study on Automatic Text Categorization with Support Vector Machine[J].New Technology of Library and Information Service,2004,20(7):27-29.
Authors:Shi Jiebin
Institution:(Zhejiang University Library, Hangzhou 310029, China)
Abstract:A new machine learning method of Support Vector Machine (SVM), is applied in automatic text categorization. Comparing with the result achieved by k-nearest neighbor algorithm, the accuracy achieved by support vector machine is better; The effect of feature selection methods is smaller to SVM than the KNN method. The SVM is a potential and competitive method for automatic text categorization. The feature selection methods also affectes the accuracy of text categorization.
Keywords:Automatic text categorization  Support vector machine  K-nearest neighbor algorithm  Feature selection
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《现代图书情报技术》浏览原始摘要信息
点击此处可从《现代图书情报技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号