首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Web文本分类技术研究现状述评
引用本文:高淑琴.Web文本分类技术研究现状述评[J].图书情报知识,2008(3):81-86.
作者姓名:高淑琴
作者单位:江苏徐州师范大学图书馆,徐州,221116
摘    要:本文在分析国内外Web文本分类方法研究现状的基础上,对新近出现的基于群的分类方法、基于模糊—粗糙集的文本分类模型、多分类器融合的方法、基于RBF网络的文本分类模型、潜在语义分类模型等新方法,以及K—近邻算法和支持向量机的新发展等进行了深入探讨;并对Web文本分类过程的几个关键技术:文本预处理、文本表示、特征降维、训练方法和分类算法进行了分析;最后总结了Web文本分类技术存在着新分类方法不断涌现、传统分类方法的进一步发展、文本、语音和图像分类技术的融合等几种发展趋势,以及存在着分词问题、目前还没有发现"最佳"的特征选择等研究的不足之处。

关 键 词:Web文本分类  数据挖掘  机器学习
文章编号:1003-2797(2008)03-0081-06
修稿时间:2007年11月22

A Survey on Web Text Classification
Gao Shuqin.A Survey on Web Text Classification[J].Document,Information & Knowledge,2008(3):81-86.
Authors:Gao Shuqin
Abstract:This article has analyzed the research present situation of domestic and foreign Web text classification method firstly,has analyzed the new methods which recently appeared,swarm-based approaches,based on the fuzzy-rough collection text classification model,the multi-sorters fusion method,based on RBF network text classification model,latent semantic classification model and so on,as well as the recent development of the K-NN and the support vector machine(SVM)method;And has discussed the Web text classification process several essential technologies:The text pretreatment,the text expressed,the characteristic fell Uygur,the training method and the classified algorithm;Finally summarized the development tendency and deficiency of Web text classification technology.
Keywords:Web text classification Data mining Machine learning
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号