首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种文本无监督特征选择方法
引用本文:辛颖梅,孙志挥.一种文本无监督特征选择方法[J].教育技术导刊,2009,8(9):9-11.
作者姓名:辛颖梅  孙志挥
作者单位:南京擎天科技公司;东南大学计算机学院;
摘    要:由于向量空间模型在文本聚类中的应用,而必须对文本特征进行降维。本方法首先利用特征的概率分布计算特征之间的相似度,在此基础上对特征进行聚类;然后在文本聚类的结果上计算各个特征的信息增益值;最后在各个特征类上取出一定比例的最重要的特征达到特征选择的目标。实验表明,该改进算法在聚类的准确度方面较以前的方法有所提高,可以有效地用于文本自动聚类。

关 键 词:文本聚类  特征选择  联合概率  DBSCAN  
本文献已被 CNKI 维普 等数据库收录!
点击此处可从《教育技术导刊》浏览原始摘要信息
点击此处可从《教育技术导刊》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号