首页 | 本学科首页   官方微博 | 高级检索  
     检索      

ACTC:一种基于改进的蚁群算法的中文文本聚类算法
引用本文:刘泉凤.ACTC:一种基于改进的蚁群算法的中文文本聚类算法[J].图书情报工作,2009,53(9):108-111.
作者姓名:刘泉凤
作者单位:浙江水利水电专科学校
摘    要:在对标准蚁群算法分析研究基础上,结合中文文本数据的特点,对蚁群算法存在的缺点进行改进,提出一种基于改进的蚁群算法的中文文本聚类方法——ACTC。算法中为每只蚂蚁增加两个记忆体,可以解决原算法中的“未指派现象”;模拟信息素,从而使蚂蚁的移动更具目的性,加快聚类速度;引入“边界点”思想,从而不仅可以消除“停滞现象”,而且能避免“噪声”或异常数据对聚类结果的负面影响;引入动态调整相似度阈值概念,从而使聚类结果更具实际意义。实验证明,从熵值与纯度两个评价函数评价结果看,该算法的聚类效果较好,达到算法改进的目的。

关 键 词:文本聚类  聚类算法  中文信息处理  
收稿时间:2008-07-28
修稿时间:2008-09-22

ACTC:A Chinese Text Clustering Based on Improved Ant Colony Algorithm
Liu Quanfeng.ACTC:A Chinese Text Clustering Based on Improved Ant Colony Algorithm[J].Library and Information Service,2009,53(9):108-111.
Authors:Liu Quanfeng
Abstract:Based on the study of standard ant clustering algorithm, with regard to Chinese text data’s characteristic, this paper puts forward a new method of Chinese text clustering that improves the algorithmic performance: ACTC. By adding two caches to every ant, simulating the information element, introducing “boundary point”,and adjusting the threshold of similarity dynamically, the method has avoided “the noise” or the unusual data’s influence on the clusters, and has speeded up the clustering effect . Experiments show that the proposed algorithm can not only cluster Chinese text data, but also has more clustering effect than ant clustering algorithm on these 2 evaluation index entropy and purity, thus has improved the original algorithm.
Keywords:text clustering  clustering algorithm  Chinese information processin  
本文献已被 万方数据 等数据库收录!
点击此处可从《图书情报工作》浏览原始摘要信息
点击此处可从《图书情报工作》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号