首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于学术文献同被引分析的K-means算法改进研究
引用本文:吴夙慧,成颖,郑彦宁,潘云涛.基于学术文献同被引分析的K-means算法改进研究[J].情报学报,2012,31(1).
作者姓名:吴夙慧  成颖  郑彦宁  潘云涛
作者单位:1. 南京大学信息管理系,南京,210093
2. 中国科学技术信息研究所,北京,100038
摘    要:K-means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题.本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K-means改进算法.该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类.算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K-means算法的初始聚类中心.第二步聚类则依据文献内容实现K-means算法.实验通过与经典K-means算法和基于凝聚层次聚类算法的改进K-means算法的对比,证明了本文提出的改进的K-means算法具备更优的聚类效果.

关 键 词:K-means算法  K值  初始聚类中心  同被引  文献聚类

Improvement of K-means Algorithm Based on Co-citation Analysis
Wu Suhui,Cheng Ying,Zheng Yanning,Pan Yuntao.Improvement of K-means Algorithm Based on Co-citation Analysis[J].Journal of the China Society for Scientific andTechnical Information,2012,31(1).
Authors:Wu Suhui  Cheng Ying  Zheng Yanning  Pan Yuntao
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号