基于学术文献同被引分析的K-means算法改进研究 Improvement of K-means Algorithm Based on Co-citation Analysis期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于学术文献同被引分析的K-means算法改进研究

引用本文：	吴夙慧,成颖,郑彦宁,潘云涛.基于学术文献同被引分析的K-means算法改进研究[J].情报学报,2012,31(1).

作者姓名：	吴夙慧成颖郑彦宁潘云涛

作者单位：	1. 南京大学信息管理系,南京,210093 2. 中国科学技术信息研究所,北京,100038

摘要：	K-means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题.本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K-means改进算法.该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类.算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K-means算法的初始聚类中心.第二步聚类则依据文献内容实现K-means算法.实验通过与经典K-means算法和基于凝聚层次聚类算法的改进K-means算法的对比,证明了本文提出的改进的K-means算法具备更优的聚类效果.
关键词：	K-means算法 K值初始聚类中心同被引文献聚类
Improvement of K-means Algorithm Based on Co-citation Analysis

Wu Suhui,Cheng Ying,Zheng Yanning,Pan Yuntao.Improvement of K-means Algorithm Based on Co-citation Analysis[J].Journal of the China Society for Scientific andTechnical Information,2012,31(1).

Authors:	Wu Suhui Cheng Ying Zheng Yanning Pan Yuntao

Abstract:

Keywords:
本文献已被万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏