基于改进预测强度的大数据K-均值聚类方法 |
| |
引用本文: | 蔡洪山,许峰.基于改进预测强度的大数据K-均值聚类方法[J].教育技术导刊,2016,15(5):4-6. |
| |
作者姓名: | 蔡洪山 许峰 |
| |
作者单位: | 安徽理工大学 计算机学院;安徽理工大学 理学院,安徽 淮南 232001 |
| |
摘 要: | 为了降低偶然因素的影响,提出了一种基于改进预测强度的大数据K 均值聚类方法,其基本思想是:首先将数据集若干等分,每一等分轮流作为测试集,取其平均预测强度,然后根据预测强度确定聚类数和聚类变量,再用K 均值聚类方法对数据集进行聚类。用上述方法研究了访客在某网站各栏目的平均停留时间,结果表明,基于预测强度的聚类方法较常规聚类方法更适宜于大数据的聚类分析。
|
关 键 词: | 大数据 K-均值聚类 预测强度 网站栏目关注度 |
|
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|