首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于主成分和密度的改进型动态数据流聚类算法
引用本文:琚春华,梅铮,许寰.一种基于主成分和密度的改进型动态数据流聚类算法[J].情报学报,2010,29(4).
作者姓名:琚春华  梅铮  许寰
作者单位:浙江工商大学计算机与信息工程学院,杭州,310018
基金项目:国家自然科学基金,浙江省自然科学基金重点项目,浙江省自然科学基金,浙江省科技计划项目 
摘    要:本文主要研究了在有限资源约束下的数据流聚类方法.针对海量,高速的数据流,现有聚类方法在有界内存和有界时间的限制下,难以快速有效地进行聚类,设计了一种基于主成分和密度的动态数据流聚类算法,PDStream算法.它采用滑动窗口管理数据流;首先使用主成分模型作为前置系统,它负责对基本窗口内的源数据进行属性转换,起到了降维的作用;然后使用密度聚类模型作为后置系统进行聚类操作;最后对系统中生成的概要数据进行简化的二次聚类并更新聚类簇.通过实验表明,PDStream算法有效克服了STREAM算法使得聚类受控于历史数据的缺点,显现出处理海量数据的优越性以及聚类质量高的特点.

关 键 词:数据流聚类  主成分分析  密度  滑动窗口

An Improved Clustering Algorithm for Dynamic Data Streams Based on Principal Component Analysis and Density
Ju Chunhua,Mei Zheng,Xu Chonghuan.An Improved Clustering Algorithm for Dynamic Data Streams Based on Principal Component Analysis and Density[J].Journal of the China Society for Scientific andTechnical Information,2010,29(4).
Authors:Ju Chunhua  Mei Zheng  Xu Chonghuan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号