首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 625 毫秒
1.
CLIQUE是一种基于密度和基于网格的混合聚类方法。在高维空间中,它能够有效地进行聚类,并且能够发现嵌套在高维数据空间子空间中的聚类。但是,CLIQUE算法存在着很多的局限性,主要有以下两点:首先是子空间的剪枝;其次是CLIQUE算法追求方法简单化。针对CLIQUE算法的局限性,采用基于约束条件的聚类技术、自适应网格技术和边界调整技术来对CLIQUE算法进行改进,提出了基于约束条件和自适应网格的CAG-CLIQUE算法。  相似文献   

2.
在云计算环境下,针对K-means对初始聚类中心敏感和易陷入局部最优的缺点,进行K-means聚类中心优化求解,提高对海量数据的聚类处理能力。传统方法采用动态干扰信任感推荐方法进行数据聚类中心求解,聚类中心对初始值敏感性较强,数据聚类效果不好。提出一种基于粒子群密度最大距离凹函数构建和边界隶属度特征分析的云计算中K-means聚类中心优化求解方法。通过云计算处理,对数据聚类余下样本点按照与聚类中心的相似程度来划分成k类,对原始变量数据的差异化特征进行降维处理,通过搜索空间中的粒子,每一个粒子自身都有速度、位置和适应度,通过迭代找到最优解,进行数据规范化预处理,数据预处理包括选择数量,类型和特征的标度,进行边界隶属度特征分析,实现云计算数据的聚类改进。仿真结果表面,该算法对云计算数据的聚类性能优越,聚类中心求解准确,克服了传统的K-means对初始聚类中心敏感和易陷入局部最优的缺点,应用价值较大。  相似文献   

3.
研究高效进行数据聚类,提高数据聚类能力的问题。传统的模糊C均值算法具有对初始值和噪声极为敏感和遗传算法在局部极值点收敛的缺陷。基于模糊c均值聚类算法,提出一种改进的优化聚类算法。利用混沌序列的均匀遍历特性和差分进化算法的高效全局搜索能力,对模糊c均值算法进行改进,利用Logistics混沌映射对聚类算法进行优化搜索,把混沌扰动量引入到进化种群当中,弥补了模糊C均值算法的缺陷。采用改进的Logistics映射扰动搜索聚类算法,以目标识别为案例,综合4类目标特征参数为研究对象,开发了一套有价值的目标识别专家系统软件。仿真实验表明,改进的数据聚类算法,具有优越的数据聚类性能,聚类判断准确率提高明显,设计的专家系统软件对目标识别特征分类具有较好的准确性和可靠性,具有一定的应用价值。  相似文献   

4.
在对最佳任务调度下的Web数据进行优化聚类的过程中,容易出现原始数据损失的情况,导致传统数据优化聚类算法,由于忽略初始数据,无法有效实现Web数据优化聚类。提出一种基于粒子群优化的最佳任务调度下Web数据优化聚类算法,依据任务价值密度以及执行紧迫性,塑造动态优先级,通过适应度函数对分类计划进行评价,给出类间距与类内距计算公式,对相关参数和各粒子的位置以及速度向量进行初始化操作;求出粒子的适应度;求出粒子个体最优与群最优;依据粒子群优化算法的位置以及速度对当前位置和速度进行更新;通过K-means算法对EHCF进行聚类,直至全部Web数据聚类完成。仿真实验结果表明,所提方法在Web数据优化聚类上具有很高的优越性。  相似文献   

5.
倪现君 《中国科技信息》2008,(4):122-122,124
对个人网上银行数据仓库的数据处理中使用了Birch算法Birch算法充分考虑到数据分布的不均衡性,利用簇对数据对象进行划分,将对数据对象的聚类转变为对簇的聚类,给出了Birch算法的改进算法,井将其应用在个人网上银行数据仓库的数据处理中,论证了其在处理海量数据时显著的优越性。  相似文献   

6.
徐峰 《科协论坛》2008,(5):68-68
本文对个人网上银行数据仓库的数据处理中使用了Birch算法Birch算法充分考虑到数据分布的不均衡性.利用簇对数据对象进行划分,将对数据对象的聚类转变为对簇的聚类,给出了Birch算法的改进算法,并将其应用在个人网上银行数据仓库的数据处理中,论证了其在处理海量数据时显著的优越性.  相似文献   

7.
目前提出的大多数聚类融合算法在策略选择上未能同时兼顾聚类成员的多样性及质量,而且对高维数据的聚类结果均不理想,针对以上问题,本文提出一种改进的投影聚类融合算法,该算法主要在以往经典的投影聚类算法的基础上进行了改进,将投影聚类与分形维数结合,可对高维数据集进行降维聚类处理;而且该算法将选出最优参照成员,并设计出合理的选择策略,对部分优质成员进行选择,以得到一个更加准确的最终结果。高维数据聚类仿真实验结果表明,本文提出的改进的投影聚类融合算法与其他经典数据聚类融合算法相比,提高了聚类的有效性,大大提高了数据融合性能。  相似文献   

8.
介绍了自适应近邻聚类算法的原理,并对算法中的几个名词进行了解释;分别采用自适应近邻聚类与K-Means聚类对半月形数据集进行了实验演示;将自适应近邻聚类与个性化推荐系统相结合,采用自适应近邻聚类对某高校3个专业65名学生读者的借阅记录数据进行聚类处理,验证了相同专业读者具有相似借阅行为这一规律,进而说明了该算法应用在个性化推荐中有效可行。自适应聚类是一种优秀的聚类算法,在实际数据聚类应用中具有良好的效果。  相似文献   

9.
将信息熵对信息和数据的不确定性分析来度量数据所带来的不确定性程度,利用数据挖掘算法中的蚁群聚类算法,结合信息熵理论对网络客户数据进行分析,其中,信息熵理论中的不确定性分析,可以较好的帮助聚类数据对象,数据在此基础上进行再重组,其结果可进一步提高决策的有效性。  相似文献   

10.
云模型和谱聚类是近年来国内外进行数据聚类分析的两个研究热点。云模型刻画聚类过程的随机性和模糊性之间的关联性,分析聚类对象的不确定性。谱聚类不对数据的全局结构作假设,具有识别数据非凸分布的能力。首先介绍这两种聚类算法的基本理论,分析和比较它们的聚类本质,然后由图像分割实验实现聚类分析过程,最后阐述两种聚类算法的聚类特性,并给出各自的适用范围。  相似文献   

11.
一种基于密度最大值的聚类算法   总被引:1,自引:0,他引:1  
提出了一种结合了基于密度聚类思想的划分聚类方法——"密度最大值聚类算法(MDCA)",以最大密度对象作为起始点,通过考察最大密度对象所处空间区域的密度分布情况来划分基本簇,并合并基本簇获得最终的簇划分.实验表明,MDCA能够自动确定簇数量,并有效发现任意形状的簇,对于未知数据集的处理能力和聚类准确度都优于传统的基于划分聚类算法.  相似文献   

12.
对海量数据信息进行迭代聚类能够为数据挖掘提供准确的依据,具有重要的应用价值。传统算法对于初始参数的选取过于敏感,从而降低了迭代聚类的准确率。提出基于并归聚类的海量数据信息中的迭代聚类方法。采用离差隶属度进行数据信息聚类中心的计算,确定数据信息的聚类中心;采用类间距离作为并归聚类判别的标准,用于判定数据信息特征与聚类中心的距离;对海量数据信息特征与聚类中心的计算结果进行归类处理,直至所有的数据信息的聚类中心都结束并归,从而获得准确的迭代聚类结果。仿真实验结果表明,改进算法能够提高海量数据信息中的迭代聚类结果,效果令人满意。  相似文献   

13.
针对K-Means算法中对初始聚类中心进行随机选择并未达到理想优化的情况,提出一种改进的初始聚类中心选择算法。改进算法首先将原始数据进行预处理并计算各维有效数据的最大值和最小值,然后利用各维有效数据的最大值和最小值进行数据分段和初始聚类中心选择,最后采用VS集成开发环境进行建模。采用遵义医学院2010级的学生计算机考试成绩数据对模型进行仿真,仿真结果显示聚类挖掘性能相对K-Means算法较高,证明改进的初始聚类中心选择算法可以提供精确的聚类挖掘结果。  相似文献   

14.
提出改进的并行化谱聚类算法。该算法对于距离矩阵与相似度矩阵进行了改进,并在其中加入了kd树技术以对大规模数据进行稀疏化处理;然后在进行数据特征计算时,将数据以拉普拉斯矩阵的方式存入Hadoop之中,通过运行Lanczos分布计算的形式得到了其向量特征;最后运用在聚类算法中的较为高效的k-means聚类算法对向量特征的转置矩阵进行处理从而得到了需要的聚类结果。仿真实验结果表明,本文所提出的谱聚类并行算法能够为大规模的数据挖掘工作带来性能的巨大提升。  相似文献   

15.
针对K-means聚类算法无法确定k值,并容易忽视在多维角度下进行聚类的缺点,本文提出了改进的多维度的加权的算法,在自适应K-means聚类算法的基础上引入了视图权重和变量权重,得到了包含多层变量的目标函数,通过数学证明使得目标函数最小化,得到最优的聚类效果。实验采用3个标准数据集作为聚类研究的对象,通过与FCM算法比较,说明了本文算法在聚类方面具有良好的效果。  相似文献   

16.
一种改进的K-means算法   总被引:1,自引:0,他引:1  
K-means算法是聚类算法中最经典的划分算法之一,它对初值的依赖性很强,聚类结果随初始聚类中心选择的不同而波动很大。提出了一种改进的K-means算法,运用Kruskal算法生成聚类对象的最小生成树(MST),按权值从大到小删去K-1条边,得到的K个连通子图中对象的均值作为初始聚类中心进行聚类。由仿真实验表明,K-means算法较传统算法有更好的聚类效果和准确性。  相似文献   

17.
郭文娟 《科技风》2022,(4):63-65
针对传统的K-means算法运行的结果依赖于初始的聚类数目和聚类中心,本文提出了一种基于优化初始聚类中心的K-means算法.该算法通过量化样本间距离和聚类的紧密性来确定聚类数目K值;根据数据集的分布特征来选取相距较远的数据作为初始聚类中心,避免了传统K-means算法的聚类数目和聚类中心的随机选取.UCI机器学习数据...  相似文献   

18.
张蓉  钟艳 《科技通报》2014,(4):47-49
为开发高效的数据挖掘算法,实现模糊集聚类算法的高效性,将BIRCH聚类算法思想与模糊集算法进行融合。通过对模糊集算法处理的数据进行二次聚类计算,细化群边缘,最后加载判别函数进行数据定位,完成数据挖掘。最后使用KDDCUP2011数据库进行仿真实验,对目标数据进行挖掘,证实了融合BIRCH聚类算法思想的模糊集算法具有可行性,对比改进前的算法在数据挖掘方面效率更高。  相似文献   

19.
对大数据的分层建树聚类,提高对大数据的检测和大数据应用系统的故障分析能力。传统方法中对大数据的分层聚类采用K-Means聚类算法,容易陷入局部收敛,聚类效果不好。提出一种基于核向量机的数据的分层建树聚类。采用四叉树算法对多维数据进行数据预处理,进行KNN中心区域的聚类中心扩展处理,针对大数据的类域交叉性进行了一次核向量机差分比较,得到KNN模糊划分矩阵,根据所属类别的不同对已知样本进行分层,得到一维差分分层建树模型和二维差分分层建树模型,计算数据核向量之间的相似度特征,实现矩阵的数据点数模糊集合贴近度填充,实现聚类算法改进。仿真结果表明,该算法具有优越的大数据聚类性能,收敛性好,应用到网络在线故障诊断中,实现对故障信号的和恢复跟踪,提高了故障诊断效益,展示了较好的应用价值。  相似文献   

20.
二阶锥规划是在有限个二次锥的笛卡尔空间仿射变换交集上的极小化和极大化线性函数,采用修正的二阶锥规划模型,结合二阶锥的凸优化条件,进行大数据聚类算法改进,提高数据的聚敛性。传统方法中对大数据聚类的二阶锥规划模型采用线性对偶锥规划方法,对数据聚类的路径跟踪性能不好。提出一种基于修正的齐次二阶锥规划模型的大数据聚类算法。进行数据的特征挖掘和信息流模型构建,从大量的、有噪声的、模糊的数据中进行大数据的功率谱密度特征提取,采用粗糙概念格方法对大数据信息流进行二阶锥规划模型构建,结合齐次二阶锥规划模型算法有限收敛性,对每一数据聚类样本进行可靠性衡量,实现数据聚类中心的准确搜索。对聚类误差函数求最优解,使得误差收敛到零。仿真结果表明,该算法进行数据聚类的精度较高,收敛性较好,避免了出现局部最优解,性能优越于传统算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号