首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 166 毫秒
1.
谱聚类在近年来得到了广泛的应用,而将谱聚类和半监督集群结合的方法通过使用约束改善结果来提高谱聚类的有效性.文章通过选择主动学习方法,提出了一种基于主动学习的半监督谱聚类算法.首先,利用邻域中包含的信息来确定要查询的数据,由于邻域信息只反映局部信息,因此,又引入与目标不太相似的数据点,这些数据点代表全局信息,得到Must-link(正关联)成对约束集和Cannot-link(负关联)成对约束集.然后,对得到的成对约束再通过k-means聚类得到聚类结果.最后,通过在合成数据集以及UCI数据集的对比实验表明文章算法的有效性,通过较小的主动选择成对约束来获得更好的性能.  相似文献   

2.
提出一种结合二维PCA和二维LDA的降维方法,并将方法应用于人脸识别研究.对传统的半监督模糊聚类算法进行改造,使之可以直接用于二维数据矩阵进行动态聚类,并据此设计了一种动态学习算法.实验结果表明,与其他降维方法和聚类算法比较,这种结合了二维LDA的半监督聚类模型具有更好的识别率.  相似文献   

3.
提出了一种改进K-means聚类算法,使用该方法对轴承振动数据进行聚类和基于深度神经网络的半监督学习的故障诊断研究。对轴承振动数据进行时域和频域处理,得到28维的时域和频域特征数据;利用提出的算法对高维特征数据进行聚类处理,得到伪标签,建立特征数据和伪标签对应的数据集;利用神经网络对具有伪标签的特征数据进行半监督学习,实现对不同轴承振动状态的高精度识别。通过对比聚类指标,提出的算法较好地改善了聚类效果;用伪标签数据训练神经网络,将预测的结果与真实数据比较,精度可达96.2%,可100%区分正常状态和故障状态。  相似文献   

4.
提出一种新颖的基于谱聚类的音频聚类算法,首先对音频数据进行预处理,得到三维音频向量,然后根据向量之间的距离计算音频相似度,最后设计谱聚类算法获得音频数据聚类结果。在网易云音乐数据上的对比实验表明,与K means算法和快速查找密度峰值聚类算法相比,该算法获得的聚类结果更加优越。  相似文献   

5.
随着网络的快速发展,入侵检测系统生成的告警信息越来越多,聚类技术广泛的应用于处理告警信息.针对传统的K-Means算法易陷入局部最优,提出一种改进半监督聚类算法ISC.从数据集中抽取若干正常与异常样本分别采用层次聚类算法分别计算作为初始质心辅助K-Means算法进行聚类.实验结果表明,与现有相关算法相比,该算法具有更高的攻击检测率以及更低的误报率.  相似文献   

6.
人脸识别技术是图像处理方面的重要技术。通过对人脸数据进行标准化处理,利用主成分分析和半监督模糊聚类算法对人脸数据库进行聚类分析。实验结果表明,半监督模糊聚类利用主成分降维得到的22个特征进行聚类,对于已知类别属性的人脸,聚类结果与这些属性的一致率达100%,而对于其他数据,一致率也达到99%以上。  相似文献   

7.
对于已经分类的数据和大量未分类数据,在运算过程中,采用一种新的半监督聚类算法为支持向量机提供新的训练数据.随后,利用支持向量机判别出所有数据的类别属性,并选取最可靠的点加入已分类集合.为了验证算法的效率,收集了67张黄瓜叶片色调的数字信息,并对具有6个已分类数据与61个未分类数据的数据集进行半监督聚类分析,以判断这些叶片的健康程度.结果表明,该聚类算法优于其他算法.  相似文献   

8.
针对NJW算法计算量大和分水岭算法易产生过分割现象且对噪声敏感的问题,提出一种有效且鲁棒的方法,即阈值形态学分水岭结合谱聚类(SC)算法对MRI图像进行分割。使用Frost滤波结合形态学闭运算对输入图像进行去噪和增强处理,采用阈值形态学分水岭算法对灰度图像进行预分割,并采用改进的SC算法进行全局最优聚类,得到分割结果图像。改进的SC算法是用K HarmomcMeans(KHM)取替K means(KM)进行聚类,可提高稳定性和算法性能。实验结果表明,该方法能有效分割MRI图像且具有计算快速的优点。  相似文献   

9.
由于性能优越,谱聚类成为近年来聚类算法研究的热点。谱聚类算法可以在任意形状的样本空间上聚类,并能获得全局最优解。介绍了谱图的基本理论及其划分准则,探讨了谱聚类算法,并针对当前谱聚类应用展望了未来研究方向。  相似文献   

10.
提出了一种新的多数据流聚类算法.该算法可以有效地对有相似行为但存在一定时间延迟的多数据流进行聚类.算法采用自回归模型技术度量数据流间的延迟相关,利用频谱估计来抽取数据流的特征.每一个数据流用其谱分量的和来表示,从而来计算每对数据流间的相关关系.每个谱分量用振幅、相位、衰减率、频率4个参数来描述.算法计算谱分量对之间的ε-延时相关关系,并以此为基础来得到聚类分析中数据流间距离的度量.此外,算法采用滑动窗口技术对多数据流进行聚类,实时地得出聚类结果且动态地调节聚类的个数.在人工数据集和实际数据集上的实验结果表明,所提出的算法比其他类似的算法具有更快的速度和更好的聚类效果.  相似文献   

11.
冒伟 《教育技术导刊》2020,19(3):248-251
为解决传统谱聚类算法在图像分割时计算量大、使用单一特征分割的局限性问题,设计一种融合谱聚类和多特征的图像分割算法。首先进行超像素分割以减少计算量,分别提取每个超像素的颜色特征和纹理特征,构建超像素相似度矩阵|然后采用特征加权方法线性融合颜色和纹理特征的超像素相似度矩阵|最后采用谱聚类算法进行聚类分割。在UCMerced_LandUse和Berkeley数据集上进行实验测试,并与现有方法进行比较。实验结果表明,大多数实验图像IOU指标均在90%以上,相比于传统方法有了显著提高。  相似文献   

12.
传统的K—means算法对初始聚类中心敏感,聚类的结果随不同的初始输入而波动.为了消除这种敏感性,提出了一种改进的K-means算法,改善聚类算法中选取初值的依赖性,提高聚类结果的稳定性.仿真实验结果表明:改进后的K-means算法优于原始算法.  相似文献   

13.
为了解决K-means算法中对于初值的敏感,提出了一种基于粒子群的改进的K-means聚类算法(IPSOFCM).在K-means算法中引入粒子群算法,可有效提高算法的全局搜索能力,有助于粒子更容易跳出局部束缚.实验结果证明,IPSOFCM算法聚类准确度高,稳定性好.  相似文献   

14.
图像分割是一种对不同特征的像素进行聚类的过程,过程中涉及像素的梯度、灰度及邻域特征。由于蚁群算法的离散性、并行性、全局优化性和稳定性等特点,基于蚁群算法提出一种有效的图像分割改进算法。首先通过蚁群改进算法的模糊聚类能力可以分别计算出像素与目标、背景、噪声点、边界点的隶属关系;然后对于蚁群算法循环次数多、计算量较大的问题,设置启发式引导函数和聚类中心,解决传统聚类中运行效率低、初始化敏感度高等缺点;最后引入梯度算子,对目标与背景灰度值相似图像进行分割,对结果进行了进一步的优化。实验表明,应用该改进算法得到的图像分割结果具有较高的准确度和效率。  相似文献   

15.
分析了K均值聚类算法(K-means)存在的不足和改进遗传算法的全局优化能力,提出一种基于改进遗传算法的文本聚类方法,该方法将原始文档转化成用向量空间模型来描述的文本向量,首先随机产生若干个文档向量作为初始聚类中心形成遗传算法的染色体种群,经过改进遗传算法的选择、交叉、变异进化运算,得到较为优化的K均值聚类算法的初始聚类中心。实验表明该算法文本聚类提高了查准率和查全率,算法的高效性也得到了验证。  相似文献   

16.
一种改进的k-means聚类算法   总被引:2,自引:0,他引:2  
针对k-means算法事先必须获知聚类数目以及难以确定初始中心的缺点,提出了一种改进的k-means聚类算法.首先引入轮廓系数的概念,通过计算不同K值下簇集中各对象的轮廓系数确定事先未知分类信息的数据集中所包含的最优聚类数Kopt;然后通过凝聚层次聚类的方法获得数据集的分布,确定初始聚类中心;最后利用传统的k-means方法完成聚类.理论分析表明,所提出的算法具有适度的计算复杂度.IRIS测试数据集的实验结果表明了该算法能够合理区分不同类型的簇集,且可以有效地识别离群点,聚合后的结果簇集具有较低的熵值.  相似文献   

17.
提出了一种基于改进蚁群算法的动态K-均值聚类算法思想。该算法首先利用蚁群算法较强处理局部极值的能力,动态地确定了聚类数目和中心,然后利用蚁群聚类得到的结果,进行K-均值聚类弥补蚁群算法的不足。两者的有机结合可以寻求到具有全局分布特性的最优聚类,实现基于改进的蚁群聚类算法分析。  相似文献   

18.
相比较于其它聚类算法,密度峰值聚类算法可将任意形状的数据与较少的参数和高效的聚类速度结合起来。针对当某个类中出现多个密度峰值时,聚类结果缺乏准确性的问题,提出一种改进的密度峰值聚类结果有效性造成的影响,算法通过比较类簇之间的密度属性,实现动态的子簇合并,减少主观因素对算法结果的影响。通过实验与已有密度聚类算法对比,改进算法不仅很好地避免了原算法人为确定参数给实验结果造成的影响,而且具有更好的聚类性能。  相似文献   

19.
聚类分析是数据挖掘和机器学习的一个重要分支,应用范围广,但在聚类分析过程中大量敏感信息的泄露对用户构成威胁。因此,在聚类分析过程中实现隐私保护至关重要。传统基于差分隐私(DP)的k-means聚类算法由于存在盲目选择初始中心点、对异常点敏感度较高等问题,导致在保护数据隐私时,出现聚类可用性较低的情况。针对该问题提出一种改进的基于差分隐私保护的(IDP)k-means聚类算法以提高聚类可用性,并进行理论分析和对比实验。理论分析表明,该算法满足ε-差分隐私;仿真实验结果表明,在同一隐私预算下,k-means算法改进后在聚类可用性上优于其它差分隐私k-means聚类算法,在同一数据集与同一隐私参数下,改进k-means算法在数据可用性方面比传统算法提高了将近5个百分点。  相似文献   

20.
随着智慧农业的发展,农业生产中海量数据不断涌现。在海量数据中难免存在噪声数据,这些数据不仅难以提供有效价值,还会影响信息挖掘。针对该问题,采用基于密度的DBSCAN聚类算法进行异常数据处理。鉴于DBSCAN算法对参数敏感,结合数据集本身特性与统计学思想以绘制各点之间的距离升序曲线,预估出DBSCAN的Eps参数。仿真实验结果表明,改进算法平均准确率达到99.6%,较传统算法提高了1.7个百分点,并且在10次检测中,改进算法只有3个数据判定错误,证明该参数设置方法对异常数据处理准确率更高,稳定性也更好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号