首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 986 毫秒
1.
对模糊C-均值聚类算法的改进,即在原有的模糊C-均值算法的基础上,用一种新的定义距离的方法替代欧氏空间中距离的定义,改进模糊聚类算法。并且用数据仿真验证这种改进的模糊聚类算法与原来算法相比,聚类效果更好,分类更清晰。  相似文献   

2.
现有的增量聚类算法虽然解决了数据增量和类簇重叠问题,但在距离度量时没有考虑属性重要度不同,且普遍拥有较高的时间复杂度。针对以上问题,提出一种基于属性重要度的加权三支决策增量软聚类算法(W-TIOC-TWD算法),将属性重要度考虑到距离度量中,弥补了现有算法在聚类过程中将所有属性的重要程度视为相等的不足。该算法还引入离群点概念,降低了算法的时间复杂度。基于人工数据集和UCI数据集的实验结果表明,W-TIOC-TWD算法的聚类准确率优于比较算法。  相似文献   

3.
提出了一种新的多数据流聚类算法.该算法可以有效地对有相似行为但存在一定时间延迟的多数据流进行聚类.算法采用自回归模型技术度量数据流间的延迟相关,利用频谱估计来抽取数据流的特征.每一个数据流用其谱分量的和来表示,从而来计算每对数据流间的相关关系.每个谱分量用振幅、相位、衰减率、频率4个参数来描述.算法计算谱分量对之间的ε-延时相关关系,并以此为基础来得到聚类分析中数据流间距离的度量.此外,算法采用滑动窗口技术对多数据流进行聚类,实时地得出聚类结果且动态地调节聚类的个数.在人工数据集和实际数据集上的实验结果表明,所提出的算法比其他类似的算法具有更快的速度和更好的聚类效果.  相似文献   

4.
图结构特征的提取以及距离度量是计算机视觉和模式识别中的重要内容.针对传统的图上下文描述子中只考虑每个柱形区域内的特征点数目而忽略特征点之间的结构信息的问题,提出一种图的结构上下文描述子及距离度量方法.首先对图的所有顶点建立图结构上下文描述子;其次,利用二次卡方(QC)距离方法实现图的距离度量;最后,采用最小生成树聚类算法实现图聚类.实验表明,该方法对于一些非刚性变换的图聚类有较好的效果.  相似文献   

5.
讨论了下半连续模糊测度的 3种结构特性 :( 1)伪距离生成性质 ;( 2 )p类型伪距离生成性质 ;( 3)零零可加性与半连续模糊测度空间上可测函数序列的收敛性之间的关系 .对这 3种结构特性分别给出了一组等价条件 .证明了在S紧空间上的一个有限模糊测度是零零可加的充分必要条件是它有伪距离生成性质  相似文献   

6.
在现有蚁群算法的基础上,加入公式改进、半径递增、短期记忆、空间分割等策略,同时采用一种距离测度函数将数值特征与类属特征相结合,实现了混合属性数据的聚类.仿真实验表明,新算法能加快聚类速度,得到较好的聚类结果。  相似文献   

7.
针对模糊C-均值聚类算法(FCM)存在易受初始聚类中心影响和容易陷入局部最优的问题,提出了一种将灰狼优化算法(GWO)和模糊C-均值相结合的新聚类算法(GWO-FCM)。该算法利用GWO算法强大的全局寻优能力对FCM算法的聚类中心进行优化,模拟灰狼优秀的搜寻猎物行为找到一组最佳聚类中心来提高FCM的聚类效果。通过UCI数据集的仿真结果和算法比较验证了该算法的有效性。  相似文献   

8.
《柳州师专学报》2015,(6):108-110
K-means算法是一种基于划分的方法,该算法对初始聚类中心的选取依赖性极大,初始中心值的不同导致聚类效果不稳定.为此,本文利用几何概率的思想,认为每个数据点都是等概率的存在于数据集,通过计算每个数据点的点概率值,结合距离因素,选择K个点作为初始聚类中心.实验证明,改进后的K-means算法聚类效果更好.  相似文献   

9.
k'-means是对k-means算法的一种改进,它引入了竞争惩罚学习机制,可以在无监督的情况下确定聚类数目.本文提出了两种新的基于频率敏感差异度量的k'-means算法,新算法利用竞争惩罚学习机制确定聚类数目.针对一组合成数据进行对比实验,结果表明新的k'-means算法可以成功地对数据集进行分类.最后,本文将新算法应用于图像分割.  相似文献   

10.
传统欠采样方法在处理不平衡数据问题时只考虑多数类样本的绝对位置而忽略了其相对位置,从而使产生的平衡数据集存在边界模糊问题。提出一种改进 K 均值聚类的不平衡数据欠采样算法(UD-PK)。该算法首先利用改进的 PSO 算法迭代寻找全局最优解作为 K-means 聚类所需初始值,然后通过 K-means 进行聚类,再按照每个类别中多数类与少数类的比例定义所取多数类样本个数,并根据多数类样本与簇心距离择优选择参与平衡数据集构造。在 UCI 数据集上的对比试验表明,该算法在少数类准确率上较一些经典算法有很大提升。  相似文献   

11.
在讨论Web使用挖掘在网络学习中的应用过程中,提出一种改进的基于向量的聚类算法.在算法中,首先以学习站点的URL为行、以UserID为列建立页面用户关联矩阵,元素值为学习者的访问次数,然后使用欧氏距离进行度量向量之间的相似性,对列向量进行相似性分析得到相似学习者群体,对行向量进行相似性度量获得相关Web页面.分析表明,Web使用挖掘在网络学习中的应用是可行、有效的.  相似文献   

12.
凝聚型层次聚类和模糊C-均值聚类是聚类中的两种常用算法,每种算法都有其自己的优点、缺点及适用的对象和范围。针对FCM算法的对初始值敏感,以及目标函数没有考虑类间距离的缺点,通过使用距离阚值,把凝聚型层次聚类与模糊C-均值聚类算法相结合,产生一种新的基于距离闲值的FCM算法,实验结果表明。这种算法能够自动的判断迭代的终止条件、快速有效的找到最佳聚类结果,从而实现对模糊C-均值聚类算法的自动优化。  相似文献   

13.
K 均值算法(K-Means)是聚类算法中最受欢迎且最健壮的一种算法,然而在实际应用中,存在真实数据集划分的类数无法提前确定及初始聚类中心点随机选择易使聚类结果陷入局部最优解的问题。因此提出一种基于最大距离中位数及误差平方和(SSE)的自适应改进算法。该算法根据计算获取初始聚类中心点,并通过 SSE 变化趋势决定终止聚类或继续簇的分裂,从而自动确定划分的类簇个数。采用 UCI 的 4 种数据集进行实验。结果表明,改进后的算法相比传统聚类算法在不增加迭代次数的情况下,聚类准确率分别提高了17.133%、22.416%、1.545%、0.238%,且聚类结果更加稳定。  相似文献   

14.
提出一种新颖的基于谱聚类的音频聚类算法,首先对音频数据进行预处理,得到三维音频向量,然后根据向量之间的距离计算音频相似度,最后设计谱聚类算法获得音频数据聚类结果。在网易云音乐数据上的对比实验表明,与K means算法和快速查找密度峰值聚类算法相比,该算法获得的聚类结果更加优越。  相似文献   

15.
对基于距离的聚类及基于密度的孤立点检测方法进行了分析研究,提出了一种基于距离和密度的聚类和孤立点检测算法DDBCOD.该算法根据距离和密度阈值对数据进行聚类,并发现数据中的孤立点.实验表明,该算法能够识别任意形状的聚类,对高维数据有效,能够很好的识别出孤立点.  相似文献   

16.
仿射传播聚类算法是一种比较新的基于质心的聚类算法,在图像分割领域得到了广泛应用。仿射传播聚类算法最终聚类数目会受到偏向参数P(Preference)的影响,得到的聚类数目往往偏多,影响分割质量。鉴于此,提出一种改进的仿射传播聚类的图像分割算法,该算法将仿射传播聚类算法与CURE层次聚类算法相结合,CURE算法能够对仿射传播聚类算法的分割结果进行优化。实验验证表明,改进后的算法图像分割效果更好。  相似文献   

17.
针对核模糊C-均值聚类算法中隶属度的计算特点,提出了一种改进的核模糊C-均值算法。改进后的算法是,在更新对象类的隶属度之前先判断对象是否可能属于该类。如果对象可能属于该类,则为其分配一个大于0的隶属度,否则直接将其隶属度置为0。针对不同测试数据集的实验结果表明,改进后的核模糊C 均值算法提高了聚类效果,是一种可行有效的算法。  相似文献   

18.
为了提高用户之间相似度度量的性能,充分利用用户的社会信息,提出一种考虑潜在用户分组信息的相似度度量方法.该方法首先为用户的分类属性建立权值分类树,并基于此分类树,采用统一框架计算用户分类信息和数值信息的距离;然后利用该距离改进k-means聚类方法,以计算用户的潜在用户分组;最后结合用户分组信息改进传统相似度度量方法.基于真实数据集Movie Lens进行实验,并与其他传统方法对比,结果表明,与传统方法相比,所提方法提高了协同过滤中的预测精度.  相似文献   

19.
提出一种结合二维PCA和二维LDA的降维方法,并将方法应用于人脸识别研究.对传统的半监督模糊聚类算法进行改造,使之可以直接用于二维数据矩阵进行动态聚类,并据此设计了一种动态学习算法.实验结果表明,与其他降维方法和聚类算法比较,这种结合了二维LDA的半监督聚类模型具有更好的识别率.  相似文献   

20.
针对传统的模糊聚类算法(FCM)的不足,提出了具体的改进和提高方法,通过修改聚类目标函数来提高算法处理噪音点的能力和体现样本空间各维度对聚类效果的价值。最后通过实验比较证明了算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号