首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
对web文本聚类中的数据预处理、聚类算法及结果评估等进行了分析研究.在由lucene和nutch构建的搜索引擎的基础上,提出基于k—means聚类算法web页聚类系统设计方案,并论述了各模块的设计与实现方法.  相似文献   

2.
针对网络学习者及其对案例访问的模糊性提出采用模糊聚类的方法对学习者和案例进行聚类分析。在算法中,以各学习者对案例的访问次数、时间、学习效率等刻画学习者对案例的关注程度建立模糊相似矩阵,再由平方法求出模糊等价矩阵,然后进行聚类分析。通过具体实例阐述算法的计算过程,证明算法实现的可行性和有效性。  相似文献   

3.
提出了一种新的基于模糊C均值(FCM)聚类的图形图像分析方法,并采用高级语言对其进行了设计与实现。阐述了FCM聚类的基本原理,建立了FCM聚类的类别识别模型,研究了FCM聚类分类的模型的缺陷并提出优化策略。在此基础上,采用.net与FCM聚类相结合的算法,展示了FCM聚类的算法优势,采用.net语言提高了FCM聚类分析的速度与聚类效果,多线程的应用更好地展示了FCM在图形图像分析中的优势。通过对不同情况下车牌图像的分割分析,提升了FCM对复杂图像的应用效果。  相似文献   

4.
随着人工智能和数据挖掘技术的不断深入,数据挖掘技术中的聚类分析得到了不断的发展,对聚类的研究已经成为数据挖掘领域中的一个重要课题。在介绍几种具有代表性的聚类算法的基础上,探讨了聚类算法的理论基础及具体实现。  相似文献   

5.
凝聚型层次聚类和模糊C-均值聚类是聚类中的两种常用算法,每种算法都有其自己的优点、缺点及适用的对象和范围。针对FCM算法的对初始值敏感,以及目标函数没有考虑类间距离的缺点,通过使用距离阚值,把凝聚型层次聚类与模糊C-均值聚类算法相结合,产生一种新的基于距离闲值的FCM算法,实验结果表明。这种算法能够自动的判断迭代的终止条件、快速有效的找到最佳聚类结果,从而实现对模糊C-均值聚类算法的自动优化。  相似文献   

6.
基于层次的模糊K均值聚类算法研究   总被引:1,自引:0,他引:1  
通过对K均值聚类算法的研究,本文提出了一种基于层次聚类与模糊聚类思想的K均值聚类算法。算法首先使用层次方法对数据进行初始聚类,然后用得到的聚类数作为模糊K均值聚类中的K值,对聚类进行修正。最后通过实验,验证了该算法不需要人为假设聚类算法中的K值,而且引入了模糊隶属关系使类别的划分更接近于事实,从而证明了该算法的有效性。  相似文献   

7.
针对电子商务系统中大多采取用户评分或购买数据进行聚类,较少进一步分析用户行为的现状,提出一种根据用户浏览商品时序分析用户兴趣的方法 .在此基础上先用Canopy算法进行数据预处理后使用K-均值算法根据用户兴趣实现用户聚类.采用KDD CUP2000数据集中的用户点击流数据中的用户浏览记录对算法进行实验,实验结果表明算法有较好的聚类结果 .  相似文献   

8.
提出了一种基于核的聚类方法,增加对样本特征的优化;通过核函数,把数据样本空间映射到一个高维的特征空间;在特征空间对数据样本进行k-中心点聚类,并通过计算类内距离作为适应度准则,取其最优的结果。通过Web日志挖掘中的Web客户聚类应用比较,表明核聚类方法在性能上比经典的聚类算法有较大的改进,从而实现更为准确的聚类。  相似文献   

9.
K-means算法是聚类分析划分方法中的一种常用方法,也是目前在数据分析方法中最有应用前景的方法之一。但K mean算法对初始聚类中心十分敏感,这对处理学生成绩等数据而言,会导致聚类结果极为不稳定。为此,提出基于改进遗传算法的K means聚类算法。该算法利用遗传算法解决初始聚类中心,提高聚类结果的稳定性,但存在前期过早收敛和后期收敛过慢的缺点。将改进遗传K means聚类算法应用于高职高专的学生考试成绩分析中,可以很好地解决传统遗传聚类算法对聚类结果的不稳定性问题,并通过聚类结果对学生考试成绩进行分类评价,利用所获得的数据聚类结果指导教学,从而提高教学质量。  相似文献   

10.
K-means聚类算法研究   总被引:2,自引:0,他引:2  
聚类分析是模式识别中一个重要研究领域,是一种将数据划分或分组处理的重要手段和方法.K-means算法是聚类算法中主要算法之一,文章介绍了K-means聚类算法的实现方法,并对其优点和缺点进行了详细的分析.  相似文献   

11.
为了实现磁瓦图像中缺陷的准确检测,以分割磁瓦端面崩块缺陷为目的提出一种基于K-means聚类的分割方法。磁瓦图像采集的关键技术是光源选用,分析传统的磁瓦图像分割方法——阈值分割,并以迭代选择阈值算法作为对比算法进行介绍;着重剖析K-means算法的基本聚类原理,并引出其算法实现流程。采用两种算法对磁瓦端面图像进行分割。结果表明,基于K-means聚类算法对磁瓦图像进行分割,能够正确分割出磁瓦端面的崩块缺陷。  相似文献   

12.
聚类算法是数据挖掘算法中的重要方法之一.本文在分析了FCM算法和基于遗传聚类算法的不足基础上,提出了一种基于免疫单亲遗传和模糊C均值的混合聚类算法,克服了FCM的局部最优问题以及普通遗传算法聚类时的搜索速度和聚类精度的矛盾,实验表明该算法是有效的.  相似文献   

13.
为了对社会化标注系统中的标签进行有效聚类,并针对传统K-medoids算法存在的聚类结果易受初始聚类中心影响的问题,本文提出了一种改进的K-medoids标签聚类算法.该算法应用社会化标签的余弦相似值进行初始聚类中心的选择,然后进行标签聚类.对Delicious标签数据集的实验结果表明算法具有较强的的可行性和有效性.  相似文献   

14.
使用调和均值的KHM聚类算法,不像KH聚类算法,具有对初始值不敏感的优点。但它作为一个基于中心聚类算法,难以摆脱早熟收敛的问题。为了克服KHM算法的不足,本文提出结合ABC和KHM的ABC—KHM混合聚类算法。在混合算法中,聚类行为可以分为两个阶段:全局搜索的ABC聚类阶段和局部求精的KHM聚类阶段。通过仿真实验,并与KHM聚类算法进行了比较,结果表明:ABC-KHM混合聚类算法,不仅对聚类初始值不敏感,而且具有较快的聚类速度、良好的全局聚类效果,是一个不错的聚类算法。  相似文献   

15.
陈琍 《钦州学院学报》2006,21(6):36-37,41
从数据挖掘方法中常用的聚类算法的基本原理,将聚类算法中的K—means算法用于客户关系管理系统中,实现客户分类.并且对K—means算法进行了改进,根据客户信用特征对客户进行预分类,提高了算法的效率.  相似文献   

16.
根据文本信息在聚类过程中的特点构建了一种基于K medoids的文档聚类方法,并结合文本特征提取KNN算法对训练文本进行测试,该方法首先利用K medoids在聚类过程中实现简单、收敛速度快的特性,再利用KNN算法在文档特征提取过程中简单、高效的特点,对训练进行聚类划分。实验结果表明,利用该方法在对文档进行聚类时,F1值、耗时及分割数等方面与KNN及CLKNN算法相比都有较大提高。  相似文献   

17.
在大数据时代,数据是由不同来源生成的,或者是从不同视图中观察得到的,这些数据被称为多视图数据。在数据挖掘与分析中,充分发挥知识在多视图数据中的作用是非常重要的,因此需要在融合相关数据的同时,考虑不同视图的多样性。近年来,多视图聚类(MvC)受到越来越多学者关注,根据其涉及的机制和原则,将多视图聚类算法分为5类,即协同训练算法、多核学习、多视图聚类、多视图子空间聚类与多任务多视图聚类。对多视图聚类算法进行介绍,并重点介绍了协同训练算法与多核学习。  相似文献   

18.
针对现有序列聚类算法在对大规模数据进行聚类时,内存空间和计算时间开销较大的问题,提出了基于MapReduce的人工蜂群聚类算法。该算法通过引入MapReduce并行编程范式,快速计算聚类中心适应度,可实现对大规模数据的高效聚类。基于仿真数据对算法的聚类效果和聚类效率进行了验证。实验结果表明,与现有PK-Means算法和并行K-PSO算法相比,该算法具有更好的聚类效果和更高的聚类效率。  相似文献   

19.
聚类分析是数据挖掘和机器学习的一个重要分支,应用范围广,但在聚类分析过程中大量敏感信息的泄露对用户构成威胁。因此,在聚类分析过程中实现隐私保护至关重要。传统基于差分隐私(DP)的k-means聚类算法由于存在盲目选择初始中心点、对异常点敏感度较高等问题,导致在保护数据隐私时,出现聚类可用性较低的情况。针对该问题提出一种改进的基于差分隐私保护的(IDP)k-means聚类算法以提高聚类可用性,并进行理论分析和对比实验。理论分析表明,该算法满足ε-差分隐私;仿真实验结果表明,在同一隐私预算下,k-means算法改进后在聚类可用性上优于其它差分隐私k-means聚类算法,在同一数据集与同一隐私参数下,改进k-means算法在数据可用性方面比传统算法提高了将近5个百分点。  相似文献   

20.
主要就聚类算法研究中的一些基本问题做了深入分析,明确了在应用聚类算法、改进算法或者开发新的算法时的一些基本要求,并在最后列出了各种常用算法的特点,评价了各类算法的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号