共查询到20条相似文献,搜索用时 31 毫秒
1.
李建忠 《韩山师范学院学报》2008,29(6)
对web文本聚类中的数据预处理、聚类算法及结果评估等进行了分析研究.在由lucene和nutch构建的搜索引擎的基础上,提出基于k—means聚类算法web页聚类系统设计方案,并论述了各模块的设计与实现方法. 相似文献
2.
张莉 《成都教育学院学报》2009,23(4):98-100
针对网络学习者及其对案例访问的模糊性提出采用模糊聚类的方法对学习者和案例进行聚类分析。在算法中,以各学习者对案例的访问次数、时间、学习效率等刻画学习者对案例的关注程度建立模糊相似矩阵,再由平方法求出模糊等价矩阵,然后进行聚类分析。通过具体实例阐述算法的计算过程,证明算法实现的可行性和有效性。 相似文献
3.
《实验室研究与探索》2017,(3)
提出了一种新的基于模糊C均值(FCM)聚类的图形图像分析方法,并采用高级语言对其进行了设计与实现。阐述了FCM聚类的基本原理,建立了FCM聚类的类别识别模型,研究了FCM聚类分类的模型的缺陷并提出优化策略。在此基础上,采用.net与FCM聚类相结合的算法,展示了FCM聚类的算法优势,采用.net语言提高了FCM聚类分析的速度与聚类效果,多线程的应用更好地展示了FCM在图形图像分析中的优势。通过对不同情况下车牌图像的分割分析,提升了FCM对复杂图像的应用效果。 相似文献
4.
随着人工智能和数据挖掘技术的不断深入,数据挖掘技术中的聚类分析得到了不断的发展,对聚类的研究已经成为数据挖掘领域中的一个重要课题。在介绍几种具有代表性的聚类算法的基础上,探讨了聚类算法的理论基础及具体实现。 相似文献
5.
李玲玲 《贵州教育学院学报》2011,(9):11-14
凝聚型层次聚类和模糊C-均值聚类是聚类中的两种常用算法,每种算法都有其自己的优点、缺点及适用的对象和范围。针对FCM算法的对初始值敏感,以及目标函数没有考虑类间距离的缺点,通过使用距离阚值,把凝聚型层次聚类与模糊C-均值聚类算法相结合,产生一种新的基于距离闲值的FCM算法,实验结果表明。这种算法能够自动的判断迭代的终止条件、快速有效的找到最佳聚类结果,从而实现对模糊C-均值聚类算法的自动优化。 相似文献
6.
基于层次的模糊K均值聚类算法研究 总被引:1,自引:0,他引:1
苏瑞 《安阳师范学院学报》2010,(2):47-50
通过对K均值聚类算法的研究,本文提出了一种基于层次聚类与模糊聚类思想的K均值聚类算法。算法首先使用层次方法对数据进行初始聚类,然后用得到的聚类数作为模糊K均值聚类中的K值,对聚类进行修正。最后通过实验,验证了该算法不需要人为假设聚类算法中的K值,而且引入了模糊隶属关系使类别的划分更接近于事实,从而证明了该算法的有效性。 相似文献
7.
《绵阳师范学院学报》2015,(8):94-98
针对电子商务系统中大多采取用户评分或购买数据进行聚类,较少进一步分析用户行为的现状,提出一种根据用户浏览商品时序分析用户兴趣的方法 .在此基础上先用Canopy算法进行数据预处理后使用K-均值算法根据用户兴趣实现用户聚类.采用KDD CUP2000数据集中的用户点击流数据中的用户浏览记录对算法进行实验,实验结果表明算法有较好的聚类结果 . 相似文献
8.
叶苗群 《宁波职业技术学院学报》2008,12(2):48-50
提出了一种基于核的聚类方法,增加对样本特征的优化;通过核函数,把数据样本空间映射到一个高维的特征空间;在特征空间对数据样本进行k-中心点聚类,并通过计算类内距离作为适应度准则,取其最优的结果。通过Web日志挖掘中的Web客户聚类应用比较,表明核聚类方法在性能上比经典的聚类算法有较大的改进,从而实现更为准确的聚类。 相似文献
9.
K-means算法是聚类分析划分方法中的一种常用方法,也是目前在数据分析方法中最有应用前景的方法之一。但K mean算法对初始聚类中心十分敏感,这对处理学生成绩等数据而言,会导致聚类结果极为不稳定。为此,提出基于改进遗传算法的K means聚类算法。该算法利用遗传算法解决初始聚类中心,提高聚类结果的稳定性,但存在前期过早收敛和后期收敛过慢的缺点。将改进遗传K means聚类算法应用于高职高专的学生考试成绩分析中,可以很好地解决传统遗传聚类算法对聚类结果的不稳定性问题,并通过聚类结果对学生考试成绩进行分类评价,利用所获得的数据聚类结果指导教学,从而提高教学质量。 相似文献
10.
K-means聚类算法研究 总被引:2,自引:0,他引:2
华婷婷 《黄山高等专科学校学报》2013,(5):17-19
聚类分析是模式识别中一个重要研究领域,是一种将数据划分或分组处理的重要手段和方法.K-means算法是聚类算法中主要算法之一,文章介绍了K-means聚类算法的实现方法,并对其优点和缺点进行了详细的分析. 相似文献
11.
12.
聚类算法是数据挖掘算法中的重要方法之一.本文在分析了FCM算法和基于遗传聚类算法的不足基础上,提出了一种基于免疫单亲遗传和模糊C均值的混合聚类算法,克服了FCM的局部最优问题以及普通遗传算法聚类时的搜索速度和聚类精度的矛盾,实验表明该算法是有效的. 相似文献
13.
郭伟光 《赤峰学院学报(自然科学版)》2014,(24):17-19
为了对社会化标注系统中的标签进行有效聚类,并针对传统K-medoids算法存在的聚类结果易受初始聚类中心影响的问题,本文提出了一种改进的K-medoids标签聚类算法.该算法应用社会化标签的余弦相似值进行初始聚类中心的选择,然后进行标签聚类.对Delicious标签数据集的实验结果表明算法具有较强的的可行性和有效性. 相似文献
14.
使用调和均值的KHM聚类算法,不像KH聚类算法,具有对初始值不敏感的优点。但它作为一个基于中心聚类算法,难以摆脱早熟收敛的问题。为了克服KHM算法的不足,本文提出结合ABC和KHM的ABC—KHM混合聚类算法。在混合算法中,聚类行为可以分为两个阶段:全局搜索的ABC聚类阶段和局部求精的KHM聚类阶段。通过仿真实验,并与KHM聚类算法进行了比较,结果表明:ABC-KHM混合聚类算法,不仅对聚类初始值不敏感,而且具有较快的聚类速度、良好的全局聚类效果,是一个不错的聚类算法。 相似文献
15.
从数据挖掘方法中常用的聚类算法的基本原理,将聚类算法中的K—means算法用于客户关系管理系统中,实现客户分类.并且对K—means算法进行了改进,根据客户信用特征对客户进行预分类,提高了算法的效率. 相似文献
16.
17.
18.
针对现有序列聚类算法在对大规模数据进行聚类时,内存空间和计算时间开销较大的问题,提出了基于MapReduce的人工蜂群聚类算法。该算法通过引入MapReduce并行编程范式,快速计算聚类中心适应度,可实现对大规模数据的高效聚类。基于仿真数据对算法的聚类效果和聚类效率进行了验证。实验结果表明,与现有PK-Means算法和并行K-PSO算法相比,该算法具有更好的聚类效果和更高的聚类效率。 相似文献
19.
聚类分析是数据挖掘和机器学习的一个重要分支,应用范围广,但在聚类分析过程中大量敏感信息的泄露对用户构成威胁。因此,在聚类分析过程中实现隐私保护至关重要。传统基于差分隐私(DP)的k-means聚类算法由于存在盲目选择初始中心点、对异常点敏感度较高等问题,导致在保护数据隐私时,出现聚类可用性较低的情况。针对该问题提出一种改进的基于差分隐私保护的(IDP)k-means聚类算法以提高聚类可用性,并进行理论分析和对比实验。理论分析表明,该算法满足ε-差分隐私;仿真实验结果表明,在同一隐私预算下,k-means算法改进后在聚类可用性上优于其它差分隐私k-means聚类算法,在同一数据集与同一隐私参数下,改进k-means算法在数据可用性方面比传统算法提高了将近5个百分点。 相似文献