首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
探究聚类分析方法在数据挖掘中的应用,归纳常见的聚类分析方法与算法,突出SPSS软件中聚类分析方法的运用。在探究聚类分析应用过程时,以SPSS软件工具为依托,就两步聚类、快速聚类与层次聚类分析进行相对深入的探讨。  相似文献   

2.
探究聚类分析方法在数据挖掘中的应用,归纳常见的聚类分析方法与算法,突出SPSS软件中聚类分析方法的运用.在探究聚类分析应用过程时,以SPSS软件工具为依托,就两步聚类、快速聚类与层次聚类分析进行相对深入的探讨.  相似文献   

3.
彭学君 《科教文汇》2007,(9Z):216-216
探究聚类分析方法在数据挖掘中的应用,归纳常见的聚类分析方法与算法,突出SPSS软件中聚类分析方法的运用。在探究聚类分析应用过程时,以SPSS软件工具为依托,就两步聚类、快速聚类与层次聚类分析进行相对深入的探讨。  相似文献   

4.
王鹤 《中国科技信息》2007,(15):280-281
数据挖掘是在海量的数据中寻找模式或规则的过程。数据挖掘强调的是发现知识,获得的知识类型包括关联规则、分类、回归、聚类、依赖模型等。本文对其中聚类分析技术进行了较为深入地研究与分析,提出基于信息素的蚁群聚类算法PCBP,利用信息素指导蚂蚁移动,用不同速度的蚂蚁来改善聚类质量,并在这个思想基础上提出层次化蚁群聚类方法。为人们研究聚类提供了新思路和新途径,因此本文的研究具有一定的理论和实践意义。  相似文献   

5.
本文将数据挖掘算法应用干智能答疑系统中,提出了一套基于数据挖掘算法的答疑设计方案并加以改进,传统的K-均值算法聚类虽然速度快,在文本聚类中易于实现,但其同样依赖于所有变量,聚类效果往往不尽如人意.为了克服这一缺点,提出一种改进的K-均值文本聚类算法.它在K-均值聚类过程中,向每一个聚类簇中的关键词自动计算添加一个权重,重要的关键词赋予较大的权重.经过实验测试.获得了一种基于子空闻变量自动加权的适合文本数据聚类分析的改进算法,它不仅可以在大规模、高维和稀疏的文本数据上有效地进行聚类.还能够生成质量较高的聚类结果.实验结果表明基于子空闻变量自动加权的K-均值文本聚类算法是有效的大规模文本数据聚类算法.  相似文献   

6.
如何进行云计算下的数据挖掘一直以来都是研究的重点,本文针对传统挖掘算法K-meas的不足,提出基于数据采样和分布密度的改进方法来获取算法的中心点,在聚类中构造函数提高了聚类效果,并对云计算下的Map/Reduce模型进行了函数改进,仿真实验通过对不同的数据集进行实验,从聚类分析比较,系统运行时间,加速比等方面说明了本文的算法适合在云计算下的数据挖掘具有一定的优越性。  相似文献   

7.
数据挖掘中SOM神经网络的聚类方法研究   总被引:3,自引:0,他引:3  
在数据挖掘领域里,SOM神经网络聚类是典型的基于模型思想的聚类方法.本文阐述了SOM神经网络的工作过程、算法的训练过程及应用.通过对我国各地区GDP数据进行聚类分析,可以及时了解各地区经济实力等重要的信息,对各级政府政策制定及宏观调控都具有非常重要的现实意义.  相似文献   

8.
由于简单的结构化查询语言(SQL)语句可对聚类规则、特征规则进行创建,所以在在数据挖掘算法中,SQL常被用于表明特征规则,尤其是聚类规则。将应用软件与SQL语句相结合,可有效提高创建d-加权、t-加权能力,尤其是特征规则中的归一化能力,d-加权、t加权分别用于衡量数据记录的差异性和典型性。从聚类分析的概念、算法原理出发,详细分析了SQL选择语句在数据挖掘中的聚类分析方法。  相似文献   

9.
随着数据库技术的不断发展,现有的聚类分析算法已经无法满足数据挖掘的聚类分析的需求。本文主要针对传统的模糊C聚类算法,将其中存在的问题进行改进,并在核函数和权值优化的基础上,提出模糊C聚类算法。首先对模糊C聚类算法的特征权值进行优化,然后引入核函数的概念,对模糊C聚类算法的寻优过程进行改进。仿真验证得到的结果是,本文所提出的模糊C聚类算法,能够在核函数和权值优化上有更好和更加稳定的聚类。  相似文献   

10.
聚类分析是当前数据挖掘中研究的重点问题,能够将要素发展的趋势、本质以及规律等被揭示出来。现如今聚类分析研究还不够成熟,聚类分析的方法缺乏适应性。本文就聚类分析方法进行分析,介绍Web数据挖掘的相关知识,探究聚类算法在Web数据挖掘中应用情况。  相似文献   

11.
在K-均值聚类分析算法和网格聚类算法基础上,对两种算法进行整合并提出了一种新的KG.CA聚类分析算法。通过对计算密度阀值的函数的改进,本文提出了一种基于网格的K-均值聚类分析算法。最后通过详细的数据分析和计算验证KGCA聚类分析算法可以有效降低凝聚度,和提高分离度从而有效提高聚类效率。  相似文献   

12.
数据挖掘是目前信息领域和数据库技术领域的前沿研究课题,它涉及到数理统计、模糊理论、神经网络和人工智能等多种技术,技术含量比较高,实现难度也较大.本文研究了关联规则挖掘技术的基本概念、过程和算法等,为提高数据挖掘效率,提出了基于聚类划分的增量式关联规则挖掘算法.即运用快速聚类方法实现数据划分、运用改进的FP-growth算法实现关联规则的挖掘和运用增量FP-growth挖掘算法实现增量数据挖掘的关联规则挖掘算法.  相似文献   

13.
针对k-均值聚类方法可能受初始选定的聚类中心的影响而过早收敛于次优解的不足,给出了一种基于自适应遗传算法的聚类分析方法(AGAC)。对该自适应遗传算法的构成要素及用其解决聚类问题的一般步骤给出了阐述。用VS 2008编写了该算法的程序用来对数字进行聚类取得了较好的聚类结果。  相似文献   

14.
本文通过吸取半监督聚类思想,提出了一种基于标记集指导的半监督聚类算法,利用驻留内存的labels集指导聚类过程,以满足大数据环境下数据挖掘的要求,并提高聚类算法的效率及质量。  相似文献   

15.
聚类分析算法众多,文章探讨了聚类分析中聚类标准的设定以及按照不同标准的聚类方法在绩效考核方面的应用。  相似文献   

16.
聚类分析作为数据挖掘的主要方法之一,在众多领域具有重要的应用价值,其应用效果在很大程度上取决于数据聚类结果解释的准确性和科学性,因此对聚类结果的解释是一个非常重要的问题.针对普遍存在的数值型数据聚类问题,提出基于因子分析的结果解释方法,该方法充分利用因子分析具有的维数约简和指标含义高度抽象的能力,通过计算各类各因子得分的平均值,结合实际问题背景,对聚类结果进行恰当的阐释.数据实验结果表明所提出的方法达到了预期目的.  相似文献   

17.
面对电力系统中海量的多维数据,传统的可视化数据挖掘无法满足空间数据处理的需要,多维数据可视化也不利于用户获取知识。因此提出了基于SOM(自组织特征映射网络)聚类的电网可视化数据挖掘新模型VSDMmodel,模型利用改进的SOM聚类算法对高维电网数据进行降维,提出一种基于颜色映射的可视化方法,对聚类结果进行低维展现,加快了用户对挖掘结果的理解,并且允许用户对结果中感兴趣的区域加以深入分析,实现对电力系统海量数据的可视化挖掘。  相似文献   

18.
聚类分析是医学图像分割的重要方法。针对聚类算法中存在缺少先验知识、人为因素干扰、分割速度慢等缺陷,涌现出了大量的改进算法。结合现有的国内外研究成果,文章对近年来的基于聚类分析的医学图像分割算法、发展现状、发展趋势及部分改进算法进行综述,主要介绍区域生长法、K-means算法、FCM算法、基于密度算法以及AP算法等在医学图像分割领域的应用。  相似文献   

19.
一种大规模中文搜索日志的层次聚类方法   总被引:1,自引:0,他引:1  
孙锐  金澎 《科技通报》2012,28(8):83-85
提出一种层次聚类算法,旨在对搜索引擎的查询日志数据进行聚类分析。算法基于搜狗实验室公开的查询日志数据,通过3次划分完成查询文本聚类,每一次划分实现不同程度的降维。相似度参数可根据不同的聚类需求调整,算法可扩展性强。实验结果为查询推荐、相关性排序等提供了有力的依据。  相似文献   

20.
聚类分析作为数据挖掘的一种手段越来越受到人们的重视,已广泛应用到图像处理、信号分析、模式识别等多个领域中。本文介绍了聚类分析的基本原理和几种典型的聚类方法,阐述了聚类分析在地球物理中的应用以及发展前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号