共查询到20条相似文献,搜索用时 609 毫秒
1.
本文将数据挖掘算法应用干智能答疑系统中,提出了一套基于数据挖掘算法的答疑设计方案并加以改进,传统的K-均值算法聚类虽然速度快,在文本聚类中易于实现,但其同样依赖于所有变量,聚类效果往往不尽如人意.为了克服这一缺点,提出一种改进的K-均值文本聚类算法.它在K-均值聚类过程中,向每一个聚类簇中的关键词自动计算添加一个权重,重要的关键词赋予较大的权重.经过实验测试.获得了一种基于子空闻变量自动加权的适合文本数据聚类分析的改进算法,它不仅可以在大规模、高维和稀疏的文本数据上有效地进行聚类.还能够生成质量较高的聚类结果.实验结果表明基于子空闻变量自动加权的K-均值文本聚类算法是有效的大规模文本数据聚类算法. 相似文献
2.
K-均值聚类算法是一种基于划分方法的聚类算法,本文通过对传统的K-均值聚类算法的分析,提出了一种改进的K-均值算法,并对该算法的时间复杂度和空间复杂度进行了分析。该算法在计算聚类中心点时采用了一种最近邻的思想,可以有效地去除"噪声"和"孤立点"对簇中平均值(聚类中心)的影响,从而使聚类结果更加合理。最后通过实验表明该算法的有效性和正确性。 相似文献
3.
4.
一种改进的K-means算法 总被引:1,自引:0,他引:1
K-means算法是聚类算法中最经典的划分算法之一,它对初值的依赖性很强,聚类结果随初始聚类中心选择的不同而波动很大。提出了一种改进的K-means算法,运用Kruskal算法生成聚类对象的最小生成树(MST),按权值从大到小删去K-1条边,得到的K个连通子图中对象的均值作为初始聚类中心进行聚类。由仿真实验表明,K-means算法较传统算法有更好的聚类效果和准确性。 相似文献
5.
无导师聚类过程中将数据集合分割成几个类是一个很难确定的问题,目前还没有较好的解决方法。文章使用粒子群优化算法应用于无导师聚类算法——K-均值的参数学习,实现了使用粒子群优化算法进行聚类中心参数的确定,旨在提供一种选择中心参数个数的方法,同时给出了适应于聚类参数学习的粒子群fitness函数算法设计。通过对UCI机器学习数据库中的7个数据库进行实验,证实此方法是比较有效的。 相似文献
6.
基于社会演化算法的聚类新算法 总被引:1,自引:0,他引:1
K均值聚类算法通常只能以局部最优结束,很难找到全局最优。提出了一种基于社会演化算法和K均值算法相结合的聚类新算法。在该算法中提出了认知主体在聚类中对范式学习的新的方式。实验证明该算法能大大提高聚类的效率和精度。 相似文献
7.
聚类分析在图书管理系统中的应用 总被引:1,自引:0,他引:1
指出K-均值算法的不足,提出K-均值算法的改进算法.利用此改进算法对图书馆读者群体进行聚类分析,并根据分析的结果,针对不同群体采用不同的服务措施,以使资源得到充分利用;同时对图书进行聚类分析,为各类图书进行特征描述和属性分析提供依据,从而可以合理分配有限的财力资源. 相似文献
8.
CLIQUE是一种基于密度和基于网格的混合聚类方法。在高维空间中,它能够有效地进行聚类,并且能够发现嵌套在高维数据空间子空间中的聚类。但是,CLIQUE算法存在着很多的局限性,主要有以下两点:首先是子空间的剪枝;其次是CLIQUE算法追求方法简单化。针对CLIQUE算法的局限性,采用基于约束条件的聚类技术、自适应网格技术和边界调整技术来对CLIQUE算法进行改进,提出了基于约束条件和自适应网格的CAG-CLIQUE算法。 相似文献
9.
主要研究了均值聚类图像分割问题。针对传统的聚类图像分割算法对图像地分割精度较低等问题,提出一种基于模糊控制的C-均值聚类快速图像分割新方法。本文采用快速模糊C-均值聚类算法对图像分割。实验结果表明,图像分割边缘清晰,分割效果明显优于传统的聚类图像分割算法。 相似文献
10.
本文提出了一种免疫克隆选择算法与模糊C-均值聚类算法相结合的混合聚类算法。首先用克隆选择算法对模糊聚类中心的个数和聚类中心的选取进行指导,然后进行聚类,是一种有监督学习和无监督学习结合的一种算法,将该算法用于汽轮机的故障诊断中,诊断结果表明,该方法能够正确地诊断出存在的故障,具有实用价值。 相似文献
11.
12.
13.
利用伪并行遗传算法与K-均值聚类算法结合解决武器目标分配问题,将目标威胁值的分配问题转化为目标的分类问题.在采用聚类分类算法的基础上,使用伪并行遗传算法对分类结果进行优化,克服了K-均值聚类算法分类局限性,提高了全局搜索能力,达到了局部收敛速度与全局收敛性能的统一.在已知目标威胁值的情况下,利用遗传算法完整解决了WTA问题.通过仿真程序实现,验证了算法的可行性,由此为作战仿真CGF技术中的武器目标分配问题的解决提供了方法. 相似文献
14.
采用传统算法进行混合型数据库查询,由于文档与查询的匹配过于严格,存在对检索词的重要程度无法区分的问题,造成无法进行检索结果的排序的缺陷。为此,提出了一种基于改进均值聚类算法的混合型数据库查询优化方法。建立混合型数据库查询执行计划代价模型,精准的定义了数据库查询执行代价。将改进均值聚类算法与粒子群算法有效的相融合,将粒子群中的粒子划分为多个子群,更新所有的粒子,通过粒子间的相互信息融汇,搜寻到数据库查询最优解。实验仿真证明,基于改进均值聚类算法的混合型数据库查询优化方法精确度高,效率高。 相似文献
15.
构建医药制造业竞争力评价指标体系,运用数据挖掘技术(K-均值聚类算法)定量评价竞争力,得出相应结论,为政府和企业决策提供参考。 相似文献
16.
针对传统的K-Means算法的不足,以及其在文本聚类中存在的局限性,提出了一种基于网页向量语义相似度的改进K-Means算法。新算法通过向量语义相似度的计算自动确定初始聚类中心,在聚类过程中,达到语义相似度阈值的网页才使用K-Means算法进行聚类。通过实验证明,新算法很好地克服了传统K-Means算法随机选取聚类中心以及无法处理语义信息的问题,提高了聚类的质量。 相似文献
17.
18.
19.
一种大规模中文搜索日志的层次聚类方法 总被引:1,自引:0,他引:1
提出一种层次聚类算法,旨在对搜索引擎的查询日志数据进行聚类分析。算法基于搜狗实验室公开的查询日志数据,通过3次划分完成查询文本聚类,每一次划分实现不同程度的降维。相似度参数可根据不同的聚类需求调整,算法可扩展性强。实验结果为查询推荐、相关性排序等提供了有力的依据。 相似文献
20.
为了提高垃圾标签检测精度,提出一种核K均值聚类和改进神经网络相融合的垃圾标签检测模型。首先核K均值聚类算法提抽取垃圾标签的特征向量,然后将特征向量集输入到BP神经网络进行训练,并采用混沌粒子群算法对BP神经网络的参数进行优化,最后建立垃圾标签检测模型,并通过仿真实验对模型性能测试。结果表明,该垃圾标签检测算法模型不仅提高了垃圾标签识别率,训练时间大幅度减少,垃圾标签检测效率得到提高,可以较好满足垃圾标签实时、在线检测要求。 相似文献