首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
传统K中心点算法虽然改进了K均值算法对噪声和孤立点数据敏感的不足,但是仍存在着初始聚类中心和聚类个数k难以确定的问题,因此,针对算法存在的问题,提出一种基于密度的改进K中心点算法。该算法会根据数据集数据的分布情况自主确定聚类个数k和k个聚类中心点。最后,通过在入侵检测领域KDD Cup99数据集上实验测试表明,改进K中心点算法不仅能够自动形成k个聚类,而且具有较高的入侵检测率和较低的漏报率,聚类和入侵检测的效果均优于传统的K中心点算法。  相似文献   

2.
在K均值算法基础上,提出了改进的K均值算法(K+均值)。此方法计算每个数据对象所在区域的密度选择相互距离,最远的k个处于高密度区域的点作为初始聚类中心。将K均值算法和K+均值算法分别应用于入侵检测,试验结果表明:K+均值算法能够避免K均值算法固有的缺点,并且有比较高的检测性能。  相似文献   

3.
针对数据挖掘中高维数据多分类问题,提出了一种基于二分K均值的SVM决策树的高维数据分类方法.该方法先利用二分K-均值将高维数据基本聚为k类,再构造SVM多分类模型,利用它对各类进行细分.本文给出了该模型的构造及应用方法,并在标准数据集上验证了该方法的有效性.  相似文献   

4.
提出一种基于贪心随机自适应搜索过程的聚类算法.该算法先根据密度概念构造一个约束候选列表,然后从列表中随机选取k个对象作为K均值算法的k个起始中心点.试验结果表明该算法的聚类结果比k均值算法有显著改进.  相似文献   

5.
针对数据缺失这一普遍情况,提出一种改进的微粒群优化特征选择方法.首先,采用多重插补方法对缺失的数据进行插补,得到完整数据集;然后,采用k折交叉验证法计算分类器的精度,并在算法运行后期,对微粒群进行K均值聚类,从中选择微粒的全局最优点;最后,通过UCI中4个典型测试问题,仿真验证了所提算法的有效性.  相似文献   

6.
利用机器视觉量化西洋参外观特征的过程中,为了消除图像背景的影响,基于K均值聚类算法的思想,先将图像从RGB色彩空间转换成颜色重心角描述的色彩空间,并把颜色重心角从0360度划分成12区域,对各颜色重心角区域进行直方图统计,将K个频数最大的颜色重心角区域指定为初次聚类中心进行迭代实现图像分割.经对比实验表明,25幅样本图像中,传统的K均值聚类算法15幅存在过分割与10幅存在欠分割的情况,改进的K均值聚类算法收敛速度有所加快,普适性较好,25幅样本图像均能精准分割出目标与背景.  相似文献   

7.
电类实验教学过程中人工评判学生所测数据工作烦琐,影响了教学质量和效率。该文提出了改进的K近邻(K-nearest neighbors,KNN)分类算法,即基于均值漂移、安全间隔和核主成分分析(KPCA)的M-KPCA-KNN(KNN based on margin and KPCA)算法,以判断学生测量数据正确与否和错误原因。首先利用KPCA对高维实验数据进行降维,然后利用均值漂移向量找到不同类别数据的最密集位置,并在不同类别数据的边界设置安全间隔,最后,将与待测样本距离最近的k个数据设置权重,计算每个类别的权重和,权重和最大的类别为待测样本的类别。与现有的KNN算法相比,M-KPCA-KNN算法不仅提高了分类正确率,而且降低了时间复杂度。  相似文献   

8.
K-means算法在聚类过程中随机选取k个初始聚类中心,容易造成聚类结果不稳定。针对该问题,提出PCA-TDKM算法:使用主成分分析法对数据对象集合的属性进行降维,提取出主属性,去掉无关属性,从而加速聚类过程;基于最小生成树算法及树的剪枝方法将数据对象划分为k个初始聚类簇,然后进行剪枝生成k棵子树,计算每棵子树中所有数据对象的均值,作为初始聚类中心;利用基于密度与最大最小距离的算法思想进行聚类。将PCA-TDKM算法与K-means、KNE-KM、QMC KM、CFSFDP-KM在UCI数据集上进行聚类比较,结果表明该算法聚类结果稳定、聚类准确率高。  相似文献   

9.
为拓展k近邻法在多标签分类中的应用范围,分析不同测试方法在多标签分类中的性能.通过留一法对数据样本(Yeast,Image和Scene 3组数据集)进行预处理,采用欧式距离、余弦距离以及曼哈顿距离分别计算每个样本的k个近邻,分成训练样本1500个,测试样本917个;然后,根据近邻标签信息对每一类标签进行投票,形成新数据...  相似文献   

10.
针对K均值聚类算法存在的问题,提出了一种基于改进粒子群的加速K均值聚类入侵检测算法,通过实验分析和比较,证明改进算法有效地提高了入侵检测数据处理速度。  相似文献   

11.
利用对某网络公司的客户数据使用K均值聚类方法,针对数据中存在的缺失和变量共线性严重的情况,对数据进行预处理。通过选择出符合分类目的的变量得出可用于聚类的完整数据集。然后通过建模对客户进行分类,利用已人为分类的100个样本为训练集。  相似文献   

12.
隐藏层中心点参数的选择和权值向量的快速计算是径向基函数神经网络设计的关键问题.基于"半月"数据集,论文提出了一种上下半月单独计算聚类中心的K-均值聚类、递归最小二乘算法计算权值向量的混合学习算法.基于三层RBF神经网络结构,以支持向量机作为分类器,开展了K-均值+最小均方算法及K-均值+递归最小二乘算法2种混合模式的对比实验.实验结果表明,"K-均值+RLS"算法相比"K-均值+LMS"算法具有更快的收敛性,在应对线性不可分的情况,上下半月单独作用的K-均值聚类算法表现更优越,综合考虑收敛速度及分类精度两个指标,论文提出的上下半月单独计算中心点的K-均值聚类+RLS的混合学习算法获得较优的性能.  相似文献   

13.
基于K-均值算法的模糊分类器具有很好的分类效果,用它可以很准确的对训练样本进行分类,此方法是将K-均值算法应用于训练数据的聚类,对每个聚类的半径和聚类的中心都是可计算的,而模糊系统设计方法就是用模糊度来描述聚类,对训练数据进行高效且准确的分类,这种方法有下面几个特点:(a)不要预定义参数;(b)训练时间短;(c)简单;最后用一个例子对这种模糊分类器进行分析验证。  相似文献   

14.
分析了K均值聚类算法(K-means)存在的不足和改进遗传算法的全局优化能力,提出一种基于改进遗传算法的文本聚类方法,该方法将原始文档转化成用向量空间模型来描述的文本向量,首先随机产生若干个文档向量作为初始聚类中心形成遗传算法的染色体种群,经过改进遗传算法的选择、交叉、变异进化运算,得到较为优化的K均值聚类算法的初始聚类中心。实验表明该算法文本聚类提高了查准率和查全率,算法的高效性也得到了验证。  相似文献   

15.
基于模糊C-均值聚类方法的石油钻井工作状态分析   总被引:2,自引:1,他引:1  
采用鄂北6个录井样本点的钻头位置、井深、大钩负荷、立压、钻压、出口流量等指标共100个实际钻井数据进行了模糊C-均值聚类分析;在经验知识匮乏、存在无效数据和干扰的情况下,计算出了较为符合实际情况的聚类中心矩阵和聚类结果矩阵;根据标志样本点工作状态对样本进行了基本正确的分类,画出了模糊聚类关系图.  相似文献   

16.
传统的支持向量机分类算法在优化过程中对所有支持向量都进行优化,增加了计算量,降低了训练效率.针对上述缺点,在分析样本模糊隶属关系的基础上,采用改进的K近邻算法为已知样本分配隶属度,根据训练样本的隶属关系,剔除非支持向量,减少训练样本,并将其用于中文网页的分类中,得到了较好的分类效果.仿真实验结果表明,改进后的方法不仅相对简单,而且在保证分类器性能的情况下,能有效地减少支持向量机的训练样本数,从而提高支持向量机的训练和测试速度.  相似文献   

17.
基于层次的模糊K均值聚类算法研究   总被引:1,自引:0,他引:1  
通过对K均值聚类算法的研究,本文提出了一种基于层次聚类与模糊聚类思想的K均值聚类算法。算法首先使用层次方法对数据进行初始聚类,然后用得到的聚类数作为模糊K均值聚类中的K值,对聚类进行修正。最后通过实验,验证了该算法不需要人为假设聚类算法中的K值,而且引入了模糊隶属关系使类别的划分更接近于事实,从而证明了该算法的有效性。  相似文献   

18.
徐秀芳  徐森  徐静  安晶 《教育技术导刊》2016,15(12):156-158
提出了一种改进的K均值算法用于X光片图像聚类。首先对X光片图像进行预处理,获取数据,然后将每个点的灰度值存储在灰度值矩阵中,最后用改进的K均值算法对灰度值矩阵进行聚类。对比实验结果表明,改进的K均值算法获得了更加优越的聚类结果。  相似文献   

19.
介绍了K 最近邻分类算法原理,将该算法应用到实际问题乘式割草机问题,通过实验得到了该乘式割草机问题中最近邻个数k的最佳值。研究了K 最近邻分类算法中最近邻个数k的取值对K 近邻分类算法的影响,实验确定当k大致等于n/k时,其中n是该训练集中事例的数目,K 最近邻算法的分类准确率最高。  相似文献   

20.
针对FCM聚类算法存在的一些缺陷,结合蚁群优化算法的优点,提出了一种基于信息素的FCM蚁群聚类算法.该算法通过FCM算法获得新的聚类中心,利用蚁群优化算法的全局搜索性、并行计算性等特点避免了聚类陷入局部量优解.仿真结果表明了该算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号