首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 453 毫秒
1.
分析了K均值聚类算法(K-means)存在的不足和改进遗传算法的全局优化能力,提出一种基于改进遗传算法的文本聚类方法,该方法将原始文档转化成用向量空间模型来描述的文本向量,首先随机产生若干个文档向量作为初始聚类中心形成遗传算法的染色体种群,经过改进遗传算法的选择、交叉、变异进化运算,得到较为优化的K均值聚类算法的初始聚类中心。实验表明该算法文本聚类提高了查准率和查全率,算法的高效性也得到了验证。  相似文献   

2.
选取初始聚类中心是多数聚类算法的首要步骤,往往影响着聚类的效果。为了避免算法迭代过程中易陷入局部最优的问题,本文提出了一种基于模糊交叉网格的初始聚类中心选取方法。算法通过对数据空间网格化后,以网格交点为中心的邻近网格组成网格空间,根据数据点的隶属度统计每个网格空间的密度,再通过局部最大网格空间选取K个初始聚类中心。在真实数据集上进行实验,结果表明该方法在保证了聚类效果的同时,提高了收敛速度。  相似文献   

3.
基于层次的模糊K均值聚类算法研究   总被引:1,自引:0,他引:1  
通过对K均值聚类算法的研究,本文提出了一种基于层次聚类与模糊聚类思想的K均值聚类算法。算法首先使用层次方法对数据进行初始聚类,然后用得到的聚类数作为模糊K均值聚类中的K值,对聚类进行修正。最后通过实验,验证了该算法不需要人为假设聚类算法中的K值,而且引入了模糊隶属关系使类别的划分更接近于事实,从而证明了该算法的有效性。  相似文献   

4.
针对模糊C-均值聚类算法(FCM)存在易受初始聚类中心影响和容易陷入局部最优的问题,提出了一种将灰狼优化算法(GWO)和模糊C-均值相结合的新聚类算法(GWO-FCM)。该算法利用GWO算法强大的全局寻优能力对FCM算法的聚类中心进行优化,模拟灰狼优秀的搜寻猎物行为找到一组最佳聚类中心来提高FCM的聚类效果。通过UCI数据集的仿真结果和算法比较验证了该算法的有效性。  相似文献   

5.
针对核模糊C-均值聚类算法中隶属度的计算特点,提出了一种改进的核模糊C-均值算法。改进后的算法是,在更新对象类的隶属度之前先判断对象是否可能属于该类。如果对象可能属于该类,则为其分配一个大于0的隶属度,否则直接将其隶属度置为0。针对不同测试数据集的实验结果表明,改进后的核模糊C 均值算法提高了聚类效果,是一种可行有效的算法。  相似文献   

6.
本文首先对模糊C-均值聚类作了简要分析和评论,在此基础上将模拟退火机制引入其中,以克服模糊C-均值聚类的局部性和对初始聚类中心的敏感性;然后,采用了基于贴近度和择近原则的模糊识别方法,文中分析了格贴近度的不足之处,并对之进行了改进;最后,详细设计了上述各算法。仿真结果说明,该方法在识别速度和准确率方面都达到了令人满意的效果,为种子的在线检测提供了一种新思路,也拓展了模糊理论的应用范围。  相似文献   

7.
模糊聚类是一种科学有效的聚类方法,其中模糊c-均值聚类算法是目前聚类分析中最受欢迎的算法之一.具有部分已知信息的模糊聚类不仅能够节省聚类时间,更能有效的检验聚类效果.通过用MATLAB语言实现了前两者的有效结合.  相似文献   

8.
本文将模糊C均值聚类和自适应神经模糊网络结合起来.模糊C均值聚类用于对输入变量空间进行划分,生成初始的模糊规则库,自适应模糊神经网络(ANFIS)选用最小二乘法和BP算法.与普通的模糊神经网络相比,这种模糊神经网络收敛速度快,建模精度高。  相似文献   

9.
相对于抑制式模糊C-均值聚类算法,半抑制式模糊C-均值聚类算法引入抑制门限,在保持收敛速度变化不大的前提下改善了聚类的效果。然而,该算法也存在参数选择较多的问题。针对该问题,我们引入面向隶属度修正的模糊聚类参数选择方法,提出了改进的半抑制式模糊C-均值聚类算法。实验表明,该算法具有较好的可操作性,在具有较快收敛速度的同时,也维持了较好的收敛效果。  相似文献   

10.
欠定稀疏盲分离算法主要是采用"两步法":第一步用混叠信号估计混叠矩阵;第二步根据估计的混叠矩阵求解源信号.在两步法中,C-均值聚类算法和模糊C-均值聚类算法常用来估计混叠矩阵,这两种聚类的研究理论都较成熟,故它们得到很大的应用.该文在欠定稀疏盲分离中,比较了这两种算法.试验结果表明,模糊C-均值聚类算法比C-均值聚类算法估计混叠矩阵更加精确,恢复源信号精度更高,但算法复杂,分离的时间长.  相似文献   

11.
To extract region of interests (ROI) in brain magnetic resonance imaging (MRI) with more than two objects and improve the segmentation accuracy, a hybrid model of a kernel-based fuzzy c-means(KFCM) clustering algorithm and Chan-Vese (CV) model for brain MRI segmentation is proposed. The approach consists of two successive stages. Firstly, the KFCM is used to make a coarse segmentation, which achieves the automatic selection of initial contour. Then an improved CV model is utilized to subdivide the image. Fuzzy membership degree from KFCM clustering is incorporated into the fidelity term of the 2-phase piecewise constant CV model to obtain accurate multi-object segmentation. Experimental results show that the proposed model has advantages both in accuracy and in robustness to noise in comparison with fuzzy c-means (FCM) clustering, KFCM, and the hybrid model of FCM and CV on brain MRI segmentation.  相似文献   

12.
文本聚类综述   总被引:1,自引:0,他引:1  
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘、智能搜索引擎、短文本信息处理等领域获得了广泛的应用。本文首先讨论了文本聚类(Text clustering)的应用,然后对文本聚类算法、聚类关键技术进行了综述。  相似文献   

13.
A novel model of fuzzy clustering using kernel methods is proposed. This model is called kernel modified possibilisticc-means (KMPCM) model. The proposed model is an extension of the modified possibilistic c-means (MPCM) algorithm byusing kernel methods. Different from MPCM and fuzzy c-means (FCM) model which are based on Euclidean distance, theproposed model is based on kernel-induced distance. Furthermore, with kernel methods the input data can be mappedimplicitly into a high-dimensional feature space where the nonlinear pattern now appears linear. It is unnecessary to docalculation in the high-dimensional feature space because the kernel function can do it. Numerical experiments show thatKMPCM outperforms FCM and MPCM.  相似文献   

14.
聚类分析是数据挖掘的一个重要研究领域,按照一定的要求和规律将事物进行分类的一种数学方法。将模糊数学的模糊理论应用于数据挖掘的聚类分析中,提出一种快速模糊C-均值聚类算法,并给出模糊聚类分析在数据挖掘中的应用的主要步骤,大大提高计算效率,收敛速度非常快,对大量数据处理是有实际意义的。  相似文献   

15.
论文提出了一种基于蚁群动态模糊聚类算法的计算机图像分割方法,有效地利用蚁群算法的聚类分析能力,克服了FCM算法对初始化的敏感,动态地确定了聚类数目和中心。然后利用蚁群聚类算法得到的模型进行修改,再进行模糊聚类弥补蚁群算法的不足。最后将该算法应用到计算机图像分割技术。对比实验表明,该算法实验表明该算法速度快、划分特性好,可以准确地分割出目标。  相似文献   

16.
图像分割是一种对不同特征的像素进行聚类的过程,过程中涉及像素的梯度、灰度及邻域特征。由于蚁群算法的离散性、并行性、全局优化性和稳定性等特点,基于蚁群算法提出一种有效的图像分割改进算法。首先通过蚁群改进算法的模糊聚类能力可以分别计算出像素与目标、背景、噪声点、边界点的隶属关系;然后对于蚁群算法循环次数多、计算量较大的问题,设置启发式引导函数和聚类中心,解决传统聚类中运行效率低、初始化敏感度高等缺点;最后引入梯度算子,对目标与背景灰度值相似图像进行分割,对结果进行了进一步的优化。实验表明,应用该改进算法得到的图像分割结果具有较高的准确度和效率。  相似文献   

17.
为促进垃圾分类政策实施,科学、合理地在居民生活小区设置垃圾分类站,建立选址模型和成本模型对垃圾分类站建设运营成本及居民满意度负效应成本进行求解,并对K-means聚类算法与模糊C-means聚类算法进行比较。通过对某小区每栋居民楼到垃圾分类站的平均距离分析得出,K-means聚类算法计算得出的平均距离相比模糊C-means聚类算法缩短了约17%,在成本模型中建设运营成本降低了1万元,居民满意度负效应成本降低了0.68万元,验证了模型的可行性及K-means聚类算法的优越性。在未来的研究中可对算法进行改进,以进一步优化成本,确定全局最优。  相似文献   

18.
在篇章语言学的信息分析中,主题分析具有与主位分析不同的意义。并且,主题分析对于隐喻语篇存在特殊意义,因为主题和概念隐喻是隐喻语篇建构和识解的重要手段。主题分析帮助人们认知隐喻语篇:从创作角度,概念隐喻建构文学作品的基本主题;从识解角度,文学作品的基本主题的关系是隐喻。  相似文献   

19.
ROCK是一种采用数据点间的公共链接数来衡量相似度的分层聚类方法,这种方法对于高维、稀疏特征的分类数据具有高效的聚类效果.其邻接度矩阵计算是影响其时间复杂度的关键步骤,将图形处理器(GUP)强大的浮点运算和超强的并行计算能力应用与此步骤,而其余步骤由CPU完成,这种基于GUP的ROCK算法的运算效率在AMD 643500+CPU和NVIDIA GeForce 6800 GT显卡的硬件环境下经过实验测试,证明其运算速度比完全采用CPU计算速度要快.这种改进的分层聚类算法适合在数据流环境下对大量数据进行实时高效聚类操作.  相似文献   

20.
话题结构分析法是由芬兰语言学家Lautamatti创建起来的语篇连贯研究方法。该方法侧重考察句子话题与语篇主题间的语义关系,研究语篇中不断重复的关键字词的推进模式。通过研究句子话题的推进方式,可以了解到语篇的组织形式,考察其语义连贯和统一的情况。因此,本文拟从话题结构分析法的角度出发,探讨其在语篇连贯中所起的作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号