首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 859 毫秒
1.
提出了一种基于核的聚类方法,增加对样本特征的优化;通过核函数,把数据样本空间映射到一个高维的特征空间;在特征空间对数据样本进行k-中心点聚类,并通过计算类内距离作为适应度准则,取其最优的结果。通过Web日志挖掘中的Web客户聚类应用比较,表明核聚类方法在性能上比经典的聚类算法有较大的改进,从而实现更为准确的聚类。  相似文献   

2.
检索结果聚类能够有效帮助提高获取信息的效率和质量。针对传统文本聚类模型存在数据维数过高、缺乏语义理解等问题,提出一种面向检索结果聚类的融合共现分析主题建模算法。基于改进的LDA模型,对得到的“文档-主题”概率分布进行聚类分析,采用K-means算法完成聚类过程,最后提出根据聚类中心提取主题词作为类簇标签。实验结果表明,改进的LDA算法在检索结果聚类应用上不仅获得了很好的聚类效果,类簇标签也有良好的可读性。  相似文献   

3.
随着如今数据量的爆发式增长,传统的数据挖掘方法已经远远不能满足人们需求,K-means聚类作为一种经典的聚类算法,其应用领域很广。但是K-means算法在随机选取初始聚类K个中心时,容易使聚类结果不稳定,因此提出基于核函数的K-means聚类算法。与此同时,结合MapReduce分布式框架对改进后的K-means聚类算法作分布式计算。研究结果表明,基于高斯核函数的K-means聚类在分布式下的计算能够加速K-means聚类过程,且结果优于单独基于核密度估计的K-means算法。  相似文献   

4.
聚类分析被广泛用于数据挖掘等领域,基于蚁群算法的聚类算法也得以应用。针对K-Means算法和蚁群聚类算法出现的缺点,利用了K-Means算法快速确定聚类中心和精英适应保留值的策略,提出了一种改进的基于K-Means的蚁群聚类算法。仿真实验表明,改进算法的性能得到有效提高。  相似文献   

5.
凝聚型层次聚类和模糊C-均值聚类是聚类中的两种常用算法,每种算法都有其自己的优点、缺点及适用的对象和范围。针对FCM算法的对初始值敏感,以及目标函数没有考虑类间距离的缺点,通过使用距离阚值,把凝聚型层次聚类与模糊C-均值聚类算法相结合,产生一种新的基于距离闲值的FCM算法,实验结果表明。这种算法能够自动的判断迭代的终止条件、快速有效的找到最佳聚类结果,从而实现对模糊C-均值聚类算法的自动优化。  相似文献   

6.
提出了一种基于改进蚁群算法的动态K-均值聚类算法思想。该算法首先利用蚁群算法较强处理局部极值的能力,动态地确定了聚类数目和中心,然后利用蚁群聚类得到的结果,进行K-均值聚类弥补蚁群算法的不足。两者的有机结合可以寻求到具有全局分布特性的最优聚类,实现基于改进的蚁群聚类算法分析。  相似文献   

7.
提出了一种基于改进蚁群算法的动态K-均值聚类算法思想,该算法首先利用蚁群算法的较强处理局部极值的能力,动态地确定了聚类数目和中心,然后利用蚁群聚类得到的结果,再进行K-均值聚类弥补蚁群算法的不足。两者有机结合起来可以寻求到具有全局分布特性的最优聚类,实现了基于改进的蚁群聚类算法分析。  相似文献   

8.
针对传统检测方法对焊接缺陷图像识别的缺点,提出基于改进粒子群算法优化的K-means聚类的焊接缺陷图像识别方法。运用HOG算法提取焊接缺陷图像的特征,利用IPSO算法对K-means聚类模型的聚类点数K进行参数寻优,从而实现对焊接缺陷的检测识别,实验验证表明,该方法能够有效提高焊接缺陷图像的识别效果,总体识别准确度达到94%。  相似文献   

9.
图像分割是一种对不同特征的像素进行聚类的过程,过程中涉及像素的梯度、灰度及邻域特征。由于蚁群算法的离散性、并行性、全局优化性和稳定性等特点,基于蚁群算法提出一种有效的图像分割改进算法。首先通过蚁群改进算法的模糊聚类能力可以分别计算出像素与目标、背景、噪声点、边界点的隶属关系;然后对于蚁群算法循环次数多、计算量较大的问题,设置启发式引导函数和聚类中心,解决传统聚类中运行效率低、初始化敏感度高等缺点;最后引入梯度算子,对目标与背景灰度值相似图像进行分割,对结果进行了进一步的优化。实验表明,应用该改进算法得到的图像分割结果具有较高的准确度和效率。  相似文献   

10.
《宜宾学院学报》2016,(6):41-45
针对人工蜂群算法容易陷入局部最优值,收敛到最优解速度慢的缺点,通过使用固定步长和可变步长,定义采蜜蜂搜索食物源的公式,提出了一种改进的人工蜂群算法.对四个标准测试函数仿真表明该改进算法提高了算法的优化性能.为了改善数据挖掘中聚类算法效率,从人工蜂群算法评价函数入手,使用凝聚度函数、分散度函数,将改进的人工蜂群算法用于解决聚类问题,对三个数据集测试表明新算法在聚类准确率方面有一定提高.  相似文献   

11.
为了挖掘基于语义描述的煤矿安全监测数据中蕴含的生产安全信息,指导煤矿安全生产和决策,研究了基于语义描述的煤矿安全监测数据聚类分析算法.首先,阐述了煤矿安全监测数据的语义和数值混合描述方法;接着,分别给出了语义和数值数据的相似性度量方法,以及基于权重的煤矿安全监测数据的混合相似性度量方法;然后,以混合相似性度量方法为距离度量准则,并借鉴网格的思想,给出了基于网格的改进CURE聚类算法.通过煤矿安全监测数据集的仿真实验,验证了所提算法的有效性.  相似文献   

12.
针对基于罚函数的排挤小生境遗传算法的缺陷,提出了改进的K-均值聚类排挤小生境遗传算法。该算法将改进的K-均值聚类分析与排挤技术有机地结合起来,无需事先确定小生境的数目和半径,可以通过调节最小聚类距离控制收敛到的小生境的数目,避免找到无效的极值点。理论分析和数值实验表明,该算法对于非均匀分布的多峰函数具有较好的搜索性能。  相似文献   

13.
以FiIlore的框架语义学为理论基础的FrameNet,旨在通过对真实语料的分析和研究,建立起可以从不同的视角理解词义的语义框架。它指出对于词义的描述必须与其所在的认知概念框架相联系。FrameNet将每个词都放到不同的场景之中,形成每个词的语义框架,这样使用者在使用的过程中可以在头脑中构建出一个完整的语义框架,对于词义的理解自然也就比较深刻。而这正是目前传统的字典所需要加以完善之处。鉴于柯林斯COBUILD英语词典也是基于真实语料库所编纂的,两者在语料来源的本质方面不谋而合。本文选取两者进行对比,以期FrameNet可以对未来的词典编纂有所启示。  相似文献   

14.
敬谦语素是一种语法现象,修饰或限定表示动作、行为的语言成分的敬谦语素是副词性敬谦语素。副词性敬谦语素也是语义布控下的类聚现象,根据语用类聚的情形,对明清时期的副词性敬谦语素进行归纳,可以得出九类,它们构成了近代汉语中副词性敬谦语素的主要语用语义类别。  相似文献   

15.
一种基于向量空间模型的文本聚类方法   总被引:3,自引:0,他引:3  
研究了一种基于向量空间模型的文档聚类方法.提出了一个新的聚类模型,即在传统聚类模型的基础上增加一个文档特征向量调整模块;给出了一个特征评价函数用以进行特征提取;对一种基于相似度的平面划分聚类算法做了一些改进.实验结果表明本文提出的聚类模型是可行的.  相似文献   

16.
基于语法匹配的服务发现无法适应web的开放性和动态性环境.为了对语法匹配产生的web服务候选集进行二次选择,提出一种基于语义相似性的web服务选择方法.该方法首先定义了包含QoS和上下文的web服务本体.服务本体提供了一个接口描述的通用术语集合,以此作为服务描述的语义支撑.然后,通过相似理论和web服务本体计算web服务接口之间的语义距离.与已有的方法相比,由于提供了概念化的形式语义说明,web服务的接口能在本体下得到准确的解释,同时服务选择的效率和准确性得到了改进.  相似文献   

17.
随着SOA迅猛发展和互联网上服务数量俱增,服务发现成为极具挑战性的工作。传统的服务发现方法在语义稀疏情境下精准度不高,主要是缺乏有效信息对发现工作的支持,无法对服务进行准确的类别划分。针对此问题,提出一种基于BTM面向Web服务短文本描述的服务聚类方法S3C,该方法的主要思想是利用BTM在短文本聚类过程中使用Biterm(词对)优势对服务描述进行潜在特征表示,基于服务潜在特征使用Kmeans聚类方法进行服务聚类。BTM采用词对的主题建模方式,能够极大程度地扩展文本信息,解决短文本中的关键词稀疏问题。采用PWeb数据集进行大量对比实验可知,该方法与经典聚类方法相比,类簇的平均纯度提高30%,平均熵降低近50%。  相似文献   

18.
为了使聚类可以在低维数据空间中进行,提出了一种新的聚类特征选择方法.该方法分3个步骤,每个步骤都在一个wrapper框架中执行.首先,将所有原始特征都按照重要性进行排序,引入一个特征重要性评价函数E(f);然后,顺序地选择特征组成重要特征子集;最后,去除重要特征子集中可能存在的冗余特征.由于是顺序选择特征而不是在巨大的特征子集空间中进行搜索,因此算法效率很高.实验结果表明该方法可以找出有助于聚类的重要特征子集,并且可以去掉那些不利于聚类的特征.  相似文献   

19.
为解决集中式服务发现结构存在的性能瓶颈问题,基于领域本体语义信息,提出一种能自适应地调整领域划分、分配系统资源的分布式web服务发现体系结构,并分析了该结构的可扩展性、自组织性和自适应性.具体描述了该结构下的语义web服务发现算法的2个阶段:语义注册中心定位和基于输入输出的服务匹配.在注册中心组成的平衡树拓扑结构中,注册代理能够快速将请求转发至目标注册中心,避免产生性能瓶颈.然后,通过引入一种新的基于语义距离的服务匹配算法来进行服务查询效果优化.模拟实验结果表明:提出的服务发现方法具有高可扩展性的优点;与其他服务查询算法相比,服务匹配算法具有更高的查全率和查准率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号