共查询到20条相似文献,搜索用时 15 毫秒
1.
针对社会化标签语义模糊,传统K-medoids聚类算法对初始聚类中心敏感、收敛速度缓慢、只能将归类对象划入到单一类别的缺点,提出一种基于改进K-medoids的社会化标注资源两阶段聚类算法。算法应用一种简洁快速的初始聚类中心选取新规则以及改进的聚类准则函数,首先进行标签聚类,然后将同一标签簇中标签标注的网络资源初步划分到同一资源簇中,最后在这些资源簇中再次进行资源聚类。实验结果表明,提出的算法能自主、合理地确定初始聚类中心,聚类过程收敛速度快,聚类结果有更好的准确性。 相似文献
2.
为了提高垃圾标签检测精度,提出一种核K均值聚类和改进神经网络相融合的垃圾标签检测模型。首先核K均值聚类算法提抽取垃圾标签的特征向量,然后将特征向量集输入到BP神经网络进行训练,并采用混沌粒子群算法对BP神经网络的参数进行优化,最后建立垃圾标签检测模型,并通过仿真实验对模型性能测试。结果表明,该垃圾标签检测算法模型不仅提高了垃圾标签识别率,训练时间大幅度减少,垃圾标签检测效率得到提高,可以较好满足垃圾标签实时、在线检测要求。 相似文献
3.
4.
社会标签系统是Web2.0中提出的概念,旨在更好地表达用户的兴趣和意愿。而标签聚类是社会标签系统的个性化推荐中一个重要的研究课题。本文研究了如何基于标签聚类与用户模型来进行个性化推荐的方法。通过计算标签的相似度进行标签聚类,结合用户模型,根据标签聚类结果做出推荐。通过采用CiteULike公布的数据集进行实验证明,与未采用标签聚类的推荐方法相比,本方法不仅可提高推荐的命中率,优化目标资源的排名,而且能为用户发现更多新的感兴趣的资源。 相似文献
6.
在分析folksonomy概念空间构建的可行性的基础上,对基于向量空间模型的传统聚类方法和概念空间模型的标签聚类方法进行比较,提出了基于概念空间模型的folksonomy聚类方法,并使用学术资源标注网站CiteUlike的真实标签数据集进行试验. 相似文献
7.
许多现实应用中,由于数据流的特性,使人们难以获得全部数据的类标签。为了解决类标签不完整数据流的分类问题,本文首先分析了有标签数据集对基于聚类假设半监督分类算法分类误差的影响;然后,利用分类误差影响分析以及数据流的特点,提出一种基于聚类假设半监督数据流集成分类器算法(semi-supervised data stream ensemble classifiers under the cluster assumption,SSDSEC),并针对个体分类器的权值设定进行了探讨;最后,利用仿真实验验证本文算法的有效性。 相似文献
8.
9.
10.
Tag分类基本问题探究 总被引:6,自引:0,他引:6
作为Web2.0技术的核心,Tag的应用越来越广泛,Tag的分类功能也越来越受重视,但是对于Tag分类的探讨依然付之阙如.作为一种新型的分类方法,Tag的来源多种多样,既有直接来源,也有间接来源.Tag分类采用了3种技法,分别是自由分类、自动归类、自动聚类,它可以应用于背景资料的阅读、分类订阅、邮件过滤、文件管理等领域,目前正对多次分类、交叉分类和动态链接等多个问题探索和研究. 相似文献
11.
12.
13.
将嵌套圆融入可视化聚类方法之中,探讨和研究了基于嵌套圆的可视化聚类方法和主要算法,并选择情报学领域的数字资源进行实证分析。实证结果表明,该方法既能够在有限的可视化空间提供海量资源的整体描述和全局视图展示,又可以根据实际需要对重要聚类簇或核心节点进行深入挖掘和个性化展示,能够为海量信息资源的深度开发与利用提供技术支持。 相似文献
14.
较为系统的综述了当前空间聚类算法的相关研究。依据这些算法的特点,将它们归纳为两类:划分聚类算法、层次聚类算法。针对划分聚类算法,重点分析了PAM、CLARA和CLARANS算法。针对层次聚类算法,重点分析了BIRCH、CURE算法。比较了这些算法的复杂度,并介绍了相关应用。 相似文献
15.
K-均值聚类算法是一种基于划分方法的聚类算法,本文通过对传统的K-均值聚类算法的分析,提出了一种改进的K-均值算法,并对该算法的时间复杂度和空间复杂度进行了分析。该算法在计算聚类中心点时采用了一种最近邻的思想,可以有效地去除"噪声"和"孤立点"对簇中平均值(聚类中心)的影响,从而使聚类结果更加合理。最后通过实验表明该算法的有效性和正确性。 相似文献
16.
本文简要介绍了聚类算法在国外信息检索领域中的应用概况,并详细介绍了聚类算法在国内该领域的应用情况。列举了应用得较多的几种聚类算法,给出了在多种信息检索中聚类算法的应用过程。 相似文献
17.
限制性聚类是一种试图将用户监督信息加入到已有聚类算法中的一种分类技术,目前已经被广泛应用于K-means算法和层次聚类算法中.在本文中,提出一种将限制条件加入到谱聚类算法的半监督聚类方法,利用正约束和负约束限制来构造约束矩阵,通过它们来引导聚类过程,并结合最优化技术,达到聚类的目的.数据实验验证了这种方法具有很好的精确度. 相似文献
18.
针对K-Means算法中对初始聚类中心进行随机选择并未达到理想优化的情况,提出一种改进的初始聚类中心选择算法。改进算法首先将原始数据进行预处理并计算各维有效数据的最大值和最小值,然后利用各维有效数据的最大值和最小值进行数据分段和初始聚类中心选择,最后采用VS集成开发环境进行建模。采用遵义医学院2010级的学生计算机考试成绩数据对模型进行仿真,仿真结果显示聚类挖掘性能相对K-Means算法较高,证明改进的初始聚类中心选择算法可以提供精确的聚类挖掘结果。 相似文献
19.
目前提出的大多数聚类融合算法在策略选择上未能同时兼顾聚类成员的多样性及质量,而且对高维数据的聚类结果均不理想,针对以上问题,本文提出一种改进的投影聚类融合算法,该算法主要在以往经典的投影聚类算法的基础上进行了改进,将投影聚类与分形维数结合,可对高维数据集进行降维聚类处理;而且该算法将选出最优参照成员,并设计出合理的选择策略,对部分优质成员进行选择,以得到一个更加准确的最终结果。高维数据聚类仿真实验结果表明,本文提出的改进的投影聚类融合算法与其他经典数据聚类融合算法相比,提高了聚类的有效性,大大提高了数据融合性能。 相似文献