首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
郭伟光  汪本强  杨学春 《情报杂志》2015,(2):159-163,158
针对社会化标签语义模糊,传统K-medoids聚类算法对初始聚类中心敏感、收敛速度缓慢、只能将归类对象划入到单一类别的缺点,提出一种基于改进K-medoids的社会化标注资源两阶段聚类算法。算法应用一种简洁快速的初始聚类中心选取新规则以及改进的聚类准则函数,首先进行标签聚类,然后将同一标签簇中标签标注的网络资源初步划分到同一资源簇中,最后在这些资源簇中再次进行资源聚类。实验结果表明,提出的算法能自主、合理地确定初始聚类中心,聚类过程收敛速度快,聚类结果有更好的准确性。  相似文献   

2.
为了提高垃圾标签检测精度,提出一种核K均值聚类和改进神经网络相融合的垃圾标签检测模型。首先核K均值聚类算法提抽取垃圾标签的特征向量,然后将特征向量集输入到BP神经网络进行训练,并采用混沌粒子群算法对BP神经网络的参数进行优化,最后建立垃圾标签检测模型,并通过仿真实验对模型性能测试。结果表明,该垃圾标签检测算法模型不仅提高了垃圾标签识别率,训练时间大幅度减少,垃圾标签检测效率得到提高,可以较好满足垃圾标签实时、在线检测要求。  相似文献   

3.
在资源共享性的社会化标注网站上,大量无标签或者缺少标签的资源往往会因为标签信息的不完整,以致无法被有效地利用和检索。为了有效地进行资源检索,借助于贝叶斯层级模型,对被标注信息资源的主题进行聚类,并生成最终的主题聚类结果,相关实验结果显示了其有效性。  相似文献   

4.
社会标签系统是Web2.0中提出的概念,旨在更好地表达用户的兴趣和意愿。而标签聚类是社会标签系统的个性化推荐中一个重要的研究课题。本文研究了如何基于标签聚类与用户模型来进行个性化推荐的方法。通过计算标签的相似度进行标签聚类,结合用户模型,根据标签聚类结果做出推荐。通过采用CiteULike公布的数据集进行实验证明,与未采用标签聚类的推荐方法相比,本方法不仅可提高推荐的命中率,优化目标资源的排名,而且能为用户发现更多新的感兴趣的资源。  相似文献   

5.
6.
在分析folksonomy概念空间构建的可行性的基础上,对基于向量空间模型的传统聚类方法和概念空间模型的标签聚类方法进行比较,提出了基于概念空间模型的folksonomy聚类方法,并使用学术资源标注网站CiteUlike的真实标签数据集进行试验.  相似文献   

7.
许多现实应用中,由于数据流的特性,使人们难以获得全部数据的类标签。为了解决类标签不完整数据流的分类问题,本文首先分析了有标签数据集对基于聚类假设半监督分类算法分类误差的影响;然后,利用分类误差影响分析以及数据流的特点,提出一种基于聚类假设半监督数据流集成分类器算法(semi-supervised data stream ensemble classifiers under the cluster assumption,SSDSEC),并针对个体分类器的权值设定进行了探讨;最后,利用仿真实验验证本文算法的有效性。  相似文献   

8.
针对政府门户网站标签系统中存在的标签组织混乱、信息描述精确度不高等缺陷,本文提出了一种基于K-means的标签聚类算法。实现了对标签的重新组织,为用户提供了更加方便的检索机制。  相似文献   

9.
[目的/意义]社会化标注系统为用户检索提供便利的同时也面临一些困扰,标签推荐研究有助于解决资源检索中精确度与召回率之间的两难抉择。[过程/方法]借助网络科学的理论与方法,通过对标签网络的模块化聚类处理获得主题聚类,采用度数中心度对主题聚类内部标签进行排名,根据特定规则选取Top-N标签数量。[结果/结论]实验结果显示,研究中提出的模块化Top-N标签推荐方法,具有可逐层细化的精确度和良好的召回率。该方法的弹性机制可为不同的检索要求提供差异化服务。  相似文献   

10.
Tag分类基本问题探究   总被引:6,自引:0,他引:6  
作为Web2.0技术的核心,Tag的应用越来越广泛,Tag的分类功能也越来越受重视,但是对于Tag分类的探讨依然付之阙如.作为一种新型的分类方法,Tag的来源多种多样,既有直接来源,也有间接来源.Tag分类采用了3种技法,分别是自由分类、自动归类、自动聚类,它可以应用于背景资料的阅读、分类订阅、邮件过滤、文件管理等领域,目前正对多次分类、交叉分类和动态链接等多个问题探索和研究.  相似文献   

11.
本研究针对电子商务网站用户对商品概念认知与网站实际分类目录不匹配,导致检索效率低下的问题,提出了基于用户标签的电子商务网站分类目录改善方案,即将用户标签进行多层聚类,将聚类结果以层级结构的形式展示,并实现标签聚类结果和网站分类目录的映射,从而提高电子商务网站的分类检索效率和分类导航性能。  相似文献   

12.
介绍聚类算法的过程以及聚类有效性指标的分类,分别评述科学计量学常用软件中的几种聚类算法,分析聚类算法的特性并采用基于类内紧密度和类间分离度对聚类结果的有效性进行探讨,总结各聚类算法的效果并对应软件分析的结果进行案例分析。  相似文献   

13.
将嵌套圆融入可视化聚类方法之中,探讨和研究了基于嵌套圆的可视化聚类方法和主要算法,并选择情报学领域的数字资源进行实证分析。实证结果表明,该方法既能够在有限的可视化空间提供海量资源的整体描述和全局视图展示,又可以根据实际需要对重要聚类簇或核心节点进行深入挖掘和个性化展示,能够为海量信息资源的深度开发与利用提供技术支持。  相似文献   

14.
较为系统的综述了当前空间聚类算法的相关研究。依据这些算法的特点,将它们归纳为两类:划分聚类算法、层次聚类算法。针对划分聚类算法,重点分析了PAM、CLARA和CLARANS算法。针对层次聚类算法,重点分析了BIRCH、CURE算法。比较了这些算法的复杂度,并介绍了相关应用。  相似文献   

15.
K-均值聚类算法是一种基于划分方法的聚类算法,本文通过对传统的K-均值聚类算法的分析,提出了一种改进的K-均值算法,并对该算法的时间复杂度和空间复杂度进行了分析。该算法在计算聚类中心点时采用了一种最近邻的思想,可以有效地去除"噪声"和"孤立点"对簇中平均值(聚类中心)的影响,从而使聚类结果更加合理。最后通过实验表明该算法的有效性和正确性。  相似文献   

16.
本文简要介绍了聚类算法在国外信息检索领域中的应用概况,并详细介绍了聚类算法在国内该领域的应用情况。列举了应用得较多的几种聚类算法,给出了在多种信息检索中聚类算法的应用过程。  相似文献   

17.
限制性聚类是一种试图将用户监督信息加入到已有聚类算法中的一种分类技术,目前已经被广泛应用于K-means算法和层次聚类算法中.在本文中,提出一种将限制条件加入到谱聚类算法的半监督聚类方法,利用正约束和负约束限制来构造约束矩阵,通过它们来引导聚类过程,并结合最优化技术,达到聚类的目的.数据实验验证了这种方法具有很好的精确度.  相似文献   

18.
针对K-Means算法中对初始聚类中心进行随机选择并未达到理想优化的情况,提出一种改进的初始聚类中心选择算法。改进算法首先将原始数据进行预处理并计算各维有效数据的最大值和最小值,然后利用各维有效数据的最大值和最小值进行数据分段和初始聚类中心选择,最后采用VS集成开发环境进行建模。采用遵义医学院2010级的学生计算机考试成绩数据对模型进行仿真,仿真结果显示聚类挖掘性能相对K-Means算法较高,证明改进的初始聚类中心选择算法可以提供精确的聚类挖掘结果。  相似文献   

19.
目前提出的大多数聚类融合算法在策略选择上未能同时兼顾聚类成员的多样性及质量,而且对高维数据的聚类结果均不理想,针对以上问题,本文提出一种改进的投影聚类融合算法,该算法主要在以往经典的投影聚类算法的基础上进行了改进,将投影聚类与分形维数结合,可对高维数据集进行降维聚类处理;而且该算法将选出最优参照成员,并设计出合理的选择策略,对部分优质成员进行选择,以得到一个更加准确的最终结果。高维数据聚类仿真实验结果表明,本文提出的改进的投影聚类融合算法与其他经典数据聚类融合算法相比,提高了聚类的有效性,大大提高了数据融合性能。  相似文献   

20.
针对K-means聚类算法无法确定k值,并容易忽视在多维角度下进行聚类的缺点,本文提出了改进的多维度的加权的算法,在自适应K-means聚类算法的基础上引入了视图权重和变量权重,得到了包含多层变量的目标函数,通过数学证明使得目标函数最小化,得到最优的聚类效果。实验采用3个标准数据集作为聚类研究的对象,通过与FCM算法比较,说明了本文算法在聚类方面具有良好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号