首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
本文基于国内外最新研究成果对电子商务中应用的web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题,给出了基于web日志的客户群体聚类算法及web页面聚类算法。利用这些web挖掘技术可有效挖掘用户个性特征,从而指导电子商务网站资源的组织和分配。  相似文献   

2.
介绍了web日志挖掘概念,利用改进后k-means聚类算法对网吧web日志挖掘,对网吧用户行为聚类分析,找出用户的偏爱,以便网吧管理员更好定制网吧网络管理策略.  相似文献   

3.
传统的K—means算法对初始聚类中心敏感,聚类的结果随不同的初始输入而波动.为了消除这种敏感性,提出了一种改进的K-means算法,改善聚类算法中选取初值的依赖性,提高聚类结果的稳定性.仿真实验结果表明:改进后的K-means算法优于原始算法.  相似文献   

4.
模糊聚类是一种科学有效的聚类方法,其中模糊c-均值聚类算法是目前聚类分析中最受欢迎的算法之一.具有部分已知信息的模糊聚类不仅能够节省聚类时间,更能有效的检验聚类效果.通过用MATLAB语言实现了前两者的有效结合.  相似文献   

5.
本文对电子商务的现状进行分析,并对web挖掘进行阐述,设计了一个基于客户浏览行为分析的电子商务推荐系统,并分析了该系统的功能,在应用过程中根据已有算法的缺陷提出了一种新的聚类算法,帮助电子商务的经营者改进网站的设计。  相似文献   

6.
聚类算法是数据挖掘的核心技术,基于密度的聚类是一类已经被证明非常有效的聚类方法.与DBSCAN算法作比较,文章提出了一种基于密度的聚类算法(Clustering Using Centers and Density,CUCD).该算法是基于中心点以及密度实现的,其核心对象是根据数据分布计算出来的虚拟的点,并且核心对象的代表性随程序的执行次数而提高;经实验验证,该算法具有较好的时间效率和聚类质量.  相似文献   

7.
基于向量空间模型的文档聚类算法研究   总被引:3,自引:0,他引:3  
随着网络信息的迅速增长,文档聚类技术成为了人们研究的热点课题.探讨了几种基于向量空间模型的文档聚类算法,如常见的k—means算法和凝聚层次算法,针对它们的不足提出了改进的BK-means算法和多层CFK-means算法.最后,根据一定的评价标准,得出Bk—means算法是文档聚类算法中较好的算法.  相似文献   

8.
针对煤炭企业采用的基于关联规则的数据挖掘技术存在的不足,文章提出了一种基于时间聚类的加权关联规则挖掘算法,分析了关联规则的基本概念,简要介绍了传统Apriori算法原理,详细介绍了基于时间聚类的加权关联规则挖掘算法原理及实现.实际应用范例表明,与Apriori算法相比,基于时间聚类的加权关联规则挖掘算法具有较高的准确性.  相似文献   

9.
基于均匀网格的自适应密度快速聚类算法   总被引:1,自引:1,他引:0  
提出了一种基于均匀网格的自适应密度快速聚类新算法.首先引入均匀网格和边界网格概念,然后给出了网格均匀度的计算方法和自适应网格划分技术.每次聚类都从均匀度最高的网格开始逐步向周围扩展均匀网格,直到遇到边界网格为止.算法除具有一般网格聚类算法的优点外,还能自适应地发现不同密度的类及其边界,能够有效地识别孤立点并具有较好的扩展性.最后,通过实验验证了该算法的有效性.  相似文献   

10.
交通流高峰期是交通规划、交通控制中一个非常重要的概念.目前高峰期一般是凭经验人为确定的.文章利用模糊c均值聚类方法对交通流高峰期的确定问题进行研究.首先对模糊c均值聚类算法进行简要介绍,然后利用该算法对某城间高速公路交通流数据进行聚类分析,分别确定了该高速公路正、反向交通流的高峰期.结果表明,该算法聚类结果与经验交通流高峰期基本一致.  相似文献   

11.
一种基于向量空间模型的文本聚类方法   总被引:3,自引:0,他引:3  
研究了一种基于向量空间模型的文档聚类方法.提出了一个新的聚类模型,即在传统聚类模型的基础上增加一个文档特征向量调整模块;给出了一个特征评价函数用以进行特征提取;对一种基于相似度的平面划分聚类算法做了一些改进.实验结果表明本文提出的聚类模型是可行的.  相似文献   

12.
分析了K均值聚类算法(K-means)存在的不足和改进遗传算法的全局优化能力,提出一种基于改进遗传算法的文本聚类方法,该方法将原始文档转化成用向量空间模型来描述的文本向量,首先随机产生若干个文档向量作为初始聚类中心形成遗传算法的染色体种群,经过改进遗传算法的选择、交叉、变异进化运算,得到较为优化的K均值聚类算法的初始聚类中心。实验表明该算法文本聚类提高了查准率和查全率,算法的高效性也得到了验证。  相似文献   

13.
文本聚类综述   总被引:1,自引:0,他引:1  
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘、智能搜索引擎、短文本信息处理等领域获得了广泛的应用。本文首先讨论了文本聚类(Text clustering)的应用,然后对文本聚类算法、聚类关键技术进行了综述。  相似文献   

14.
针对传统的文本聚类容易受到噪声影响的问题,提出一个基于词性标注的文本聚类算法。该算法利用词性标注从文本中识别并抽取最能体现文本特征的关键词,再基于所抽取的关键词进行聚类操作。实验发现,相对传统的聚类算法,基于词性标注的文本聚类算法能够有效地提高聚类结果的质量。  相似文献   

15.
聚类和粒度具有天然的相通性,本文探讨了基于粒度聚类算法的一般框架,并基于该框架,研究了一种基于网格密度的文本聚类算法,最后以例证说明这一方法的可行性。  相似文献   

16.
随着SOA迅猛发展和互联网上服务数量俱增,服务发现成为极具挑战性的工作。传统的服务发现方法在语义稀疏情境下精准度不高,主要是缺乏有效信息对发现工作的支持,无法对服务进行准确的类别划分。针对此问题,提出一种基于BTM面向Web服务短文本描述的服务聚类方法S3C,该方法的主要思想是利用BTM在短文本聚类过程中使用Biterm(词对)优势对服务描述进行潜在特征表示,基于服务潜在特征使用Kmeans聚类方法进行服务聚类。BTM采用词对的主题建模方式,能够极大程度地扩展文本信息,解决短文本中的关键词稀疏问题。采用PWeb数据集进行大量对比实验可知,该方法与经典聚类方法相比,类簇的平均纯度提高30%,平均熵降低近50%。  相似文献   

17.
基于主题概念空间的文本模糊c-均值聚类方法   总被引:2,自引:0,他引:2  
为了改善文本聚类的准确度,提出用基于主题概念子空间的模糊c-均值聚类(TCS2FCM)方法来分类文本.采用5个评估函数的加权值来提取关键短语;利用WordNet对相应的关键短语提取概念短语并生成最后的类别描述.初始中心和初始隶属度矩阵的建立是决定模糊c-均值聚类效果的关键,使用能够代表文本主题的概念短语来建立相互正交的主题概念子空间,利用主题子空间中的概念向量来初始化聚类中心和隶属度矩阵.实验结果表明:不同于传统模糊c-均值聚类的随机化初始,与文本内容相关的初始化有助于改进最后的聚类结果,提高聚类精度.  相似文献   

18.
在传统聚类模型的基础上,提出一种基于向量空间模型的层次聚类算法,用于文本数据的挖掘。实验结果表明,基于向量空间模型的层次聚类算法从挖掘的准确率上更具有性能优势。  相似文献   

19.
数据挖掘中聚类方法比较研究   总被引:4,自引:0,他引:4  
聚类是数据挖掘领域中的一个重要研究课题。聚类在电子商务、图像处理、模式识别、本分类等领域有广泛的应用。本首先建立了数据挖掘中聚类方法的比较标准,然后从基于优化、关系、变换这样一个新的角度对聚类方法进行了分类和比较,最后对数据挖掘中常用聚类算法进行了分析,以便于人们更易于选择研究方向和选择适合于具体问题的聚类算法。  相似文献   

20.
This paper proposes a learning-based method for text detection and text segmentation in natural scene images. First, the input image is decomposed into multiple connected-components (CCs) by Niblack clustering algorithm. Then all the CCs including text CCs and non-text CCs are verified on their text features by a 2-stage classification module, where most non-text CCs are discarded by an attentional cascade classifier and remaining CCs are further verified by an SVM. All the accepted CCs are output to result in text only binary image. Experiments with many images in different scenes showed satisfactory performance of our proposed method.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号