共查询到18条相似文献,搜索用时 187 毫秒
1.
数据挖掘技术在电子商务中的应用研究 总被引:1,自引:0,他引:1
本文基于国内外最新研究成果对电子商务中应用的web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题,给出了基于web日志的客户群体聚类算法及web页面聚类算法。利用这些web挖掘技术可有效挖掘用户个性特征,从而指导电子商务网站资源的组织和分配。 相似文献
2.
3.
4.
随着Internet和电子商务的迅猛发展,聚类技术在Web用户划分方面的作用越来越明显.Web用户聚类的难度在于有成千上万的用户需要聚类,而且每个用户的偏好向量是高维稀疏的.对于处理大规模的数据集,近邻传播算法是一种快速、有效的聚类方法.但面对高维稀疏的数据,近邻传播算法往往不能得到很好的聚类结果,而且该方法不能产生指定类数的聚类.本文提出一种改进的近邻传播算法,使用该方法对Web用户进行聚类.根据灰关系等级和Jaccard系数定义用户相似度矩阵,对算法产生的初始聚类进行重新分配,获得指定类数的聚类.实验结果表明新算法是有效的,与原始近邻传播算法相比,新算法在个性化推荐的应用中具有更好的性能. 相似文献
5.
社会化标签系统中基于密度聚类的Web 用户兴趣建模方法 总被引:1,自引:0,他引:1
Web用户兴趣模型在个性化信息服务中有着非常重要的作用。本文利用社会化标签的独特优势,针对传统社会化标签聚类方法的局限性,提出了一种基于密度聚类的Web用户兴趣建模方法。首先建立基于社会化标签的向量空间模型,并将社会化标签表示为Web资源及其权重的形式,以此为基础利用DBSCAN算法对其进行聚类,进而依据所有Web用户的标注行为以每个聚类为中介计算特定Web用户对Web资源的兴趣度来构建Web用户兴趣模型。实验结果表明了该方法的优越性。 相似文献
6.
7.
用户兴趣模型是个性化服务的核心,对用户兴趣的挖掘可以发现潜在的兴趣知识,提供更为优化的服务.本文将主题图技术与用户兴趣模型结合起来,研究了用户兴趣知识的主题图表示,并在此基础上运用无尺度图K-中心点聚类算法对构建的主题图进行深层次的聚类挖掘,建立了基于主题图的用户兴趣挖掘模型.在解释模型各个模块功能的同时,提出了该过程模型中的关键问题,并对建立模型过程中的无尺度图K-中心点聚类算法、文档中的主题图表示及主题概化和主题图合并等关键问题进行了深入的分析,最终构建了智能主题图,实现了过程建模和事物建模. 相似文献
8.
9.
一种基于后缀树的Web搜索结果聚类方法 总被引:3,自引:2,他引:1
为同时满足Web搜索结果聚类的关联性、快速性以及类别描述的可浏览性等需求,本文提出了一种适合中文Web信息搜索结果的后缀树聚类算法,其中后缀树的构建以中文汉字为基本单位,一种有效的策略解决了基于二进制方法合并短语类后的类别描述问题,利用短语类语义层面的相似性合并同义短语类,有效地改善了聚类结果的质量.测试结果表明:与传统的文档聚类算法相比,基于后缀树的算法在Web文档聚类的精度和效率方面具有较强的优越性. 相似文献
10.
11.
12.
通过挖掘网络日志中的查询词语义关系,将《知网》的语义知识加入到聚类算法中实现搜索引擎优化。该方法通过机器学习算法深入挖掘查询日志,对其中的查询串进行概念相似度、语义聚类等计算,使返回网页更加合理,将更准确的网页结果呈现在用户面前,能够更好地满足用户需求。 相似文献
13.
Web内容挖掘在数字图书馆中的应用 总被引:3,自引:1,他引:3
Web信息是数字图书馆数字资源的重要来源,文章详细阐述了对Web内容中的文本信息的挖掘,包括:文本自动摘要、文本分类和文本聚类。在挖掘过程中基于用户需求和用户特征,针对文本分类,重点分析了分类过程和在数字图书馆中的应用;针对文本聚类,介绍两种基本聚类原理以及与文本分类的不同之处,重点论述其在数字图书馆中如何应用。最后提出内容挖掘与用户挖掘的结合更有助于服务用户。 相似文献
14.
互联网应用和信息技术在教育领域的高速发展,使得人们不再局限于传统的教室学习,数字图书馆和基于Web与多媒体技术的远程教育模式得到了迅速推广。建立反映学习状况水平的个性化学习网站对于远程教育有着重要意义,是一个新的研究领域。本文将模糊理论运用到远程教育网站的服务模型中,使网站具有自我调整的功能,能够为学生提供一个良好的学习平台。文中提出了一种自调整的远程教育网站的体系结构和改进的CA算法。 相似文献
15.
网络数据挖掘及其在面向Web的知识检索中的应用 总被引:6,自引:1,他引:5
介绍了网络数据挖掘的含义和相关技术,并着重介绍了网络数据挖掘方法在面向Web的知识检索中的应用:通过对信息源内容与结构的挖掘,对用户访问记录的挖掘,对专家访问的挖掘,发现隐藏在网络数据流背后的知识关联和知识,形成特定知识库,支持知识检索。 相似文献
16.
Web信息主题采集技术研究 总被引:9,自引:0,他引:9
简单介绍主题信息采集系统;从5个方面对其核心技术进行深入研究,包括种子页面生成、主题表示、相关度计算策略、爬行策略以及结束搜索策略等;详细讨论种子页面生成的人工方式、自动方式及混合方式,基于关键词的主题表示与基于Ontology的主题表示,多种相关度计算启发式策略比较,基本爬行策略与隧道技术以及结束爬行的多种情形等;在分析相关技术的算法、特点与应用情况的同时,针对主题信息采集特点提出相应的改进意见。 相似文献
17.
指出Web挖掘是从数据挖掘发展而来,是集合Web技术、数据挖掘、信息科学等多领域为一体的一项综合技术;介绍Web挖掘的概念、分类以及Web页面之间链接结构挖掘的HITS与Page-rank等算法;提出基于样本模式特征提取的信息检索方法。最后,分析Web链接挖掘面临的问题和未来研究的发展趋势。 相似文献
18.
采用数据挖掘技术中的关联分析和聚类方法,重点研究Web日志兴趣发现的理论和方法,指出普通日志记录方法的局限性,提出过滤用户偏好的定制Web日志方法,实验结果验证通过该方法采集的数据,可以发现隐藏在日志数据中的关联规则,同时找到相似用户的兴趣和偏好,并且能够提高过滤用户兴趣偏好的精度。 相似文献