共查询到17条相似文献,搜索用时 409 毫秒
1.
采用数据挖掘技术中的关联分析和聚类方法,重点研究Web日志兴趣发现的理论和方法,指出普通日志记录方法的局限性,提出过滤用户偏好的定制Web日志方法,实验结果验证通过该方法采集的数据,可以发现隐藏在日志数据中的关联规则,同时找到相似用户的兴趣和偏好,并且能够提高过滤用户兴趣偏好的精度。 相似文献
2.
信息检索系统通过定制日志采集数据的方式,可以发现用户访问行为的特征及需求信息。重点研究信息检索系统中适用的定制日志建模理论和方法,通过业务建模、概念建模、逻辑建模和物理建模方法,发现建模过程中的规律和特点,通过在NSTL嵌入式系统中的实验,验证所提出的方法。 相似文献
3.
4.
5.
针对传统的Markov链模型不能有效的表征长串访问序列所蕴含的丰富的用户行为特征(用户类别特征、访问兴趣迁移特征)的缺点,提出混合隐Markov链浏览模型.混合隐Markov链模型使用多个不同的模型来区分不同类别用户的浏览特征,并为每个类别的用户设置了能跟踪捕捉其访问兴趣变化的类隐Markov链模型,能更好地对WWW长串访问序列的复杂特征进行建模,在真实WWW站点访问日志数据上的用户聚类实验与个性化推荐实验的结果表明,混合隐Markov链模型与传统的Markov链模型相比,具有更理想的聚类性能和推荐性能. 相似文献
6.
Web挖掘技术在电子商务中的应用研究 总被引:16,自引:0,他引:16
本文基于国内外最新研究成果对电子商务中应用的Web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题 ,给出了基于Web日志的客户群体聚类算法及Web页面聚类算法。利用这些Web挖掘技术可有效挖掘用户个性特征 ,从而指导电子商务网站资源的组织和分配。 相似文献
7.
基于用户访问网页的不同序列反映了用户特定的兴趣,提出了Web日志中用户存取模式的聚类算法。利用传统的Leader算法只扫描数据集一遍的优点,以及粗糙理论在处理含有不确定信息问题上的优势,给出了结合粗糙理论的改进Leader算法对用户存取模式进行聚类方法,使得同一类中的用户存取模式尽可能的相近或相似,不同类中的模式尽可能的相异。实验结果表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效聚类。 相似文献
8.
随着Internet和电子商务的迅猛发展,聚类技术在Web用户划分方面的作用越来越明显.Web用户聚类的难度在于有成千上万的用户需要聚类,而且每个用户的偏好向量是高维稀疏的.对于处理大规模的数据集,近邻传播算法是一种快速、有效的聚类方法.但面对高维稀疏的数据,近邻传播算法往往不能得到很好的聚类结果,而且该方法不能产生指定类数的聚类.本文提出一种改进的近邻传播算法,使用该方法对Web用户进行聚类.根据灰关系等级和Jaccard系数定义用户相似度矩阵,对算法产生的初始聚类进行重新分配,获得指定类数的聚类.实验结果表明新算法是有效的,与原始近邻传播算法相比,新算法在个性化推荐的应用中具有更好的性能. 相似文献
9.
Web日志挖掘数据预处理方法研究
总被引:1,自引:0,他引:1
柳胜国 《现代图书情报技术》2004,20(12):55-57
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。 相似文献
10.
社会化标签系统中基于密度聚类的Web 用户兴趣建模方法 总被引:1,自引:0,他引:1
Web用户兴趣模型在个性化信息服务中有着非常重要的作用。本文利用社会化标签的独特优势,针对传统社会化标签聚类方法的局限性,提出了一种基于密度聚类的Web用户兴趣建模方法。首先建立基于社会化标签的向量空间模型,并将社会化标签表示为Web资源及其权重的形式,以此为基础利用DBSCAN算法对其进行聚类,进而依据所有Web用户的标注行为以每个聚类为中介计算特定Web用户对Web资源的兴趣度来构建Web用户兴趣模型。实验结果表明了该方法的优越性。 相似文献
11.
基于C/S的新一代智能化、个性化搜索引擎 总被引:3,自引:0,他引:3
本文探讨一个基于C/S的新一代智能化、个性化搜索引擎。整个搜索引擎分为客户端和服务器端两大部分。在客户端,智能代理Agent在个性化模型数据库的支持下产生个性化的检索要求,送往服务器。服务器端为了实现个性化服务,利用领域知识库和兴趣库对原始网页数据库进行数据挖掘,聚类形成各个类型的网页索引数据库。本文并给出了用户兴趣模型算法、挖掘用户兴趣关联规则的Apriori算法和K-modes聚类算法。 相似文献
12.
13.
提出基于关联数据技术组织用户需求的设想及其架构——需求语义网络模型,该模型由数据层、需求信息层、应用层组成,需求信息层是整个模型的核心,其构建包括需求信息建模、需求信息命名、需求信息RDF化、需求信息发布、开放查询5个步骤,需求语义网络构建的重点和难点包括用户需求及关系的定义与描述、用户需求的关联与分解、需求网络中各层次之间的协作与交流以及匹配服务器的延伸和扩展等,最后,将需求语义网络理论应用到高校图书馆个性化知识服务中,提出基于关联数据的高校图书馆图书需求语义网络的构建模型。 相似文献
14.
一种基于数据挖掘技术的馆藏资源个性化推荐服务 总被引:2,自引:0,他引:2
本文介绍了一种如何将ID3决策树算法和关联规则应用于馆藏文献信息资源的个性化推荐服务当中去的方法.文中首先对读者借阅历史记录进行了挖掘和分析,利用决策树算法挖掘出可推荐的相关读者对象,再依据关联规则提取借阅历史记录并对其进行分析和挖掘,从中找出相关潜在的有用或有价值的规则,然后依据这些规则选择出最适合推荐的项目推荐给读者.该方式是为实现个性化推荐服务所进行的一种新的探讨,具有算法收敛性好,计算方法简单有效,可靠性高,推荐效果显著等优势,与传统推荐技术相比,能够更加全面、准确、清晰地进行文献推荐.理论和实践结果表明,所提出的这种方法是一种行之有效的形式. 相似文献
15.
基于Web的个性化信息服务机制 总被引:137,自引:1,他引:137
简要分析了个性化信息服务的性质、目标和总体技术要求, 并对个性化定制机制、定制信息共享机制和安全与隐私保护机制进行了初步设计, 对定制过程、数据库体系和定制模板结构等技术细节进行了探讨。 相似文献
16.