首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
线上购物相对线下购物的一个特点是可以将用户的购物过程记录到网站的Web日志中,为研究用户网上行为特征提供必要的数据支持.本文详细介绍了对Web日志数据进行预处理的一系列步骤和方法,并以某出版社网站18天的日志数据为实证,提取出用户的访问路径(访问页面的先后次序),分析路径信息得到用户在不同页面之间访问的转换概率,从而定量地衡量购物流程中各步骤之间的转换率和贡献率,提炼出用户最有可能的前向转换路径和后向转换路径,以期对网站流程优化和商品促销设置提供决策支持.  相似文献   

2.
Web日志挖掘数据预处理方法研究     总被引:1,自引:0,他引:1  
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。  相似文献   

3.
提出一种多粒度的用户行为数据收集方法,该方法以可配置的插件形式嵌入服务器端收集数据。实验证明,该方法能提高Web使用挖掘的数据质量,简化Web使用挖掘预处理工作,并为后续挖掘工作提供多种粒度的信息,从而为分析Web用户的行为提供优质数据源。  相似文献   

4.
文章基于多源数据融合、用户画像、阅读推广之间的相互关系,以用户画像为中介变量,分析多源数据融合对公共图书馆智慧化阅读推广的影响,结果发现:用户信息数据融合与用户交互数据融合的影响路径是用户行为画像,资源内容数据融合和资源流通数据融合的影响路径是用户资源画像,在馆位置数据融合和在网板块数据融合的影响路径是用户空间画像。  相似文献   

5.
Web使用挖掘是利用数据挖掘技术从Web数据中发现用户使用模式的过程。以Web使用挖掘技术为基础,提出了一种个性化服务推荐模型。分析了Web使用挖掘的数据收集、数据预处理、模式发现及分析、个性化服务引擎等过程,并对各过程的个性化服务的实现进行了阐述,还对个性化服务的发展进行了展望。  相似文献   

6.
文章通过对个性化推荐和数据建模理论研究,分析了普通的Web日志格式采集到的数据无法满足个性化用户分析、预测和推荐精度需要的局限性。提出定制Web日志数据建模的过程及方法,建立了定制Web日志模型原型。通过应用数据挖掘技术的关联分析、分类和聚类实验,实验结果表明,通过定制Web日志的方式采集的数据质量能够很好地满足发现关联规则、内容分类和用户聚类的需求,从而提高个性化推荐的精度。同时,定制的Web日志数据还具有简化数据预处理、多用途的优点。  相似文献   

7.
现有的Web用户访问路径信息发现方法大都着眼于从静态的Web日志快照中进行挖掘.本文力图从Web访问数据的历史演变过程中,发现新的知识--持久偏爱的Web用户访问路径PP-WAP.PP-WAP实际上是历史访问序列WAS中大部分时间支持度值波动很小且保持较高的访问路径信息.本文首先介绍了相关背景和PP-WAP的应用领域.接下来,利用无序树结构来表示历史WAS集合,同时给出了PP-WAP的定义和挖掘算法描述.最后,分别针对模拟和实际数据集对算法的可扩展性以及PP-WAP的应用价值作了实验分析.  相似文献   

8.
基于序列模式的个性化Web页面推荐模型*   总被引:1,自引:1,他引:0  
基于数据挖掘中的序列模式方法,提出一种个性化Web页面推荐模型。该模型首先利用Web使用数据预处理提取Web交易事务集,然后应用序列模式算法挖掘频繁(连续)序列,最后通过构建频繁(连续)序列树生成用户偏好视图以生成个性化Web页面推荐集。  相似文献   

9.
XML在图书查询系统中的实现技术*   总被引:3,自引:0,他引:3  
从XML的DTD入手,借助Petri网工具,提出Petri网与关系数据库相结合的XML图书查询系统实现技术。此技术既保留有XML中路径表达式结构清晰的特色,同时又能加快XML的查询速度。  相似文献   

10.
王一博  张鹏翼 《图书馆建设》2024,(1):121-130+145
融合图书馆用户数据、Web图书数据的新型高校图书馆书目系统分为数据准备和数据清洗、数据规范和数据集成、数据分析和结果呈现三个模块;用户数据源来自北京大学图书馆数据资源服务中心的用户及其行为数据和馆藏资源及其使用数据,Web数据源包括豆瓣读书数据、当当图书数据、京东图书数据以及中国知网引文数据;数据处理方法包括数据清洗、数据规范和数据集成;系统实现的三个关键技术为融合用户数据及内容的图书推荐方法、豆瓣读书笔记的摘要和关键词生成方法以及情感分析方法。该书目系统聚焦于解决书目信息单一的问题,通过集成和分析图书馆用户数据和Web图书数据,丰富书目信息的内容,为下一代图书馆书目系统的设计与实现提供了参考。  相似文献   

11.
吕艳丽 《图书馆学刊》2006,28(4):135-137
Web使用挖掘过程包括数据预处理、模式发现和模式分析;利用Webalizer和Webtrends等Web使用分析工具可以对用户模式进行分析,为建立个性化系统提供依据;国内外典型的个性化系统平台为图书馆的个性化系统提供较好的范例。  相似文献   

12.
搜索引擎日志记录了用户与系统交互的整个过程。对日志文件进行挖掘,可以发现用户进行Web搜索的行为特征与规律,有效改善搜索引擎系统的性能。在对国内外相关研究进行系统梳理和总结的基础上,文章提出了一个Web搜索引擎日志挖掘的研究框架,主要包括日志挖掘的研究内容、数据集的选择方法、数据预处理的方法、不同地域用户行为的特征与比较、如何应用于系统性能的改善等内容。  相似文献   

13.
校园SNS照进现实——以校内网的人际传播模式为例SNS是Web2.0应用的典型模式之一,而人际传播是SNS最主要的传播形态。文章以校内网注册用户为研究对象,通过对两所高校的校内网用户网络调查搜集的多项数据,结合7W传播模式,从传者、内容、媒介、受者、效果、  相似文献   

14.
自美国ARPANET网络的起步和挪威采用TCP/IP协议经SANNET接入Internet开始,网络从Web1.0(互联网)→Web2.0(社区网)→Web3.0(语义网)→Web4.0(泛在网)以加速度的方式发展,而目前我们处于语义网向泛在网发展阶段,如图1所示:在该阶段,在异构资源之间、异地用户之间以及用户  相似文献   

15.
Web 用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等 信息,目前已经成为web 挖掘领域的一个研究热点。文章首先给出Web 访问模式挖掘系统的一般框架模型,然后介绍了 框架模型中主要组成部分的工作原理,在此基础上,对Web 访问模式挖掘系统中的一些关键技术的最新研究进展状况作 了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作 了展望。  相似文献   

16.
Web用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等信息,目前已经成为web挖掘领域的一个研究热点.文章首先给出Web访问模式挖掘系统的一般框架模型,然后介绍了框架模型中主要组成部分的工作原理,在此基础上,对Web访问模式挖掘系统中的一些关键技术的最新研究进展状况作了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作了展望.  相似文献   

17.
从Web1.0到Web2.0,用户有了“质”的转变,由被动方变为主动方。Web2.0为用户提供了一个交互平台,在这种平台环境下则提出了“如何进行用户关系建构”这个话题。通过对Web1.0和Web2.0进行对比分析,并运用“互联网思维”这个概念,对如何在Web2.0环境下进行用户关系建构进行研究,试图构建Web2.0环境下用户关系建构的路径,为传统企业和新兴企业提供发展方向。  相似文献   

18.
基于高校图书馆Web日志挖掘的分析与研究   总被引:1,自引:0,他引:1  
以长江大学图书馆主页服务器Web日志文件为例,介绍了Web日志分析流程、Web日志格式,分析了Web日志挖掘的数据预处理过程,最后给出了应用实例。  相似文献   

19.
王仁武  袁毅 《图书馆论坛》2011,31(4):100-102
用户访问行为信息记录在Web日志中,通过对海量Web日志进行清洗、抽取和加载来构建用户行为数据仓库,并结合文章所提出的用户访问路径概率矩阵模型进行数据挖掘,可以实现智能化的用户行为监控,可以为用户提供及时优质的信息服务。  相似文献   

20.
基于WEB日志挖掘的网站个性化服务研究   总被引:1,自引:0,他引:1  
论述了基于Web日志挖掘的网站个性化服务,提出了利用Web日志挖掘的个性化服务中频繁访问路径的挖掘及用户聚类和页面聚类。利用这些算法推动Web站点从“站点为中心”向“用户为中心”的发展,即站点不但要针对用户共同感兴趣的信息服务,更要有针对每个用户的个性化服务。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号