共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
Web日志挖掘数据预处理方法研究
总被引:1,自引:0,他引:1
柳胜国 《现代图书情报技术》2004,20(12):55-57
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。 相似文献
3.
提出一种多粒度的用户行为数据收集方法,该方法以可配置的插件形式嵌入服务器端收集数据。实验证明,该方法能提高Web使用挖掘的数据质量,简化Web使用挖掘预处理工作,并为后续挖掘工作提供多种粒度的信息,从而为分析Web用户的行为提供优质数据源。 相似文献
4.
文章基于多源数据融合、用户画像、阅读推广之间的相互关系,以用户画像为中介变量,分析多源数据融合对公共图书馆智慧化阅读推广的影响,结果发现:用户信息数据融合与用户交互数据融合的影响路径是用户行为画像,资源内容数据融合和资源流通数据融合的影响路径是用户资源画像,在馆位置数据融合和在网板块数据融合的影响路径是用户空间画像。 相似文献
5.
Web使用挖掘是利用数据挖掘技术从Web数据中发现用户使用模式的过程。以Web使用挖掘技术为基础,提出了一种个性化服务推荐模型。分析了Web使用挖掘的数据收集、数据预处理、模式发现及分析、个性化服务引擎等过程,并对各过程的个性化服务的实现进行了阐述,还对个性化服务的发展进行了展望。 相似文献
6.
7.
现有的Web用户访问路径信息发现方法大都着眼于从静态的Web日志快照中进行挖掘.本文力图从Web访问数据的历史演变过程中,发现新的知识--持久偏爱的Web用户访问路径PP-WAP.PP-WAP实际上是历史访问序列WAS中大部分时间支持度值波动很小且保持较高的访问路径信息.本文首先介绍了相关背景和PP-WAP的应用领域.接下来,利用无序树结构来表示历史WAS集合,同时给出了PP-WAP的定义和挖掘算法描述.最后,分别针对模拟和实际数据集对算法的可扩展性以及PP-WAP的应用价值作了实验分析. 相似文献
8.
基于序列模式的个性化Web页面推荐模型* 总被引:1,自引:1,他引:0
易明 《现代图书情报技术》2008,24(8):42-47
基于数据挖掘中的序列模式方法,提出一种个性化Web页面推荐模型。该模型首先利用Web使用数据预处理提取Web交易事务集,然后应用序列模式算法挖掘频繁(连续)序列,最后通过构建频繁(连续)序列树生成用户偏好视图以生成个性化Web页面推荐集。 相似文献
9.
XML在图书查询系统中的实现技术* 总被引:3,自引:0,他引:3
从XML的DTD入手,借助Petri网工具,提出Petri网与关系数据库相结合的XML图书查询系统实现技术。此技术既保留有XML中路径表达式结构清晰的特色,同时又能加快XML的查询速度。 相似文献
10.
融合图书馆用户数据、Web图书数据的新型高校图书馆书目系统分为数据准备和数据清洗、数据规范和数据集成、数据分析和结果呈现三个模块;用户数据源来自北京大学图书馆数据资源服务中心的用户及其行为数据和馆藏资源及其使用数据,Web数据源包括豆瓣读书数据、当当图书数据、京东图书数据以及中国知网引文数据;数据处理方法包括数据清洗、数据规范和数据集成;系统实现的三个关键技术为融合用户数据及内容的图书推荐方法、豆瓣读书笔记的摘要和关键词生成方法以及情感分析方法。该书目系统聚焦于解决书目信息单一的问题,通过集成和分析图书馆用户数据和Web图书数据,丰富书目信息的内容,为下一代图书馆书目系统的设计与实现提供了参考。 相似文献
11.
Web使用挖掘过程包括数据预处理、模式发现和模式分析;利用Webalizer和Webtrends等Web使用分析工具可以对用户模式进行分析,为建立个性化系统提供依据;国内外典型的个性化系统平台为图书馆的个性化系统提供较好的范例。 相似文献
12.
13.
14.
自美国ARPANET网络的起步和挪威采用TCP/IP协议经SANNET接入Internet开始,网络从Web1.0(互联网)→Web2.0(社区网)→Web3.0(语义网)→Web4.0(泛在网)以加速度的方式发展,而目前我们处于语义网向泛在网发展阶段,如图1所示:在该阶段,在异构资源之间、异地用户之间以及用户 相似文献
15.
朱志国 《中国科技资源导刊 (中国信息导报)》2011,(3):62-67
Web 用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等
信息,目前已经成为web 挖掘领域的一个研究热点。文章首先给出Web 访问模式挖掘系统的一般框架模型,然后介绍了
框架模型中主要组成部分的工作原理,在此基础上,对Web 访问模式挖掘系统中的一些关键技术的最新研究进展状况作
了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作
了展望。 相似文献
16.
朱志国 《中国科技资源导刊》2011,43(3)
Web用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等信息,目前已经成为web挖掘领域的一个研究热点.文章首先给出Web访问模式挖掘系统的一般框架模型,然后介绍了框架模型中主要组成部分的工作原理,在此基础上,对Web访问模式挖掘系统中的一些关键技术的最新研究进展状况作了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作了展望. 相似文献
17.
从Web1.0到Web2.0,用户有了“质”的转变,由被动方变为主动方。Web2.0为用户提供了一个交互平台,在这种平台环境下则提出了“如何进行用户关系建构”这个话题。通过对Web1.0和Web2.0进行对比分析,并运用“互联网思维”这个概念,对如何在Web2.0环境下进行用户关系建构进行研究,试图构建Web2.0环境下用户关系建构的路径,为传统企业和新兴企业提供发展方向。 相似文献
18.
基于高校图书馆Web日志挖掘的分析与研究 总被引:1,自引:0,他引:1
以长江大学图书馆主页服务器Web日志文件为例,介绍了Web日志分析流程、Web日志格式,分析了Web日志挖掘的数据预处理过程,最后给出了应用实例。 相似文献
19.
用户访问行为信息记录在Web日志中,通过对海量Web日志进行清洗、抽取和加载来构建用户行为数据仓库,并结合文章所提出的用户访问路径概率矩阵模型进行数据挖掘,可以实现智能化的用户行为监控,可以为用户提供及时优质的信息服务。 相似文献