首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
Web日志挖掘数据预处理方法研究     总被引:1,自引:0,他引:1  
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。  相似文献   

2.
北京大学图书馆的主页日志分析   总被引:2,自引:0,他引:2  
从分析主页服务器日志的重要性出发,论述了日志分析在图书馆中进行用户分析、主页设计和获得用户反馈等方面的实际价值,并介绍了一次主页日志的分析过程,同时指出了利用日志分析的局限性。  相似文献   

3.
吕娜 《图书情报工作》2007,51(5):138-141
数字图书馆网站服务系统中存有大量有关用户访问信息的日志文件,通过对这些日志文件的挖掘可以得到有关数字图书馆资源利用情况和用户兴趣的信息。但实际上,这些日志文件很少被利用。针对这一现状,作者对日志文件进行挖掘试验分析,得出用户的频繁下载集合,以用于推荐链接和评价数据库资源。  相似文献   

4.
按照标准的服务器日志格式,对图书馆Web服务器日志文件的记录进行分析,并通过对其一定时间段的数据挖掘,对图书馆网站的使用状况进行了有益的探讨。  相似文献   

5.
线上购物相对线下购物的一个特点是可以将用户的购物过程记录到网站的Web日志中,为研究用户网上行为特征提供必要的数据支持.本文详细介绍了对Web日志数据进行预处理的一系列步骤和方法,并以某出版社网站18天的日志数据为实证,提取出用户的访问路径(访问页面的先后次序),分析路径信息得到用户在不同页面之间访问的转换概率,从而定量地衡量购物流程中各步骤之间的转换率和贡献率,提炼出用户最有可能的前向转换路径和后向转换路径,以期对网站流程优化和商品促销设置提供决策支持.  相似文献   

6.
书目查询日志信息点击流维度建模   总被引:1,自引:0,他引:1  
随着网络化、信息化进程不断深入,能够体现用户意愿的网站日志信息受到重视。本文基于图书馆网上书目查询日志信息对其进行预处理、建立点击流维度数据模型,为建立数据仓库和进行数据挖掘提供数据,从而了解用户通过书目检索对图书需求的信息。  相似文献   

7.
本文使用WebTrends对三大类型图书馆网站的Web日志文件进行处理,通过提取用户信息行为的量化指标,比较分析了三大类型图书馆用户信息行为的异同,得出了一些重要结论。  相似文献   

8.
本文介绍了网站群技术发展状况,对现有网站群技术进行了研究,阐述了基于置标语言和组件技术内容管理系统进行集成的站群管理系统,设计了某网站群系统体系结构,实现了西安交通大学网站群系统.并利用网站群系统建设西安交通大学二级单位网站。  相似文献   

9.
企业邮件系统中每天都要产生大量的日志,通过对日志的分析能够获取用户、设备甚至是潜在安全风险等信息,由于日志量大,采用传统的日志分析方法已难以满足企业需求。随着Hadoop平台技术的成熟,通过大数据技术能够实现对大数据量日志的分析。本文以邮件系统中用户访问日志为例,通过Hadoop平台的构建,使用Hive实现了对该日志的分析,有助于发现邮件系统中潜在的安全风险,保障系统的稳定运行。  相似文献   

10.
数字图书馆用户使用信息挖掘与应用   总被引:5,自引:0,他引:5  
用户信息收集是用户研究中最基础同时也是最重要的环节。数字图书馆有关记录用户活动和行为的日志文件、用户profile和用户调查信息统称为用户使用信息.对这些信息进行挖掘的技术主要是WEB使用挖掘。在数字图书馆中应用WEB使用挖掘可以改善网站可用性,提供个性化服务,进行资源评价与采编,进行数字图书馆系统评价和界面设计。  相似文献   

11.
Web挖掘技术在电子商务中的应用研究   总被引:16,自引:0,他引:16  
刘培刚 《情报学报》2002,21(6):680-685
本文基于国内外最新研究成果对电子商务中应用的Web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题 ,给出了基于Web日志的客户群体聚类算法及Web页面聚类算法。利用这些Web挖掘技术可有效挖掘用户个性特征 ,从而指导电子商务网站资源的组织和分配。  相似文献   

12.
基于OPAC日志用户行为分析方法可以较准确地了解用户需求及其需求的满足情况。而基于OPAC日志用户行为分析的图书采购方法是一种以用户需求为导向、大数据驱动的新方法。它能够及时发现短缺书,提高馆藏有效覆盖率;按需确定复本数量,提高借阅需求满足率。通过对该方法的实践发现,与传统图书采购方法相比,该方法具有更多优势,如准确、精细、高效,能更好地满足读者的需求。  相似文献   

13.
采用数据挖掘技术中的关联分析和聚类方法,重点研究Web日志兴趣发现的理论和方法,指出普通日志记录方法的局限性,提出过滤用户偏好的定制Web日志方法,实验结果验证通过该方法采集的数据,可以发现隐藏在日志数据中的关联规则,同时找到相似用户的兴趣和偏好,并且能够提高过滤用户兴趣偏好的精度。  相似文献   

14.
近几年,电商市场蓬勃发展.成功的电商网站拥有良好的用户体验.除了网站界面美感,用户体验和情感度也在不断被提起.本文将以淘宝网站为例,分析影响电商购物网站用户体验的因素.对电商网站设计元素进行分析,梳理用户体验设计的特征,总结出电商网站的设计规律.通过分析用户体验设计,提高网站用户转化率,达到网站视觉界面和用户情感高度结合,实现商业价值与用户需求的平衡.  相似文献   

15.
在分析档案网站用户体验含义和内容、重要性的基础上,从感官体验、交互体验、情感体验、浏览体验和信任体验五个维度构建档案网站用户体验二级指标体系,并对每个档案网站用户体验指标体系具体考察内容进行说明.  相似文献   

16.
数据挖掘技术在电子商务中的应用研究   总被引:1,自引:0,他引:1  
本文基于国内外最新研究成果对电子商务中应用的web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题,给出了基于web日志的客户群体聚类算法及web页面聚类算法。利用这些web挖掘技术可有效挖掘用户个性特征,从而指导电子商务网站资源的组织和分配。  相似文献   

17.
搜索引擎日志记录了用户与系统交互的整个过程。对日志文件进行挖掘,可以发现用户进行Web搜索的行为特征与规律,有效改善搜索引擎系统的性能。在对国内外相关研究进行系统梳理和总结的基础上,文章提出了一个Web搜索引擎日志挖掘的研究框架,主要包括日志挖掘的研究内容、数据集的选择方法、数据预处理的方法、不同地域用户行为的特征与比较、如何应用于系统性能的改善等内容。  相似文献   

18.
图书馆服务流程与用户满意之间存在着直接的联系。如果服务流程存在不足,将引发用户的不满意。传统的图书馆用户满意分析,多是采用调查的方式,未能充分挖掘利用图书馆服务流程日志。流程挖掘是对事件日志的挖掘,其典型应用场景可以用于流程分析与诊断,进而在流程分析的基础上实现对图书馆用户满意的分析。在构建基于流程挖掘的用户满意分析模型之后,还对该模型实现的三个核心环节进行了研究:生成事件日志、选择挖掘算法、分析用户满意,并给了一个所提方法的简单示例。  相似文献   

19.
在网站信息传递中,网站表现模型与用户心智模型保持一致,是提高信息使用效率的关键.本文通过对符号表征理论的分析理解,认为心智模型形成是符号表征的结果,并以电子商务网站分类为例,探索了信息传递中用户基于心智模型对网站表现模型理解使用的内在机制,最后进行了易趣网分类搜索实验.结果表明心智模型与网站分类表现模型比较一致的一类用户,其表现出较高的搜索效率.  相似文献   

20.
认为移动搜索用户行为特征与规律的发现,对移动搜索服务的改进具有重要的参考价值。基于国内某大型学术类网站一批包含300余万条有效记录的日志数据,分析查询串、搜索时间的分布、搜索会话、移动搜索设备终端等我国移动搜索用户行为的基本特征指标。研究结果显示:与传统PC搜索相比,移动用户的查询时间分布更均匀,会话更短,使用查询推荐比例更少,移动智能终端设备用户搜索更频繁。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号