首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
搜索引擎日志记录了用户与系统交互的整个过程。对日志文件进行挖掘,可以发现用户进行Web搜索的行为特征与规律,有效改善搜索引擎系统的性能。在对国内外相关研究进行系统梳理和总结的基础上,文章提出了一个Web搜索引擎日志挖掘的研究框架,主要包括日志挖掘的研究内容、数据集的选择方法、数据预处理的方法、不同地域用户行为的特征与比较、如何应用于系统性能的改善等内容。  相似文献   

2.
Web日志挖掘数据预处理方法研究     总被引:1,自引:0,他引:1  
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。  相似文献   

3.
基于高校图书馆Web日志挖掘的分析与研究   总被引:1,自引:0,他引:1  
以长江大学图书馆主页服务器Web日志文件为例,介绍了Web日志分析流程、Web日志格式,分析了Web日志挖掘的数据预处理过程,最后给出了应用实例。  相似文献   

4.
图书馆服务流程与用户满意之间存在着直接的联系。如果服务流程存在不足,将引发用户的不满意。传统的图书馆用户满意分析,多是采用调查的方式,未能充分挖掘利用图书馆服务流程日志。流程挖掘是对事件日志的挖掘,其典型应用场景可以用于流程分析与诊断,进而在流程分析的基础上实现对图书馆用户满意的分析。在构建基于流程挖掘的用户满意分析模型之后,还对该模型实现的三个核心环节进行了研究:生成事件日志、选择挖掘算法、分析用户满意,并给了一个所提方法的简单示例。  相似文献   

5.
基于SQL Server 2005的Web日志挖掘系统构建   总被引:6,自引:0,他引:6  
分析Web日志挖掘在图书馆中的应用,提出一种利用SQL Server 2005数据挖掘平台构建日志挖掘系统的方法,详细介绍系统主要组件的功能和实现方法,并给出相应的系统框架设计图,最后论述此设计的优点。  相似文献   

6.
吕娜 《图书情报工作》2007,51(5):138-141
数字图书馆网站服务系统中存有大量有关用户访问信息的日志文件,通过对这些日志文件的挖掘可以得到有关数字图书馆资源利用情况和用户兴趣的信息。但实际上,这些日志文件很少被利用。针对这一现状,作者对日志文件进行挖掘试验分析,得出用户的频繁下载集合,以用于推荐链接和评价数据库资源。  相似文献   

7.
基于XML的Web日志挖掘研究*   总被引:2,自引:0,他引:2  
设计一个基于XML的Web日志挖掘体系结构,简要介绍XGMML和LOGML,并在此基础上讨论LOGML文档的生成方法及利用Apriori算法对日志文档进行频繁集、频繁序列和频繁子图挖掘。  相似文献   

8.
基于WEB日志挖掘的网站个性化服务研究   总被引:1,自引:0,他引:1  
论述了基于Web日志挖掘的网站个性化服务,提出了利用Web日志挖掘的个性化服务中频繁访问路径的挖掘及用户聚类和页面聚类。利用这些算法推动Web站点从“站点为中心”向“用户为中心”的发展,即站点不但要针对用户共同感兴趣的信息服务,更要有针对每个用户的个性化服务。  相似文献   

9.
基于马尔可夫转移矩阵的多步过程挖掘方法   总被引:1,自引:0,他引:1  
李燕 《信息系统工程》2013,(2):37-40,26
针对目前过程挖掘算法对过程日志要求较高,且挖掘结果只能用特定形式化描述模型进行表示,提出一种基于马尔可夫转移矩阵的多步过程挖掘方法。首先基于日志构建马尔可夫转移矩阵,其次定义关系挖掘规则分析过程中的逻辑关系,接着设计过程挖掘算法建立活动间的结构关系,而后给出一种形式化表示算法将挖掘结果表示成有向网络图,最后通过仿真验证方法的可行性。  相似文献   

10.
按照标准的服务器日志格式,对图书馆Web服务器日志文件的记录进行分析,并通过对其一定时间段的数据挖掘,对图书馆网站的使用状况进行了有益的探讨。  相似文献   

11.
文章通过对个性化推荐和数据建模理论研究,分析了普通的Web日志格式采集到的数据无法满足个性化用户分析、预测和推荐精度需要的局限性。提出定制Web日志数据建模的过程及方法,建立了定制Web日志模型原型。通过应用数据挖掘技术的关联分析、分类和聚类实验,实验结果表明,通过定制Web日志的方式采集的数据质量能够很好地满足发现关联规则、内容分类和用户聚类的需求,从而提高个性化推荐的精度。同时,定制的Web日志数据还具有简化数据预处理、多用途的优点。  相似文献   

12.
Web 用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等 信息,目前已经成为web 挖掘领域的一个研究热点。文章首先给出Web 访问模式挖掘系统的一般框架模型,然后介绍了 框架模型中主要组成部分的工作原理,在此基础上,对Web 访问模式挖掘系统中的一些关键技术的最新研究进展状况作 了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作 了展望。  相似文献   

13.
阮光册 《图书情报工作》2011,55(11):121-124
网络用户行为研究大多采用Web用户日志挖掘,首先介绍Web关联规则应用的传统方法,并指出传统方法中忽略了用户兴趣这一因素研究,更多的是以网页高频出现为挖掘结果进行聚类。针对这一问题,提出一种基于Web关联规则挖掘、页面内容和会话相似度相结合的研究方法,聚类出用户频繁访问的页面组,以发现网络用户行为的规律。在案例应用中,以上海某高校学生网络行为研究为例,得出相关结论。  相似文献   

14.
Web挖掘在网络教育中的应用研究   总被引:1,自引:0,他引:1  
文章讨论了将Web挖掘应用在网络教育中的必要性,以及Web内容挖掘、Web结构挖掘和Web使用挖掘在网络教育中的应用。  相似文献   

15.
Web数据挖掘对Web数据检索的支持作用   总被引:3,自引:0,他引:3  
唐建国  胡芒谷 《情报学报》2004,23(4):452-455
本文在对Web数据检索和Web数据挖掘的技术特性进行简要介绍的基础上 ,阐述了二者之间的主要区别 ,并着重对Web数据挖掘对Web数据检索构成的支持作用进行了具体分析。这些支持作用体现在 :自动分类 ,揭示知识特征 ,群集处理 ,超链结构挖掘和用户知识模型挖掘。  相似文献   

16.
指出Web挖掘是从数据挖掘发展而来,是集合Web技术、数据挖掘、信息科学等多领域为一体的一项综合技术;介绍Web挖掘的概念、分类以及Web页面之间链接结构挖掘的HITS与Page-rank等算法;提出基于样本模式特征提取的信息检索方法。最后,分析Web链接挖掘面临的问题和未来研究的发展趋势。  相似文献   

17.
基于领域本体实现Web文本挖掘研究   总被引:1,自引:0,他引:1  
阮光册 《图书情报工作》2011,55(18):116-120
为弥补改进传统Web文本挖掘方法缺乏对文本语义理解的不足,采用本体与Web文本挖掘相结合的方法,探讨基于领域本体的Web文本挖掘方法。首先创建Web文本的本体结构,然后引入领域本体“概念-概念”相似度矩阵,并就概念间关系识别进行描述,最后给出Web文本挖掘的实现方法,发现Web文本信息的内涵。实验中以网络媒体报道为例,通过文本挖掘得出相关结论。  相似文献   

18.
北京大学图书馆的主页日志分析   总被引:2,自引:0,他引:2  
从分析主页服务器日志的重要性出发,论述了日志分析在图书馆中进行用户分析、主页设计和获得用户反馈等方面的实际价值,并介绍了一次主页日志的分析过程,同时指出了利用日志分析的局限性。  相似文献   

19.
对影响Web使用挖掘效果的会话识别方法进行理论研究,将会话识别按照对用户行为的不同假设分为基于时间的、基于导航的和基于语义的三种启发式方法,并对每种方法又进行细分研究,对会话识别理论方法进行综述,讨论这三种方法的各自优点和存在的问题。在对会话识别的方法进行综合比较的基础上,指出会话识别方法研究的两个趋势,一个是表示Web日志访问请求所代表的语义,一个是分析用户行为。  相似文献   

20.
基于Web挖掘技术的信息检索系统设计与实现   总被引:2,自引:0,他引:2  
王艳  张帆 《情报学报》2007,26(3):339-343
本文详细介绍一个基于Web文本挖掘技术的信息检索系统的设计与实现。基于Web文本挖掘技术的信息检索技术融合了文本挖掘的思想,它将单一的资源发现或者单一的信息提取的传统的信息检索方法结合起来,从而达到在WWW发现资源并将其中的信息提取出来进行处理的目的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号