期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘颖彭赓吕本富陈杰梅梅《情报学报》2009,28(4)

线上购物相对线下购物的一个特点是可以将用户的购物过程记录到网站的Web日志中,为研究用户网上行为特征提供必要的数据支持.本文详细介绍了对Web日志数据进行预处理的一系列步骤和方法,并以某出版社网站18天的日志数据为实证,提取出用户的访问路径(访问页面的先后次序),分析路径信息得到用户在不同页面之间访问的转换概率,从而定量地衡量购物流程中各步骤之间的转换率和贡献率,提炼出用户最有可能的前向转换路径和后向转换路径,以期对网站流程优化和商品促销设置提供决策支持. 相似文献

2.

Web用户访问模式挖掘系统框架模型研究

朱志国《中国科技资源导刊》2011,43(3)

Web用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等信息,目前已经成为web挖掘领域的一个研究热点.文章首先给出Web访问模式挖掘系统的一般框架模型,然后介绍了框架模型中主要组成部分的工作原理,在此基础上,对Web访问模式挖掘系统中的一些关键技术的最新研究进展状况作了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作了展望. 相似文献

3.

Web 用户访问模式挖掘系统框架模型研究

朱志国《中国科技资源导刊 (中国信息导报)》2011,(3):62-67

Web 用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等信息,目前已经成为web 挖掘领域的一个研究热点。文章首先给出Web 访问模式挖掘系统的一般框架模型,然后介绍了框架模型中主要组成部分的工作原理,在此基础上,对Web 访问模式挖掘系统中的一些关键技术的最新研究进展状况作了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作了展望。相似文献

4.

持久偏爱的Web用户访问路径信息挖掘方法

朱志国邓贵仕《情报学报》2010,29(2)

现有的Web用户访问路径信息发现方法大都着眼于从静态的Web日志快照中进行挖掘.本文力图从Web访问数据的历史演变过程中,发现新的知识--持久偏爱的Web用户访问路径PP-WAP.PP-WAP实际上是历史访问序列WAS中大部分时间支持度值波动很小且保持较高的访问路径信息.本文首先介绍了相关背景和PP-WAP的应用领域.接下来,利用无序树结构来表示历史WAS集合,同时给出了PP-WAP的定义和挖掘算法描述.最后,分别针对模拟和实际数据集对算法的可扩展性以及PP-WAP的应用价值作了实验分析. 相似文献

5.

Web搜索引擎日志挖掘研究框架

王继民李雷明子孟涛《数字图书馆论坛》2011,(8):25-31

搜索引擎日志记录了用户与系统交互的整个过程。对日志文件进行挖掘,可以发现用户进行Web搜索的行为特征与规律,有效改善搜索引擎系统的性能。在对国内外相关研究进行系统梳理和总结的基础上,文章提出了一个Web搜索引擎日志挖掘的研究框架,主要包括日志挖掘的研究内容、数据集的选择方法、数据预处理的方法、不同地域用户行为的特征与比较、如何应用于系统性能的改善等内容。相似文献

6.

基于Web日志的三大类型图书馆用户信息行为比较研究

任立肖《图书情报知识》2006,(6):28-32

本文使用WebTrends对三大类型图书馆网站的Web日志文件进行处理,通过提取用户信息行为的量化指标,比较分析了三大类型图书馆用户信息行为的异同,得出了一些重要结论。相似文献

7.

基于WEB日志挖掘的网站个性化服务研究 总被引：1，自引：0，他引：1

姜美玉卢利平宜建军《图书馆学刊》2006,28(5):137-138

论述了基于Web日志挖掘的网站个性化服务，提出了利用Web日志挖掘的个性化服务中频繁访问路径的挖掘及用户聚类和页面聚类。利用这些算法推动Web站点从“站点为中心”向“用户为中心”的发展，即站点不但要针对用户共同感兴趣的信息服务，更要有针对每个用户的个性化服务。相似文献

8.

基于Petri网的Web日志挖掘路径补充算法

田丹左风朝解振华《信息系统工程》2010,(8):92-93

数据预处理是Web日志挖掘的基础,而路径补充是数据预处理中一个关键环节。本文运用Petri网来描述Web站点结构,利用Petri网的可达性与关联矩阵等性质完成路径补充。提出了一种基于Petri网模型的路径补充算法,该方法不但可以高效地获得用户的访问路径,而且能够动态的反映用户的浏览行为。相似文献

9.

基于Web日志和缓存数据挖掘的个性化推荐系统 总被引：8，自引：0，他引：8

王勋凌云费玉莲《情报学报》2005,24(3):324-328

针对当前推荐系统中存在的问题,提出一个基于Web日志和缓存数据挖掘的个性化推荐系统.系统依据Web日志挖掘用户兴趣页面时综合考虑了访问次数、浏览时间和页面长度.通过对Web日志和缓存数据挖掘得到的兴趣页面的有效分类,构造不同用户的兴趣模型.系统能依据用户兴趣模型实现内容过滤推荐,同时也能通过比较不同用户的兴趣模型实现协作过滤推荐.经模拟实验测试表明,本文提出的推荐方法是可行并且有效的. 相似文献

10.

基于页面内容和会话相似的网络用户行为研究

阮光册《图书情报工作》2011,55(11):121-124

网络用户行为研究大多采用Web用户日志挖掘,首先介绍Web关联规则应用的传统方法,并指出传统方法中忽略了用户兴趣这一因素研究,更多的是以网页高频出现为挖掘结果进行聚类。针对这一问题,提出一种基于Web关联规则挖掘、页面内容和会话相似度相结合的研究方法,聚类出用户频繁访问的页面组,以发现网络用户行为的规律。在案例应用中,以上海某高校学生网络行为研究为例,得出相关结论。相似文献

11.

一个新的基于协作过滤的用户浏览预测模型 总被引：2，自引：0，他引：2

邢东山沈钧毅《情报学报》2004,23(1):15-20

本文提出了一个新的基于协作过滤的用户浏览协作预测模型———UNCPM ,它有效地解决了目前协作过滤预测方法的准确性和覆盖率低等问题。UNCPM从Web日志中获取用户浏览信息 ,系统分为两个部分 :离线构件和在线构件。离线构件用于用户浏览历史记录的K means聚类 ,并在聚类时充分考虑URL的相似分析来避免协作过滤的同义性和分散性等不足 ;在线构件用于活动用户预测。该模型可以应用在大型电子商务网站的用户浏览预测上。相似文献

12.

Web日志中用户存取模式的聚类研究

吴瑞史文武《情报学报》2006,25(5):629-633

基于用户访问网页的不同序列反映了用户特定的兴趣,提出了Web日志中用户存取模式的聚类算法。利用传统的Leader算法只扫描数据集一遍的优点,以及粗糙理论在处理含有不确定信息问题上的优势,给出了结合粗糙理论的改进Leader算法对用户存取模式进行聚类方法,使得同一类中的用户存取模式尽可能的相近或相似,不同类中的模式尽可能的相异。实验结果表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效聚类。相似文献

13.

用户认知导向的网络信息搜索模型研究述评

刘燕君马红宇刘腾飞周宗奎《图书情报工作》2013,57(17):139-146

网络信息搜索行为与用户的日常生活息息相关,用户认知导向的网络信息搜索是认知观和社会认知理论在网络信息搜索中的应用,是与传统信息检索和用户导向信息检索不同的检索范式。在介绍认知交互模型、信息问题解决模型和使用搜索引擎的网络信息搜索行为模型等用户认知导向的信息搜索模型的基础上,进一步从用户因素、信息环境和社会情境方面分析网络信息搜索过程中的影响因素。相似文献

14.

基于用户行为建模和大数据挖掘的图书馆个性化服务研究 总被引：5，自引：0，他引：5

何胜冯新翎武群辉熊太纯李仁璞《图书情报工作》2017,61(1):40-46

[目的/意义] 大数据背景下,如何构建合适的用户行为模型并基于海量的行为日志数据提供个性化服务,是当前图书馆大数据应用落地迫切需要解决的问题。[方法/过程] 首先分析用户行为模型构建的研究现状及存在的困境,接着密切结合大数据背景下个性化服务的特征,针对性提出基于本体的高校图书馆用户行为模型的构建策略和构建方法,并设计一种利用用户日志库提取用户显性兴趣和隐性需求本体的个性化服务方案,最后给出基于流行的Hadoop大数据分析平台和MapReduce计算框架的图书馆个性化服务的应用案例。[结果/结论] 基于本体构建的用户行为模型,技术上可与大数据分析平台实现无缝对接,从而提供实时而精准的服务,能有效应对当前大数据环境下图书馆个性化服务面临的“知识迷航”“信息过载”和“情感缺失”的挑战。相似文献

15.

Modeling actions of PubMed users with n-gram language models

Jimmy Lin W. John Wilbur 《Information Retrieval》2009,12(4):487-503

Transaction logs from online search engines are valuable for two reasons: First, they provide insight into human information-seeking behavior. Second, log data can be used to train user models, which can then be applied to improve retrieval systems. This article presents a study of logs from PubMed^®, the public gateway to the MEDLINE^® database of bibliographic records from the medical and biomedical primary literature. Unlike most previous studies on general Web search, our work examines user activities with a highly-specialized search engine. We encode user actions as string sequences and model these sequences using n-gram language models. The models are evaluated in terms of perplexity and in a sequence prediction task. They help us better understand how PubMed users search for information and provide an enabler for improving users’ search experience. 相似文献

16.

基于Google桌面搜索开发站内全文搜索引擎

任树怀卢志国《图书情报工作》2005,49(11):88-90

在分析Google桌面搜索工具(GDS)运行机制的基础上,提出一种基于GDS开发站内全文搜索引擎的方法：开发一个专用的Web代理GDSProxy,采用接受与转发机制支持用户对GDS搜索服务的远程访问,转发过程中增加用户IP地址限定、身份认证、日志处理和信息过滤等功能,站内信息的挖掘、索引和本地搜索服务由GDS承担。最后,通过开发实例介绍具体实现步骤。相似文献

17.

基于Web挖掘技术的用户兴趣本体学习研究 总被引：2，自引：1，他引：1

张玉峰蔡皎洁《情报学报》2011,30(4)

目前针对基于关键词的用户模型不能从语义上表达用户需求真正内涵,基于领域本体的用户模型多数忽略研究概念间非分类关系和语义应用环境较分散等缺陷。本文提出一种循环式的基于Web挖掘技术的用户兴趣本体学习模型,即综合应用统计分析、关联规则和聚类分析等技术进行电子商务领域用户兴趣概念及概念间分类与非分类关系学习,面对用户兴趣的迅速变化,还提出一种传递激活方法来实时更新本体或重新进行本体学习,以不断提高该本体的质量。经验证,基于该本体的用户模型在文本过滤等应用中能较上述两种用户模型满足用户个性化服务需求。相似文献

18.

图书相关文献资源发现与获取系统构建——基于预索引元数据仓储

熊拥军欧鹏杰《图书情报知识》2011,(6):101-106

针对WEB环境下图书相关文献资源的多样性和平台的异构性,使得读者对资源的获取不方便。提出基于预索引数据仓储的图书相关资源发现和获取方法,来集成各种类型的图书文献资源。对预索引元数据仓储模型、元数据的自动获取、对象的链接和用户体验等技术深入分析,并采用TRS信息技术来构建图书相关文献资源发现与获取系统。相似文献