共查询到18条相似文献,搜索用时 187 毫秒
1.
2.
朱志国 《中国科技资源导刊》2011,43(3)
Web用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等信息,目前已经成为web挖掘领域的一个研究热点.文章首先给出Web访问模式挖掘系统的一般框架模型,然后介绍了框架模型中主要组成部分的工作原理,在此基础上,对Web访问模式挖掘系统中的一些关键技术的最新研究进展状况作了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作了展望. 相似文献
3.
朱志国 《中国科技资源导刊 (中国信息导报)》2011,(3):62-67
Web 用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等
信息,目前已经成为web 挖掘领域的一个研究热点。文章首先给出Web 访问模式挖掘系统的一般框架模型,然后介绍了
框架模型中主要组成部分的工作原理,在此基础上,对Web 访问模式挖掘系统中的一些关键技术的最新研究进展状况作
了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作
了展望。 相似文献
4.
现有的Web用户访问路径信息发现方法大都着眼于从静态的Web日志快照中进行挖掘.本文力图从Web访问数据的历史演变过程中,发现新的知识--持久偏爱的Web用户访问路径PP-WAP.PP-WAP实际上是历史访问序列WAS中大部分时间支持度值波动很小且保持较高的访问路径信息.本文首先介绍了相关背景和PP-WAP的应用领域.接下来,利用无序树结构来表示历史WAS集合,同时给出了PP-WAP的定义和挖掘算法描述.最后,分别针对模拟和实际数据集对算法的可扩展性以及PP-WAP的应用价值作了实验分析. 相似文献
5.
6.
本文使用WebTrends对三大类型图书馆网站的Web日志文件进行处理,通过提取用户信息行为的量化指标,比较分析了三大类型图书馆用户信息行为的异同,得出了一些重要结论。 相似文献
7.
8.
9.
10.
11.
一个新的基于协作过滤的用户浏览预测模型 总被引:2,自引:0,他引:2
本文提出了一个新的基于协作过滤的用户浏览协作预测模型———UNCPM ,它有效地解决了目前协作过滤预测方法的准确性和覆盖率低等问题。UNCPM从Web日志中获取用户浏览信息 ,系统分为两个部分 :离线构件和在线构件。离线构件用于用户浏览历史记录的K means聚类 ,并在聚类时充分考虑URL的相似分析来避免协作过滤的同义性和分散性等不足 ;在线构件用于活动用户预测。该模型可以应用在大型电子商务网站的用户浏览预测上。 相似文献
12.
基于用户访问网页的不同序列反映了用户特定的兴趣,提出了Web日志中用户存取模式的聚类算法。利用传统的Leader算法只扫描数据集一遍的优点,以及粗糙理论在处理含有不确定信息问题上的优势,给出了结合粗糙理论的改进Leader算法对用户存取模式进行聚类方法,使得同一类中的用户存取模式尽可能的相近或相似,不同类中的模式尽可能的相异。实验结果表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效聚类。 相似文献
13.
14.
基于用户行为建模和大数据挖掘的图书馆个性化服务研究 总被引:5,自引:0,他引:5
[目的/意义] 大数据背景下,如何构建合适的用户行为模型并基于海量的行为日志数据提供个性化服务,是当前图书馆大数据应用落地迫切需要解决的问题。[方法/过程] 首先分析用户行为模型构建的研究现状及存在的困境,接着密切结合大数据背景下个性化服务的特征,针对性提出基于本体的高校图书馆用户行为模型的构建策略和构建方法,并设计一种利用用户日志库提取用户显性兴趣和隐性需求本体的个性化服务方案,最后给出基于流行的Hadoop大数据分析平台和MapReduce计算框架的图书馆个性化服务的应用案例。[结果/结论] 基于本体构建的用户行为模型,技术上可与大数据分析平台实现无缝对接,从而提供实时而精准的服务,能有效应对当前大数据环境下图书馆个性化服务面临的“知识迷航”“信息过载”和“情感缺失”的挑战。 相似文献
15.
Transaction logs from online search engines are valuable for two reasons: First, they provide insight into human information-seeking behavior. Second, log data can be used to train user models, which can then be applied to improve retrieval systems. This article presents a study of logs from PubMed®, the public gateway to the MEDLINE® database of bibliographic records from the medical and biomedical primary literature. Unlike most previous studies on general Web search, our work examines user activities with a highly-specialized search engine. We encode user actions as string sequences and model these sequences using n-gram language models. The models are evaluated in terms of perplexity and in a sequence prediction task. They help us better understand how PubMed users search for information and provide an enabler for improving users’ search experience. 相似文献
16.
在分析Google桌面搜索工具(GDS)运行机制的基础上,提出一种基于GDS开发站内全文搜索引擎的方法:开发一个专用的Web代理GDSProxy,采用接受与转发机制支持用户对GDS搜索服务的远程访问,转发过程中增加用户IP地址限定、身份认证、日志处理和信息过滤等功能,站内信息的挖掘、索引和本地搜索服务由GDS承担。最后,通过开发实例介绍具体实现步骤。 相似文献
17.
基于Web挖掘技术的用户兴趣本体学习研究 总被引:2,自引:1,他引:1
目前针对基于关键词的用户模型不能从语义上表达用户需求真正内涵,基于领域本体的用户模型多数忽略研究概念间非分类关系和语义应用环境较分散等缺陷。本文提出一种循环式的基于Web挖掘技术的用户兴趣本体学习模型,即综合应用统计分析、关联规则和聚类分析等技术进行电子商务领域用户兴趣概念及概念间分类与非分类关系学习,面对用户兴趣的迅速变化,还提出一种传递激活方法来实时更新本体或重新进行本体学习,以不断提高该本体的质量。经验证,基于该本体的用户模型在文本过滤等应用中能较上述两种用户模型满足用户个性化服务需求。 相似文献
18.
针对WEB环境下图书相关文献资源的多样性和平台的异构性,使得读者对资源的获取不方便。提出基于预索引数据仓储的图书相关资源发现和获取方法,来集成各种类型的图书文献资源。对预索引元数据仓储模型、元数据的自动获取、对象的链接和用户体验等技术深入分析,并采用TRS信息技术来构建图书相关文献资源发现与获取系统。 相似文献