首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
基于WEB日志挖掘的网站个性化服务研究   总被引:1,自引:0,他引:1  
论述了基于Web日志挖掘的网站个性化服务,提出了利用Web日志挖掘的个性化服务中频繁访问路径的挖掘及用户聚类和页面聚类。利用这些算法推动Web站点从“站点为中心”向“用户为中心”的发展,即站点不但要针对用户共同感兴趣的信息服务,更要有针对每个用户的个性化服务。  相似文献   

2.
现有的Web用户访问路径信息发现方法大都着眼于从静态的Web日志快照中进行挖掘.本文力图从Web访问数据的历史演变过程中,发现新的知识--持久偏爱的Web用户访问路径PP-WAP.PP-WAP实际上是历史访问序列WAS中大部分时间支持度值波动很小且保持较高的访问路径信息.本文首先介绍了相关背景和PP-WAP的应用领域.接下来,利用无序树结构来表示历史WAS集合,同时给出了PP-WAP的定义和挖掘算法描述.最后,分别针对模拟和实际数据集对算法的可扩展性以及PP-WAP的应用价值作了实验分析.  相似文献   

3.
基于Web日志和缓存数据挖掘的个性化推荐系统   总被引:8,自引:0,他引:8  
王勋  凌云  费玉莲 《情报学报》2005,24(3):324-328
针对当前推荐系统中存在的问题,提出一个基于Web日志和缓存数据挖掘的个性化推荐系统.系统依据Web日志挖掘用户兴趣页面时综合考虑了访问次数、浏览时间和页面长度.通过对Web日志和缓存数据挖掘得到的兴趣页面的有效分类,构造不同用户的兴趣模型.系统能依据用户兴趣模型实现内容过滤推荐,同时也能通过比较不同用户的兴趣模型实现协作过滤推荐.经模拟实验测试表明,本文提出的推荐方法是可行并且有效的.  相似文献   

4.
王仁武  袁毅 《图书馆论坛》2011,31(4):100-102
用户访问行为信息记录在Web日志中,通过对海量Web日志进行清洗、抽取和加载来构建用户行为数据仓库,并结合文章所提出的用户访问路径概率矩阵模型进行数据挖掘,可以实现智能化的用户行为监控,可以为用户提供及时优质的信息服务。  相似文献   

5.
Web使用挖掘下的Web页面层次分类技术研究   总被引:1,自引:0,他引:1  
Web使用挖掘研究用户访问行为所体现的行为特征,Web站点结构分析对于Web使用挖掘具有重要意义.本文讨论如何结合Web站点内页面间的超链结构和关键页面分析技术实现对Web站点的链接结构分析,得到清晰的站点拓扑结构和页面层次分类,进而以此为Web页面进行层次编码,和Web用户行为向量的建立方法,为准确表述用户的访问行为提供数据支持;用一种新的方式进一步有效的挖掘用户的行为特征.最后,把它同一些重要的页面分类方法,从算法的计算效率和页面分类的准确率上进行了比较,试验数据的分析表明,该方法在效率和准确率上有一定提高.  相似文献   

6.
Web挖掘技术在电子商务中的应用研究   总被引:16,自引:0,他引:16  
刘培刚 《情报学报》2002,21(6):680-685
本文基于国内外最新研究成果对电子商务中应用的Web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题 ,给出了基于Web日志的客户群体聚类算法及Web页面聚类算法。利用这些Web挖掘技术可有效挖掘用户个性特征 ,从而指导电子商务网站资源的组织和分配。  相似文献   

7.
Web日志挖掘数据预处理方法研究     总被引:1,自引:0,他引:1  
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。  相似文献   

8.
杨思 《图书馆界》2009,(1):64-67
由于网站的结构设计,对特定用户而言信息获取的代价与所经过的浏览路径长度成正比,这些位于路径中间的不必要的文档就无疑增加了用户获取信息的代价。本文利用Web挖掘的方法和技术对用户所访问的页面序列进行挖掘,构建路径优化的模型,实现对当前站点排序方式的优化,从而最大限度地优化用户访问体验,提高当前站点信息获取的整体效率。  相似文献   

9.
数据预处理是Web日志挖掘的基础,而路径补充是数据预处理中一个关键环节。本文运用Petri网来描述Web站点结构,利用Petri网的可达性与关联矩阵等性质完成路径补充。提出了一种基于Petri网模型的路径补充算法,该方法不但可以高效地获得用户的访问路径,而且能够动态的反映用户的浏览行为。  相似文献   

10.
Web站点用户浏览模式自动分类可以更好地组织站点上的内容信息来满足不同用户的访问需求.Web使用挖掘技术已经在这项研究中得到了广泛的应用,但是集成Web内容挖掘的成果还不多见.本文首先给出了结合Web内容和使用挖掘技术的用户浏览模式分类的原型系统框架.系统中主要的过程是:对数据集中原始的Web服务器日志进行清理,使用Web使用挖掘技术从用户浏览会话中挖掘出有代表性的用户浏览模式,根据模式中每一个相关的页面内容抽取出一个N-gram集合,构建基于N-gram的用户浏览模式简档.最后本文对用户浏览会话作了分类实验分析,实验结果表明这个方法在N-gram=6,df=10%的情况下取得了较高的分类精确度.  相似文献   

11.
Online display advertising is a multi-billion dollar industry where advertisers promote their products to users by having publishers display their advertisements on popular Web pages. An important problem in online advertising is how to forecast the number of user visits for a Web page during a particular period of time. Prior research addressed the problem by using traditional time-series forecasting techniques on historical data of user visits; (e.g., via a single regression model built for forecasting based on historical data for all Web pages) and did not fully explore the fact that different types of Web pages and different time stamps have different patterns of user visits. In this paper, we propose a series of probabilistic latent class models to automatically learn the underlying user visit patterns among multiple Web pages and multiple time stamps. The last (and the most effective) proposed model identifies latent groups/classes of (i) Web pages and (ii) time stamps with similar user visit patterns, and learns a specialized forecast model for each latent Web page and time stamp class. Compared with a single regression model as well as several other baselines, the proposed latent class model approach has the capability of differentiating the importance of different types of information across different classes of Web pages and time stamps, and therefore has much better modeling flexibility. An extensive set of experiments along with detailed analysis carried out on real-world data from Yahoo! demonstrates the advantage of the proposed latent class models in forecasting online user visits in online display advertising.  相似文献   

12.
OBJECTIVES: This paper explores the potential of multinomial logistic regression analysis to perform Web usage mining for an academic health sciences library Website. METHODS: Usage of database-driven resource gateway pages was logged for a six-month period, including information about users' network addresses, referring uniform resource locators (URLs), and types of resource accessed. RESULTS: It was found that referring URL did vary significantly by two factors: whether a user was on-campus and what type of resource was accessed. CONCLUSIONS: Although the data available for analysis are limited by the nature of the Web and concerns for privacy, this method demonstrates the potential for gaining insight into Web usage that supplements Web log analysis. It can be used to improve the design of static and dynamic Websites today and could be used in the design of more advanced Web systems in the future.  相似文献   

13.
提出了一种基于数据挖掘技术的Web智能服务算法,它通过对Web数据模型的转换,发现并建立有关用户意向关联知识库,然后再利用知识库中的关联规则来预测用户行为,从而提高了用户浏览器访问速度。该研究内容属目前智能信息检索领域的重要研究课题,具有一定的理论和实践意义。  相似文献   

14.
多会话网络购物商品信息搜寻行为研究   总被引:1,自引:0,他引:1  
[目的/意义] 研究用户在多会话网购过程中的信息浏览、检索行为及其行为序列特征,以期更好地理解用户的复杂网购行为,指导购物网站提高服务质量,改善用户体验。[方法/过程] 基于某电商网站1 993名用户的11 514个购物任务的网购访问日志,在识别多会话网购任务的基础上,对用户在经多个会话进行网购过程中的信息搜寻行为进行统计分析,并利用顺序分析和聚类分析方法挖掘其典型的行为模式。[结果/结论] 当会话数量为8个及以下时,用户的浏览和搜索行为呈现出明显的规律性变化,且前4个会话发生时是用户做出购物决策的关键阶段;用户在多会话网购过程中存在6种典型的信息搜寻行为模式,分别有不同的信息搜寻行为特征。理解用户的复杂网购行为,可为电商网站设计导航和推荐策略、制定营销方案提供依据。  相似文献   

15.
阮光册 《图书情报工作》2011,55(11):121-124
网络用户行为研究大多采用Web用户日志挖掘,首先介绍Web关联规则应用的传统方法,并指出传统方法中忽略了用户兴趣这一因素研究,更多的是以网页高频出现为挖掘结果进行聚类。针对这一问题,提出一种基于Web关联规则挖掘、页面内容和会话相似度相结合的研究方法,聚类出用户频繁访问的页面组,以发现网络用户行为的规律。在案例应用中,以上海某高校学生网络行为研究为例,得出相关结论。  相似文献   

16.
《Research Strategies》2001,18(1):85-93
Course-related library Web pages can be designed to introduce students to an academic library Web site and provide access to information relevant to specific courses. These pages are most often developed to support a library instruction session. The author's course-related pages are designed on a template that includes the main features of the library Web site (e.g., links to the online catalog, reference information, and interlibrary loan request forms), a list of pertinent online indexes and databases, links to electronic journals, and recommended Web sites. Technical and organizational issues related to creating and maintaining such pages are discussed, as are outreach efforts and faculty/student response to incorporating this type of Web page into library instruction. A sample evaluation form and a list of selected course-related library Web sites are included as appendices.  相似文献   

17.
电子资源日志统计系统分析与设计   总被引:2,自引:0,他引:2  
电子资源日志统计能够提供电子资源评价体系中数据库利用与效用方面的量化指标。设计一种电子资源日志统计系统ERLS,解决其中日志预处理、电子资源统计指标与统计方法、用户定制的动态报表生成等关键技术,并设计开发了原型系统。  相似文献   

18.
Abstract

Library Web pages are increasingly designed to be the initial entry point for research, whether used from the library or off campus. But the pages must be intuitive and easy to use or students may bypass them completely, in favor of more familiar Web resources. This article presents the process, results, and evaluation of a Web usability study conducted at Linfield College with undergraduate participants. Web usability testing was a relatively quick and inexpensive way to find out how students used the library Web pages, information that proved invaluable in making effective modifications to them. In the process, researchers gained insights into student online searching and research patterns that have informed reference and teaching activities as well.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号