首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
数字图书馆用户使用信息挖掘与应用   总被引:5,自引:0,他引:5  
用户信息收集是用户研究中最基础同时也是最重要的环节。数字图书馆有关记录用户活动和行为的日志文件、用户profile和用户调查信息统称为用户使用信息.对这些信息进行挖掘的技术主要是WEB使用挖掘。在数字图书馆中应用WEB使用挖掘可以改善网站可用性,提供个性化服务,进行资源评价与采编,进行数字图书馆系统评价和界面设计。  相似文献   

2.
数字图书馆的用户信息主要有数字图书馆用户登陆信息和用户活动信息、用户profile、用户调查信息、网站的用户注册信息和日志文件等。利用分类和聚类分析、关联分析、序列模式发现、模式识别等知识发现方法挖掘出用户信息数据里隐藏的知识,以有效提升数字图书馆用户知识管理及个性化知识服务的能力。  相似文献   

3.
企业用户情报需求挖掘及资源关联可视化展示研究   总被引:1,自引:0,他引:1  
文章旨在识别和挖掘用户的显性及潜在情报需求,并通过形象化、可视化手段加以展示,实现情报用户需求的高效管理。模型基于用户相关历史文档、用户操作日志等文档,采用统计分析方法和日志分析技术,提取用户的情报行为数据,挖掘用户的情报需求,并基于计算机图形学和图像处理相关技术,利用prefuse-flare数据可视化技术创建FLASH文件,实现用户需求分布展示、需求演化分析及兴趣图谱呈现,对系统情报资源和网络资源进行多维度、任意属性的关联可视化展示。  相似文献   

4.
Web挖掘技术在电子商务中的应用研究   总被引:16,自引:0,他引:16  
刘培刚 《情报学报》2002,21(6):680-685
本文基于国内外最新研究成果对电子商务中应用的Web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题 ,给出了基于Web日志的客户群体聚类算法及Web页面聚类算法。利用这些Web挖掘技术可有效挖掘用户个性特征 ,从而指导电子商务网站资源的组织和分配。  相似文献   

5.
Web日志挖掘数据预处理方法研究     总被引:1,自引:0,他引:1  
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。  相似文献   

6.
数据挖掘技术在电子商务中的应用研究   总被引:1,自引:0,他引:1  
本文基于国内外最新研究成果对电子商务中应用的web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题,给出了基于web日志的客户群体聚类算法及web页面聚类算法。利用这些web挖掘技术可有效挖掘用户个性特征,从而指导电子商务网站资源的组织和分配。  相似文献   

7.
搜索引擎日志记录了用户与系统交互的整个过程。对日志文件进行挖掘,可以发现用户进行Web搜索的行为特征与规律,有效改善搜索引擎系统的性能。在对国内外相关研究进行系统梳理和总结的基础上,文章提出了一个Web搜索引擎日志挖掘的研究框架,主要包括日志挖掘的研究内容、数据集的选择方法、数据预处理的方法、不同地域用户行为的特征与比较、如何应用于系统性能的改善等内容。  相似文献   

8.
基于WEB日志挖掘的网站个性化服务研究   总被引:1,自引:0,他引:1  
论述了基于Web日志挖掘的网站个性化服务,提出了利用Web日志挖掘的个性化服务中频繁访问路径的挖掘及用户聚类和页面聚类。利用这些算法推动Web站点从“站点为中心”向“用户为中心”的发展,即站点不但要针对用户共同感兴趣的信息服务,更要有针对每个用户的个性化服务。  相似文献   

9.
数字图书馆个性化信息检索模型研究*   总被引:3,自引:0,他引:3  
结合向量空间技术、Agent技术、Web日志挖掘等技术提出了一个基于概念的数字图书馆个性化信息检索模型。该模型根据用户主动提供的初始信息建立基于概念的用户兴趣模型,利用用户对文档的主动评价和用户的访问行为更新用户兴趣模型,并将用户兴趣模型用于检索结果的相关度排序和最新信息的推荐以及合作推荐。最后给出系统的实现方法。  相似文献   

10.
通过日志挖掘研究图书馆资源发现服务用户的搜索行为   总被引:1,自引:0,他引:1  
通过日志挖掘的方法对图书馆资源发现服务用户的搜索行为进行研究。搭建一个搜索日志中间平台,用于产生和记录相关日志信息;用Java编写日志处理程序,将日志信息存储于MySQL数据库中;基于日志结果,从检索方式、查询语言与查询长度、分面点击、查询词修改等方面对用户搜索行为进行分析,希望能对图书馆资源发现服务的部署、应用和优化提供参考。  相似文献   

11.
The vast majority of empirical research on online communication, or media use in general, relies on self-report measures instead of behavioral data. Previous research has shown that the accuracy of these self-report measures can be quite low, and both over- and underreporting of media use are commonplace. This study compares self-reports of Internet use with client log files from a large household sample. Results show that the accuracy of self-reported frequency and duration of Internet use is quite low, and that survey data are only moderately correlated with log file data. Moreover, there are systematic patterns of misreporting, especially overreporting, rather than random deviations from the log files. Self-reports for specific content such as social network sites or video platforms seem to be more accurate and less consistently biased than self-reports of generic frequency or duration of Internet use. The article closes by demonstrating the consequences of biased self-reports and discussing possible solutions to the problem.  相似文献   

12.
The Central Medical Library (CMK) at the Faculty of Medicine, University of Ljubljana, Slovenia, started to build a library Website that included a guide to library services and resources in 1997. The evaluation of Website usage plays an important role in its maintenance and development. Analyzing and exploring regularities in the visitors'' behavior can be used to enhance the quality and facilitate delivery of information services, identify visitors'' interests, and improve the server''s performance. The analysis of the CMK Website users'' navigational behavior was carried out by analyzing the Web server log files. These files contained information on all user accesses to the Website and provided a great opportunity to learn more about the behavior of visitors to the Website. The majority of the available tools for Web log file analysis provide a predefined set of reports showing the access count and the transferred bytes grouped along several dimensions. In addition to the reports mentioned above, the authors wanted to be able to perform interactive exploration and ad hoc analysis and discover trends in a user-friendly way. Because of that, we developed our own solution for exploring and analyzing the Web logs based on data warehousing and online analytical processing technologies. The analytical solution we developed proved successful, so it may find further application in the field of Web log file analysis. We will apply the findings of the analysis to restructuring the CMK Website.  相似文献   

13.
Internet上常用的汉字编码有 GB、HZ、Big5三种。微机仿真终端利用 HZ码和 ZWDOS可直接传送中文电子邮件、参加中文新闻组的讨论、浏览 Gopher服务器和 WWW服务器上的中文信息。GB码的汉字文件和其他二进制文件经过编码后亦可通过 E- mail传送。这三种汉字编码可互相转换 ,相应的软件可利用匿名FTP从 Internet上获取。  相似文献   

14.
Understanding user behavior with electronic services is now a major concern of journal publishers, librarians, and others. Various electronic journal log files are offering researchers and practitioners a rich data resource for user studies. This article reports the experience of using the log file data to understand user behavior in the SuperJournal project, addressing methodological and analytical issues that may have wider relevance. The purpose of this article is to provide guidance for log file processing and analysis focusing on users, and to begin the process of standardizing analysis procedures to facilitate the comparison of user behavior observed in different projects.  相似文献   

15.
Web usage statistics: Measurement issues and analytical techniques   总被引:1,自引:0,他引:1  
The number of federal agencies creating and maintaining electronic networked resources continues to increase. One networked resource federal agencies are increasingly using is the World Wide Web (Web). As government use of the Web rises, so too does the need for assessing the extent and nature of public use of agency Web sites. One means of Web use evaluation is through the analysis of Web server-generated log files. This article presents various log file analysis techniques and issues related to the interpretation of log file data.  相似文献   

16.
电子文件的形成可以分为自然形成与受控形成两种。"自然"与"受控"是相对于有没有档案管理功能参与其中而言的。自然形成是指一般意义上的计算机文件的创建与制作,形成的是"裸文件"。受控形成是指通过对电子文件实行捕获、集成、固化、登记、审计跟踪等功能发挥档案管理、控制作用。受控形成的电子文件是在"裸文件"基础之上集成了实现文件凭证价值的必要信息的复合文件。前端控制与全程管理思想的实质说明,只有受控形成的电子文件才能真正归档并作为档案单套保存。  相似文献   

17.
图书馆等文化事业机构保护非物质文化遗产的措施   总被引:16,自引:0,他引:16  
面对亟待保护的珍贵的非物质文化遗产,图书馆等文化事业机构有责任发挥积极作用,将保护非物质文化遗产的职责明确纳入其职能中,具体可以从为专项遗产立档保存、确保有关资料的完整与安全并促进利用、档案资料的支持和确认、建立传承(人)档案、参与非物质文化遗产的研究、开展大普查工作、宣传与振兴非物质文化遗产等方面来考虑。  相似文献   

18.
为更好地了解读者的需求,本文引进了点击流技术,通过对OPAC日志数据的分析,为图书馆的读者服务工作提出了一个新的方法。  相似文献   

19.
ABSTRACT

A primary impact metric for institutional repositories (IR) is the number of file downloads, which are commonly measured through third-party Web analytics software. Google Analytics, a free service used by most academic libraries, relies on HTML page tagging to log visitor activity on Google's servers. However, Web aggregators such as Google Scholar link directly to high value content (usually PDF files), bypassing the HTML page and failing to register these direct access events. This article presents evidence of a study of four institutions demonstrating that the majority of IR activity is not counted by page tagging Web analytics software, and proposes a practical solution for significantly improving the reporting relevancy and accuracy of IR performance metrics using Google Analytics.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号