共查询到19条相似文献,搜索用时 187 毫秒
1.
Web使用挖掘下的Web页面层次分类技术研究 总被引:1,自引:0,他引:1
Web使用挖掘研究用户访问行为所体现的行为特征,Web站点结构分析对于Web使用挖掘具有重要意义.本文讨论如何结合Web站点内页面间的超链结构和关键页面分析技术实现对Web站点的链接结构分析,得到清晰的站点拓扑结构和页面层次分类,进而以此为Web页面进行层次编码,和Web用户行为向量的建立方法,为准确表述用户的访问行为提供数据支持;用一种新的方式进一步有效的挖掘用户的行为特征.最后,把它同一些重要的页面分类方法,从算法的计算效率和页面分类的准确率上进行了比较,试验数据的分析表明,该方法在效率和准确率上有一定提高. 相似文献
2.
刘松 《现代图书情报技术》2007,2(4):35-38
提出一个结合本体论及通用个人资料的个性化推荐模式。首先以网络分类服务作为本体论来解释用户的网络浏览行为,以此挖掘用户的偏好;其次,利用Web使用挖掘技术过滤多余的浏览记录,增强个性化的准确度;最后,利用本体论的层次结构特点,从用户偏好类别中挖掘其潜在偏好,产生符合用户特征的通用个人资料。 相似文献
3.
4.
本文首先对当前主要的Web挖掘技术和高校档案馆用户兴趣建模技术进行了分析,提出了以高校档案馆用户在高校档案馆网站浏览内容分析为主,浏览行为分析为辅的高校档案馆用户兴趣挖掘过程模型。而基于Web浏览内容挖掘所得到的用户兴趣模型能较准确地描述用户的兴趣。 相似文献
5.
由于网站的结构设计,对特定用户而言信息获取的代价与所经过的浏览路径长度成正比,这些位于路径中间的不必要的文档就无疑增加了用户获取信息的代价。本文利用Web挖掘的方法和技术对用户所访问的页面序列进行挖掘,构建路径优化的模型,实现对当前站点排序方式的优化,从而最大限度地优化用户访问体验,提高当前站点信息获取的整体效率。 相似文献
6.
7.
朱志国 《中国科技资源导刊》2011,43(3)
Web用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等信息,目前已经成为web挖掘领域的一个研究热点.文章首先给出Web访问模式挖掘系统的一般框架模型,然后介绍了框架模型中主要组成部分的工作原理,在此基础上,对Web访问模式挖掘系统中的一些关键技术的最新研究进展状况作了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作了展望. 相似文献
8.
论基于Web用户访问信息挖掘技术的个性化定制服务 总被引:6,自引:0,他引:6
本文论述了Web用户信息探索的内容和用户访问模式挖掘的实现方法,从几个方面分析了Web用户访问模式的发现技术在个性化定制服务中的应用。展望了Web访问信息挖掘技术的成熟对个性化定制服务水平的前景。 相似文献
9.
10.
在云图书馆环境下,网站可以通过关注用户访问路径、访问时间,利用Web挖掘的方法和技术对用户访问效益进行挖掘,以此来改进站点结构和内容,构建路径优化的模型,进一步实现个性化设计与服务,以提高用户访问效益和信息获取的整体效率.论文着重阐述站点优化模型和实现方法. 相似文献
11.
提出一种多粒度的用户行为数据收集方法,该方法以可配置的插件形式嵌入服务器端收集数据。实验证明,该方法能提高Web使用挖掘的数据质量,简化Web使用挖掘预处理工作,并为后续挖掘工作提供多种粒度的信息,从而为分析Web用户的行为提供优质数据源。 相似文献
12.
对影响Web使用挖掘效果的会话识别方法进行理论研究,将会话识别按照对用户行为的不同假设分为基于时间的、基于导航的和基于语义的三种启发式方法,并对每种方法又进行细分研究,对会话识别理论方法进行综述,讨论这三种方法的各自优点和存在的问题。在对会话识别的方法进行综合比较的基础上,指出会话识别方法研究的两个趋势,一个是表示Web日志访问请求所代表的语义,一个是分析用户行为。 相似文献
13.
朱志国 《中国科技资源导刊 (中国信息导报)》2011,(3):62-67
Web 用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等
信息,目前已经成为web 挖掘领域的一个研究热点。文章首先给出Web 访问模式挖掘系统的一般框架模型,然后介绍了
框架模型中主要组成部分的工作原理,在此基础上,对Web 访问模式挖掘系统中的一些关键技术的最新研究进展状况作
了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作
了展望。 相似文献
14.
一个新的基于协作过滤的用户浏览预测模型 总被引:2,自引:0,他引:2
本文提出了一个新的基于协作过滤的用户浏览协作预测模型———UNCPM ,它有效地解决了目前协作过滤预测方法的准确性和覆盖率低等问题。UNCPM从Web日志中获取用户浏览信息 ,系统分为两个部分 :离线构件和在线构件。离线构件用于用户浏览历史记录的K means聚类 ,并在聚类时充分考虑URL的相似分析来避免协作过滤的同义性和分散性等不足 ;在线构件用于活动用户预测。该模型可以应用在大型电子商务网站的用户浏览预测上。 相似文献
15.
构建基于Web数据挖掘技术的信息服务系统 总被引:5,自引:0,他引:5
介绍Web数据挖掘的种类和方法,提出一个基于Web数据挖掘的信息服务系统结构,该结构以数据挖掘模块为中心,处理数据库、智能代理、Web服务器日志和用户接口多数据源的信息,以改善文献情报机构的服务质量。 相似文献
16.
基于序列模式的个性化Web页面推荐模型* 总被引:1,自引:1,他引:0
易明 《现代图书情报技术》2008,24(8):42-47
基于数据挖掘中的序列模式方法,提出一种个性化Web页面推荐模型。该模型首先利用Web使用数据预处理提取Web交易事务集,然后应用序列模式算法挖掘频繁(连续)序列,最后通过构建频繁(连续)序列树生成用户偏好视图以生成个性化Web页面推荐集。 相似文献
17.
基于XML和关联规则的Web挖掘研究* 总被引:4,自引:1,他引:4
首先对Web挖掘、关联规则分析及XML作了简要介绍,提出了基于XML和关联规则的Web挖掘研究思想,随后对XML结构挖掘、XML内容挖掘和基于XML的Web日志挖掘进行讨论,建立了一个较为完整的XML挖掘体系。 相似文献
18.
Web日志挖掘数据预处理方法研究
总被引:1,自引:0,他引:1
柳胜国 《现代图书情报技术》2004,20(12):55-57
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。 相似文献