首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 203 毫秒
1.
介绍电子商务和Web数据挖掘的概念,并介绍Web使用挖掘中应用最多的技术——Web日志挖掘.重点阐述了日志挖掘算法——关联规则的有关知识,以及改进的频繁项目集生成算法Apriori和强关联规则生成算法,并结合实例进行了分析研究.  相似文献   

2.
将形式概念分析技术应用于Web使用日志文件的挖掘,提出基于多值属性形式上下文,利用频繁闭项集挖掘Web使用日志生成关联规则的增量挖掘算法。与经典挖掘方法比较,减少了对Web使用日志的扫描次数,提高了挖掘效率,同时还可以进行增量挖掘,满足了实时页面推荐的需要。  相似文献   

3.
日志是计算机取证、入侵检测分析的重要数据来源,运用关联规则挖掘算法对日志进行分析是获取日志中所蕴含有用信息的重要方法,针对基于置信度-支持度框架的常用关联规则挖掘算法在日志分析中存在的不足,引入日志关键属性的概念,提出了基于关键属性约束的关联规则挖掘算法。实验结果表明,该算法能有效阻止无趣规则的产生,提高挖掘结果的有效性。  相似文献   

4.
随着www的广泛应用及相应的Web技术的出现,使数据挖掘的研究进入了一个新的阶段.关联规则挖掘是数据挖掘中的一个重要研究分支.本文提出了一种Web日志挖掘中频繁访问页组的加强算法.  相似文献   

5.
Web日志挖掘是对用户与Web服务器在交互时产生的数据,采用数据挖掘技术发现隐含的规律性知识。首先对Web日志挖掘进行了概述,重点研究了关联规则算法中的Apriori算法,并对Apriori算法进行了改进,最后给出具体实例。  相似文献   

6.
在数据挖掘研究领域中,Web日志挖掘是Web使用挖掘的一个分支。它作为Web挖掘的一个重要组成部分,具有独特的理论和实践意义.通过介绍Web日志挖掘的概念,系统阐述了Web日志挖掘的全过程:数据收集、数据预处理、模式识别、实际应用.说明Web日志挖掘应用广泛,能够实现网站的优化问题.  相似文献   

7.
提出了一种采用关联规则提高用户访问速度的方法,并通过对服务器的访问日志进行挖掘,得到用户访问序列的关联规则,将这些规则应用于客户浏览,把用户随后最有可能访问的网页预先传送到用户本地,以提高访问速度.详细论述了该方法的实现方案、算法、运行的环境以及对该方法的分析。  相似文献   

8.
针对传统关联规则 Apriori 算法难以适应大数据的问题,为提高可信计算平台日志数据分析效率, 提出了一种基于Hadoop的可信计算平台日志分析模型。构建了日志分析模型总体框架,对非结构化原始日志数据进行垂直划分,采用分布式文件存储系统,结合MapReduce编程模式给出一种分布式Apriori并行垂直算法。通过日志挖掘建立用户行为关联规则库,并采用规则匹配实现对用户异常行为的检测。理论分析和实验数据证明,该模型在大数据环境下能够有效提高日志分析效率。  相似文献   

9.
将Web使用记录挖掘技术应用于电子商务网站中.以Web log文件作为数据源,通过聚类算法以及浏览兴趣模式算法实现对用户日志进行挖掘,得出用户浏览兴趣度模式,实现兴趣模式的表示,并最终提供电子商务网站个性化访问服务,很好地改进了电子商务网站的营销策略,有效地促进电子商务的发展.  相似文献   

10.
提出使用XML文件的方法存储不同Web日志的格式.采用一个通用的方法分析原始的Web日志,并对日志做预处理、产生Web日志挖掘系统所需的数据,从而使Web日志挖掘更快速和准确.  相似文献   

11.
本文探索了一种新的Web日志挖掘算法,以便更有效地捕获用户访问模式.该算法首先把原始的用户访问序列转换为一个最长前向访问序列的集合,在转换中过滤掉了用户的回退操作;算法的第二步是根据第一步所得到的结果求得一个用户频繁访问模式.算法经实验模拟测试具有较为满意的时间复杂度和空间复杂度.  相似文献   

12.
从Web服务器日志文件和客户交易数据中挖掘出有意义的用户访问模式和潜在的客户群,使为企业提供全方位信息服务和开展有针对性的电子商务活动。该文分析了Web使用挖掘技术,阐述了挖掘数据的过程并提出了Web使用挖掘技术在电子商务中的作用。  相似文献   

13.
Rule Generation Based on Dominance Matrices and Functions   总被引:2,自引:0,他引:2  
Rough set theory has proved to be a useful tool for rule induction. But, the theory based on indiscemibility relation or similarity relation cannot induce rules from decision tables with criteria. Greco et al have proposed a new rough set approach based on dominance relation to handle the problems. In this paper, the concept of dominance matrix is put forward and the dominance function is constructed to compute the minimal decision rules that are more general and applicable than the ones induced by the classical rough set theory. In addition,the methodology of simplification is presented to eliminate the redundancy in the rule set.  相似文献   

14.
潘磊 《教育技术导刊》2009,19(9):186-189
为提升电网系统日志故障诊断效率,在 Spark 环境下,基于并行 Apriori 算法构建分布式日志故障挖掘系统,针对电网系统相关设备后台日志数据,构建频繁项集并挖掘关联规则,形成系统故障规则库,用于系统故障诊断。系统对 50 万条真实日志数据进行检验。结果表明,该系统可有效发现相关故障日志。同时,该系统在 80G 内存、10 个虚拟节点的集群上以 50s 的速度完成了故障挖掘工作,准确率达 90%,同时提升了原单机系统效率,实现了预期效果。  相似文献   

15.
因特网上有海量的数据信息,数据挖掘是从大量的数据中发现隐含的规律性内容,充分利用有用数据,废弃无用数据,解决数据的应用质量问题。通过对Web的数据挖掘和XML特点进行分析,讨论了使用XML实现基于Web的数据挖掘方法,提出了一种结合HTML、XMLJ、AVA的新型数据挖掘技术。  相似文献   

16.
Web日志挖掘是利用数据挖掘技术挖掘和分析网络日志,并获取网站使用过程中的有价值的信息和模式的过程。预处理是Web日志挖掘的第一步,也是非常关键的一步,预处理的结果决定了挖掘的效率和质量。本文主要阐述了预处理的一般过程,并针对目前国内外常用的一些预处理技术进行了探讨和分析。  相似文献   

17.
介绍了数据挖掘中Web挖掘的相关理论,探讨了Web挖掘技术在电子政务中的各类应用,并基于Web使用挖掘技术设计了一个Web挖掘原型系统,给出了访问模式挖掘、关联规则挖掘和系统智能推荐的实现思路,在一定范围内解决了传统电子政务系统的弊病,以期对基于电子政务的数据挖掘起到积极的借鉴作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号