首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
大数据产业的兴起给数据挖掘领域带来了新的生机。数据挖掘是从各行各业产生的大量的信息中挖掘出对于人们有用和有价值的知识。数据挖掘是信息时代的产物,数据挖掘是从很早就开始研究,但是真正的将数据挖掘应用到实践中是从最近几年开始兴起。本文就数据挖掘领域中经典的算法,按照分类算法和聚类算法分别给出了介绍。  相似文献   

2.
1.数据挖掘的概念和方法数据挖掘,顾名思义就是从大量的数据中挖掘出有用的信息,也就是从大量的、不完全的、模糊的、随机的数据中,抽取出潜在的、有价值的知识、模型或规则,挖掘出更有价值的信息的一个过程。银行业作为我国最早实现电算化的一个行业,在经过近20年的电算化发展过程中,积累了大量的信息数据,如何运用数据挖掘技术进行深层次地分析和挖掘,找出相关的  相似文献   

3.
数据挖掘技术概述   总被引:1,自引:0,他引:1  
随着计算机技术的发展及广泛应用,计算机中积累了大量的数据,传统的数据处理技术只能进行简单的数据处理,无法挖掘出更有用的信息,因此数据挖掘技术应用而生。本文主要介绍了数据挖掘中常用的技术。  相似文献   

4.
李玉霞  李红宇 《科技通报》2012,28(2):149-151
Web日志中包含了大量的用户浏览信息,如何有效地从中挖掘出用户浏览模式就尤为重要了。本文在分析现有用户浏览模式挖掘算法存在问题的基础上,根据Web日志的特点,对关联规则挖掘算法进行改进,提出了基于滑动窗口的浏览模式挖掘算法TBPM。并在此算法基础上设计了增量更新算法,对实际数据的实验结果验证了本算法的有效性。  相似文献   

5.
数据挖掘技术能从海量数据中发现潜在的有用的信息和知识,蚁群算法在处理组合优化问题方面也已取得了较好结果,这就使得将蚁群算法应用于数据挖掘中的前景非常广阔。本文主要讨论了蚁群算法在数据挖掘聚类分析中的研究现状,最后总结了蚁群算法在数据挖掘应用中尚待解决的问题。  相似文献   

6.
刘芝怡 《科技通报》2014,(4):131-133
在研究传统挖掘频繁项集并行算法的基础上,提出一种以FP-forest为基础的高效能并行挖掘算法FPPMA(FP-forest based high-effect Parallel Mining Algorithm)。此算法中,各运算节点只需要和核心节点之间传递少量信息,而无需和其他运算节点通信,减少了通信费用。此外,运算节点不需要同步和交换数据就可独立挖掘出全局频繁项集。  相似文献   

7.
随着数据库技术的成熟应用和Internet的迅速发展,人们利用信息技术产生和搜集数据的能力大幅度提高,使得从大量数据中挖掘出有用的信息或知识成为一个迫切需要解决的问题。  相似文献   

8.
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。关联规则是当前数据挖掘研究的主要模式之一,侧重于确定数据中不同领域之间的联系,找出满足给定支持度和可信度阀值的多个域之间的依赖关系。根据关联规则的算法,介绍了FUP、FUP*等对规则的更新及维护的典型算法,并指出了数据挖掘的进一步研究方向。  相似文献   

9.
关联规则挖掘是从大量的数据中挖掘出有价值描述数据项之间相互联系的有关知识。本文对Apriori算法及其改进作了讨论。  相似文献   

10.
面对数据大爆炸,人们很难获取有用的信息。网络爬虫技术成为了搜索引擎中最为重要的部分,能够有效的在海量数据中找到有价值的信息。首先介绍网络爬虫的抓取对象和抓取策略,然后介绍最常见的网页分析算法——Pagerank算法,最后通过实例实现网络爬虫。实例结果表明,网络爬虫能够准确的从海量数据中抓取有用信息。  相似文献   

11.
The aim of our paper is to analyse the process of collaboration between independent firms linked by a technological agreement in the energy field, with a specific focus on the degree of codification of inter-organisational rules. Considering the agreement as a collection of different types of more or less codified rules, we show that their degree of codification and some other characteristics have an impact on the process of inter-firm cooperation.The paper first provides an analytical framework defining the concept and the types of rules relevant for our purpose. A rule is conceived to solve a problem of allocation or creation of resources; it serves a main function which can be of a cognitive, incentive or coordination nature; it is ambivalent, i.e. it entails side functions in addition to the main one. Two theoretical propositions are then developed and largely confirmed by our empirical research results based on two detailed case studies in the emerging field of fuel cell (FC) technology.  相似文献   

12.
Eliminating noisy information and extracting informative content have become important issues for web mining, search and accessibility. This extraction process can employ automatic techniques and hand-crafted rules. Automatic extraction techniques focus on various machine learning methods, but implementing these techniques increases time complexity of the extraction process. Conversely, extraction through hand-crafted rules is an efficient technique that uses string manipulation functions, but preparing these rules is difficult and cumbersome for users. In this paper, we present a hybrid approach that contains two steps that can invoke each other. The first step discovers informative content using Decision Tree Learning as an appropriate machine learning method and creates rules from the results of this learning method. The second step extracts informative content using rules obtained from the first step. However, if the second step does not return an extraction result, the first step gets invoked. In our experiments, the first step achieves high accuracy with 95.76% in extraction of the informative content. Moreover, 71.92% of the rules can be used in the extraction process, and it is approximately 240 times faster than the first step.  相似文献   

13.
基于关联规则挖掘的食品安全信息预警模型   总被引:4,自引:1,他引:3  
顾小林  张大为  张可  浦徐进  曹文彬 《软科学》2011,25(11):136-141
针对食品生产加工的安全问题,建立了基于关联规则挖掘的食品安全信息预警模型,此模型从数据挖掘视角以食品生产加工的检测数据为处理对象,分析数据异常情况,采用改进的关联规则挖掘APTPPA算法,生成关联路径树、寻找频繁项集、最大频繁项和最大关联规则,进而抽取报警关联规则,挖掘导致食品安全问题的因素并进行诊断和预警,最后通过实验验证了预警挖掘模型的正确性和算法的有效性。  相似文献   

14.
陈昱 《中国科技纵横》2013,(24):315-316,318
空域扇区划设对于均衡管制工作负荷,提高空域利用率,保障航空安全具有重要意义。通过介绍空域扇区和管制工作负荷的基本概念,考虑扇区划设中对管制工作负荷的影响,归纳总结国内外扇区划设的经验和方法I为扇区划设提出了具体、较为全面的划设规则。扇区划设规则可以作为评价扇区划设优劣的基本理论,是空域扇区划设的进一步研究重要基础。  相似文献   

15.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

16.
知识群落概念模型   总被引:4,自引:2,他引:2       下载免费PDF全文
刘福林  康洁  李淑萍  宋唯一 《科学学研究》2010,28(10):1445-1453
通过建构知识群落概念模型,能够全面揭示知识群落概念本质,进而有助于破解知识群落的内部结构规律与调节规律,促进第三代知识管理理论体系的建立,推动认识规律、创新规律与知识规律研究的深入发展。又经分析发现,目前文献并没有完整的界定知识群落概念本质。为此,采用仿生学演绎,由生物群落概念模型推理建立了知识群落概念模型,经实证研究,该模型揭示了知识群落概念本质,包括时间、区域社会环境与知识种群3个维度,演替与波动2种动态。并由此推导出了知识群落研究的新思维与内容。该研究是现有成果的突破,是基于仿生学发现的重要基础理论,适用于信息与知识相关研究领域,具有重要科学意义与应用价值。  相似文献   

17.
陈钦松 《科教文汇》2013,(15):155-156
物理教学引入哲学思想,体现马克思主义哲学的矛盾的同一性和斗争性、矛盾主要方面和次要方面的关系、事物普遍联系、质量互变的原理、认识和实践辩证关系等观点。在物理教学中引入哲学思想,有助于学生更深刻地理解物理知识和规律,有助于学生更深刻地领会物理的思想方法,从而使学生更好地学习物理。  相似文献   

18.
提供了一种关联规则挖掘经典算法-Apriori算法的优化算法,并结合实例探讨了如何把关系数据库的关联规则转化为单维、布尔关联规则,优化了算法的实施,探讨了关联规则的输出等问题。  相似文献   

19.
张贞梅 《中国科技信息》2007,(13):257-259,261
关联规则的挖掘是数据挖掘的一个重要方面,本文介绍了关联规则挖掘的一般概念,探讨了数据仓库中关联规则的挖掘问题,提出一种基于矩阵的对L2进行改进的算法,并对其与Apriori算法进行了分析和比较。  相似文献   

20.
宁琳 《现代情报》2016,36(2):140
文本挖掘是数据挖掘技术的一个重要方面,本文根据句法规则的特征,利用文本挖掘技术,提出基于句法规则的文本知识挖掘设计模型,从数据准备、句法规则构造、文本预处理、文本知识挖掘、挖掘结果评价等方面对工作原理进行了分析,重点阐述了句法规则的构造过程,最后通过实验验证了该模型,该设计对实现文本知识的智能化挖掘具有一定的研究意义和应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号