首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 453 毫秒
1.
分布式数据挖掘作为适用于异质异构数据的一种数据挖掘方式,它能有效处理数字图书馆分布式数据库的数据挖掘,解决好元数据集中管理与对象数据分散存取之间的矛盾。数字图书馆分布式数据系统在目前技术水平下,可根据PADMA系统理论,基于智能化的软件代理进行构建。  相似文献   

2.
在云计算背景下,海量数据信息相互影响,对原本的关联规则形成冗余干扰,导致当前以线性思维为主导的挖掘平台受到冗余干扰的影响,挖掘效率低下。为此,在分析传统方法弊端的基础上,提出了基于分布式思维的数据挖掘平台设计方法。为了解决冗余干扰问题,设计了一种冗余消除算法,以计算区域之间的相似度,形成分布式挖掘关联。试验结果证明,这种分布式数据挖掘平台可达到数据搜索简单、快速,且降低成本的目的。  相似文献   

3.
介绍云计算的概念及应用,探讨传统数据挖掘方法——分类和聚集方法的基本原理、特点、优缺点及应用范围。根据云计算的并行分布式计算特点,提出与之适应的数据处理方法。借助Google云计算中的分布式数据处理平台,评价云计算下复杂数据形式的数据挖掘方法。  相似文献   

4.
分布式算法具有高度的适应性、可伸缩性、低性能损耗和容易连接等特性,可以作为挖掘关联规则的理想平台。分布式系统环境下实现高效分布式算法的方法。数据挖掘同关系数据库的关系,实现算法对数据库结构的要求,明确在实现中需要解决的几个核心问题。  相似文献   

5.
近年来,随着时代的发展以及科学技术的进步,使得人类逐渐步入到网络信息时代.在这样的背景之下,计算机日益发展并在社会生产、生活过程中获得了广泛的运用.事实上,在云计算的环境之下,各类的商业数据资料往往以分布式的形式进行储存,而常规的数据挖掘模式无法对各类数据进行分布式挖掘.在这种情况下,如何促进这一问题的解决成为了相关部门亟待解决的问题.本文基于此,分析探讨云计算环境下频繁出现异常数据挖掘方法.  相似文献   

6.
为了提高体育产业数据精准挖掘和量化分析能力,本文提出基于时间序列的体育产业数据精准挖掘模型构建方法。采用全局稳态特征融合方法实现对体育产业数据分布式时间序列模型构建,采用统计量化融合分析方法实现体育产业数据特征量化空间转换,通过模糊解析控制方法,挖掘体育产业数据的关联分布熵。采用输出增益稳态分析方法,构建体育产业数据挖掘的线性解析参数分析模型,采用二乘规划和线性融合方法,实现对体育产业数据挖掘的内源融合和参数控制,结合模糊聚类实现对体育产业数据的统计特征线性聚类处理。结合稀疏性的特征匹配调度模型,构建体育产业数据挖掘的时间融合序列,通过时间序列重构,实现对体育产业数据的精准挖掘。仿真结果表明,采用该方法进行体育产业数据挖掘的精准度较高,特征匹配度较高,降低了体育产业数据挖掘的扰动误差。  相似文献   

7.
随着数据挖掘技术的广泛使用,产生了信息安全和隐私保护的新问题。对当前分布式隐私保护关联规则挖掘的经典算法进行了改进,在不使用当前流行的多方安全计算(SMC)的条件下,用较简单的方法进行隐私保护关联规则挖掘,降低了运算量。同时,在分布式关联规则挖掘的同时,很好地保持了各个站点的数据和信息。  相似文献   

8.
随着数据挖掘逐渐被应用到金融、娱乐、商业和医疗等多个行业,近年来涌现出各种用于处理海量数据的数据处理引擎,如MapReduce、Spark等。为了使高校实验室更深入地进行数据挖掘领域的理论研究,简要阐述分析了Spark技术及HDFS的概念与基本原理,详细介绍了基于Spark的云计算平台配置方法和实现过程,并对平台搭建过程中遇到的问题进行总结。实验结果证明,该平台能够有效完成分布式数据处理任务。  相似文献   

9.
讨论了数据挖掘技术在入侵检测中的应用,结合多Agent技术提出了一个分布式入侵检测系统应用模型,描述了系统的功能结构,并给出了一个异常检测实例。  相似文献   

10.
本文分析了智能入侵检测技术,结合人工免疫原理、机器学习、数据挖掘和Agent技术提出了一个基于Agent的智能分布式入侵检测系统,并对其系统结构和模块功能进行了描述。  相似文献   

11.
本文阐述了如何将分布式多媒体技术与数据仓库技术相结合,搭建一套适用于远程教育的辅助管理系统,将最新的数据仓库及数据挖掘技术应用于远程教育领域中,使远程教育实现教学质量与学习效率科学的提高。  相似文献   

12.
肖群 《教育技术导刊》2010,9(6):170-173
铁路运输、公路运输、水路运输和航空运输等系统中积累了大量的原始数据信息,为了有效地从这些异地的海量数据信息中抽取知识给无缝运输管理者提供决策支持,结合网格技术和数据挖掘技术提出了一个基于无缝运输信息网格(STIG)的并行数据挖掘方案。该方案的架构包括四层:用户层、挖掘任务分析和管理层、计算层、数据层。该方案的实现主要涉及数据挖掘算法服务的发现、数据分配和大数据源的分布式处理等技术。  相似文献   

13.
入侵检测是计算机系统安全和网络安全重要的一个研究焦点。由于入侵手段日新月异,即使现在有多种可用的机制来检测入侵,单一的方法系统还是无法识别新类型的入侵,或者有可能发出假的警报。本文介绍了多种数据挖掘技术在计算机系统和分布式计算机网络中开发入侵检测系统的多种有效方式和方法,并做了研究。  相似文献   

14.
随着如今数据量的爆发式增长,传统的数据挖掘方法已经远远不能满足人们需求,K-means聚类作为一种经典的聚类算法,其应用领域很广。但是K-means算法在随机选取初始聚类K个中心时,容易使聚类结果不稳定,因此提出基于核函数的K-means聚类算法。与此同时,结合MapReduce分布式框架对改进后的K-means聚类算法作分布式计算。研究结果表明,基于高斯核函数的K-means聚类在分布式下的计算能够加速K-means聚类过程,且结果优于单独基于核密度估计的K-means算法。  相似文献   

15.
近年来,随着Web2.0的兴起,互联网信息更加丰富,数据规模日益增加,传统数据挖掘技术难以满足需要.云计算为解决这一问题提出了一种新方法.本文首先对开源的云计算技术Hadoop进行介绍,然后,对分布式进行了设计.本文将聚类过程分为三个步骤,分别对TF-IDF关键词提取、LDA 模型训练和K -means 聚类过程进行MapReduce 的实现,并使用公共微博数据集进行了聚类实验,并与传统聚类方法进行对比,结果表明,本文所使用LDA 建模的分布式算法对中文微博数据聚类效果较好.  相似文献   

16.
Internet的迅速发展,使WorldWideWeb(WWW)成为一个巨大的、蕴涵着具有潜在价值知识的分布式信息空间。数据挖掘是从大量的数据中发现隐含的规律性内容,解决数据的应用质量问题,并充分利用有用的数据,帮助决策者调整策略,减少风险,做出正确的决策,是最具有前瞻性的一项技术。数据挖掘技术应用在Web环境下,通过对服务器日志信息采集,创建Web日志挖掘模型,分析经常访问的信息串,以利于网站管理者和经营者对网站管理进行决策参考。  相似文献   

17.
数据挖掘是目前一种新的重要的研究领域。本文介绍了数据挖掘的概念、目的、常用方法、数据挖掘过程、数据挖掘软件的评价方法,对数据挖掘领域面临的问题作了分析和展望。  相似文献   

18.
针对目前国内外网络文化安全监管系统中存在的一些问题,架构了以机器学习、数据挖掘、生物特征识别、内容分级管理等技术为核心的新一代基于智能代理的分布式网络文化安全监管系统,并将其应用到青少年绿色网络行动中,为解决校园网络文化的安全问题提供了技术支持。  相似文献   

19.
数据挖掘技术探究   总被引:1,自引:0,他引:1  
数据挖掘是数据库最活跃的领域之一,本文介绍了数据挖掘的基本概念和数据挖掘的方法,系统分析了数据挖掘技术与在线分析处理(OLAP)、统计的区别,最后总结了数据挖掘现状并且提出了数据挖掘的发展方向。  相似文献   

20.
本文首先介绍了数据挖掘的定义、任务与对象,其次从数据挖掘的流程、研究方法和数据挖掘软件的评价进一步论述了数据挖掘技术.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号