共查询到20条相似文献,搜索用时 93 毫秒
1.
2.
3.
4.
5.
基于距离的异常数据挖掘在成绩检测中的应用 总被引:1,自引:0,他引:1
《中国教育信息化》2007,(2)
数据挖掘正充分应用到教育信息化中,而异常数据的探测和分析是一个有趣的数据挖掘任务。本文在基于距离的异常数据挖掘算法分析基础上,以中考考生成绩为实例,提出了异常数据挖掘在考生成绩检测中的一个基本应用模式。 相似文献
6.
面向高维数据的聚类分析是当今数据挖掘研究的重要领域,其中的关键问题在于如何对高维数据的聚类结果进行高效率的可视化分析。针对这一问题首先使用了数据聚合树(DA树)作为代表高维数据集的数据结构,并将一个新的聚集算法(CLUK算法)应用于该数据集,获得聚类分析的结果,然后搭建了一个可视化平台(Hvis),最后利用平行坐标法在... 相似文献
7.
数据清理是作为数据挖掘的一个重要步骤。本文论述了数据清理的基本概念、作用、算法和具体实现技术。 相似文献
8.
9.
本文利用组合数学中有关整数的一个结论给出了数据加密、解密的一种方法,并证明了该方法的可行性及有效性,给出了用该方法加、解密文件的算法. 相似文献
10.
时态数据挖掘是数据挖掘中一个日益重要的研究课题,针对时态数据中的多维关系模型,提出了一种新的多维时态关联规则挖掘算法,给出了一个多维间时态关联规则的算法主要步骤,并给出了数值实验分析,这种多维时态关联规则可以用于商品销售、股票价格等问题的知识发现和短期的预决策。 相似文献
11.
于含迪 《安顺师范高等专科学校学报》2010,12(3):85-88
针对贵州项目网中非结构数据量大的特点和不易管理的问题,文章采用了基于遗传算法分类的方法和数据库管理的方法对贵州项目网进行了数据管理的重构设计并在贵州项目网建设中得以实践。结果表明基于遗传算法分类与数据库管理适用于整合管理大量的非结构数据。 相似文献
12.
LI Gang TONG Fu School of Computer Engineering Science Shanghai University Shanghai China 《上海大学学报(英文版)》2000,(Z1)
l introductionThe progress of data-collection tCclmology, such as barcode scanners in commercial domains and sensors inscientific and industrial domains, gen~s huge amounts ofdata. It is not realistic to expect that all this data be carefullyanalyzed by human analysts and users. As poised out byPiatetsky-Shapiroll ], the huge size of real-world databasesystems creates both a need and an opportUnity for datamining and knowledge discovery teclmology.Discovering patterns in data seems tO be a k… 相似文献
13.
针对贵州项目网中非结构数据量大的特点和不易管理的问题,文章采用了基于遗传算法分类的方法和数据库管理的方法对贵州项目网进行了数据管理的重构设计并在贵州项目网建设中得以实践。结果表明基于遗传算法分类与数据库管理适用于整合管理大量的非结构数据。 相似文献
14.
陈冬华 《四川教育学院学报》2014,(1):122-124
流数据是近年来关注比较多的一种数据形式,但由于它自身的特点,无法使用传统的算法对它进行聚类分析.数据挖掘是从大规模数据库中提取感兴趣的信息.聚类是数据挖掘的重要工具,它根据数据间的相似性将数据库分成多个类,每类中数据要求尽可能相似.针对流数据的特点,引入一种采用渔夫捕鱼策略的新的聚类算法.该算法采用动态多点随机投鱼网方法,并且根据捕鱼环境的不同采用不同的探测策略.流数据聚类的捕鱼算法是一种即时更新模型的在线聚类算法. 相似文献
15.
16.
马丽丽 《中国教育技术装备》2011,(27)
聚类算法是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。通过分析研究数据仓库及数据挖掘中聚类算法的现状,对数据挖掘中常见的几种聚类算法的性能进行相互比较,并分析它们各自的优缺点,对数据挖掘中聚类算法的发展趋势作出展望。 相似文献
17.
提出基于云计算平台(以Hadoop为例)应用布尔矩阵Apriori算法进行大数据关联规则挖掘的MR_B_Apriori算法。将Hadoop平台与布尔矩阵Apriori算法相结合,利用MapReduce框架分块处理布尔矩阵,计算出分块数据的频度,合并融合得到大数据集的频繁项集。分析表明MR_B_Apriori算法能够适用于大数据的频繁项集挖掘。 相似文献
18.
霍桂利 《山西广播电视大学学报》2011,(6):51-53
分布式算法具有高度的适应性、可伸缩性、低性能损耗和容易连接等特性,可以作为挖掘关联规则的理想平台。分布式系统环境下实现高效分布式算法的方法。数据挖掘同关系数据库的关系,实现算法对数据库结构的要求,明确在实现中需要解决的几个核心问题。 相似文献
19.
李广霞 《石家庄职业技术学院学报》2013,25(4):27-29
设计了一种基于遗传算法的关联规则算法,该算法将遗传算法和关联规则相结合.对遗传算法的编码方法、适应度函数的构造、交叉算子和变异算子进行了分析,给出了所设计方法的具体步骤,并进行了试验.试验表明,改进后的算法的执行效率高于Apriori算法. 相似文献
20.
为了改善国内医疗云数据存储与共享中患者隐私泄露问题,加快互联网+医疗与医疗云建设,提出一种针对医疗大数据安全共享的隐私保护模型。模型将数据共享过程划分为3个阶段,明确各部分功能。采用一种适合医疗云数据加密场景的RS-Blowfish混合加密算法用于模型数据传输,在数据安全共享的同时兼具数字加密及身份认证功能。增添明文与密钥的Z形置换,改善初始密钥安全性,增添密钥认证,将传统的RSA算法、Blowfish算法和SHA-256算法结合为一个整体。实验结果表明, RS-Blowfish混合加密算法在增强Blowfish安全性的同时,加密速度较3DES快30%,较AES快10%。 相似文献