期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

面向高维数据的聚类分析是当今数据挖掘研究的重要领域,其中的关键问题在于如何对高维数据的聚类结果进行高效率的可视化分析。针对这一问题首先使用了数据聚合树（DA树）作为代表高维数据集的数据结构,并将一个新的聚集算法（CLUK算法）应用于该数据集,获得聚类分析的结果,然后搭建了一个可视化平台（Hvis）,最后利用平行坐标法在... 相似文献

7.

数据清理的实现技术

陈海燕周俊林《新疆职业大学学报》2004,12(3):73-74,53

数据清理是作为数据挖掘的一个重要步骤。本文论述了数据清理的基本概念、作用、算法和具体实现技术。相似文献

8.

随机森林算法在交通状态判别中的应用

《实验技术与管理》2017,(4):43-46

随机森林算法随机选择多个决策树构成森林,算法分类结果由这些决策树投票得到,在运算量没有显著增加的前提下提高了预测精度,是一种目前比较流行的组合分类器算法。随机森林算法不仅可以用来做分类,也可用来做回归预测,是机器学习、计算机视觉等领域内应用极为广泛的一个算法。该文将随机森林分类算法用于交通状态判别,利用实测数据进行模型训练和验证,并用袋外数据计算判别正确率,实验结果表明该方法具有可行性,为交通状态判别提供了一种新思路。相似文献

9.

整数的一条性质及其在数据加密中的应用

郑国彪《青海师专学报》2006,26(5):99-102

本文利用组合数学中有关整数的一个结论给出了数据加密、解密的一种方法，并证明了该方法的可行性及有效性，给出了用该方法加、解密文件的算法．相似文献

10.

一种多维时态关联规则的挖掘算法

陈军李向军孟志青《西安文理学院学报》2005,8(3):59-62

时态数据挖掘是数据挖掘中一个日益重要的研究课题，针对时态数据中的多维关系模型，提出了一种新的多维时态关联规则挖掘算法，给出了一个多维间时态关联规则的算法主要步骤，并给出了数值实验分析，这种多维时态关联规则可以用于商品销售、股票价格等问题的知识发现和短期的预决策。相似文献

11.

非结构化数据分类整合在贵州项目网中的设计与实现

于含迪《安顺师范高等专科学校学报》2010,12(3):85-88

针对贵州项目网中非结构数据量大的特点和不易管理的问题,文章采用了基于遗传算法分类的方法和数据库管理的方法对贵州项目网进行了数据管理的重构设计并在贵州项目网建设中得以实践。结果表明基于遗传算法分类与数据库管理适用于整合管理大量的非结构数据。相似文献

12.

Discovering Patterns in Symbolic Streams

LI Gang TONG Fu School of Computer Engineering Science Shanghai University Shanghai China 《上海大学学报(英文版)》2000,(Z1)

l introductionThe progress of data-collection tCclmology, such as barcode scanners in commercial domains and sensors inscientific and industrial domains, gen~s huge amounts ofdata. It is not realistic to expect that all this data be carefullyanalyzed by human analysts and users. As poised out byPiatetsky-Shapiroll ], the huge size of real-world databasesystems creates both a need and an opportUnity for datamining and knowledge discovery teclmology.Discovering patterns in data seems tO be a k… 相似文献

13.

非结构化数据分类整合在贵州项目网中的设计与实现

于含迪《安顺学院学报》2010,12(3):85-88

针对贵州项目网中非结构数据量大的特点和不易管理的问题,文章采用了基于遗传算法分类的方法和数据库管理的方法对贵州项目网进行了数据管理的重构设计并在贵州项目网建设中得以实践。结果表明基于遗传算法分类与数据库管理适用于整合管理大量的非结构数据。相似文献

14.

流数据聚类的捕鱼算法简

陈冬华《四川教育学院学报》2014,(1):122-124

流数据是近年来关注比较多的一种数据形式,但由于它自身的特点,无法使用传统的算法对它进行聚类分析.数据挖掘是从大规模数据库中提取感兴趣的信息.聚类是数据挖掘的重要工具,它根据数据间的相似性将数据库分成多个类,每类中数据要求尽可能相似.针对流数据的特点,引入一种采用渔夫捕鱼策略的新的聚类算法.该算法采用动态多点随机投鱼网方法,并且根据捕鱼环境的不同采用不同的探测策略.流数据聚类的捕鱼算法是一种即时更新模型的在线聚类算法. 相似文献

15.

基于Weka平台的不确定数据挖掘

郑继刚杨春华曾庆红赵若男《保山师专学报》2010,29(5):58-61

阐述传统关联规则挖掘Apriori算法的基本原理和算法思想,针对只能处理位置已经被精确给定的对象,利用开源Weka平台,通过数据转换,处理不确定数据集,对鸢尾花数据进行测试实验,挖掘出一些有益的关联结果。相似文献

16.

数据挖掘中聚类算法的研究与探讨

马丽丽《中国教育技术装备》2011,(27)

聚类算法是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。通过分析研究数据仓库及数据挖掘中聚类算法的现状,对数据挖掘中常见的几种聚类算法的性能进行相互比较,并分析它们各自的优缺点,对数据挖掘中聚类算法的发展趋势作出展望。相似文献

17.

布尔矩阵Apriori算法的MapReduce并行化实现

陈方健张明新杨昆《常熟理工学院学报》2014,(2):98-101,106

提出基于云计算平台（以Hadoop为例）应用布尔矩阵Apriori算法进行大数据关联规则挖掘的MR_B_Apriori算法。将Hadoop平台与布尔矩阵Apriori算法相结合,利用MapReduce框架分块处理布尔矩阵,计算出分块数据的频度,合并融合得到大数据集的频繁项集。分析表明MR_B_Apriori算法能够适用于大数据的频繁项集挖掘。相似文献

18.

基于分布式系统的关联规则挖掘算法

霍桂利《山西广播电视大学学报》2011,(6):51-53

分布式算法具有高度的适应性、可伸缩性、低性能损耗和容易连接等特性,可以作为挖掘关联规则的理想平台。分布式系统环境下实现高效分布式算法的方法。数据挖掘同关系数据库的关系,实现算法对数据库结构的要求,明确在实现中需要解决的几个核心问题。相似文献

19.

基于遗传算法的关联规则挖掘

李广霞《石家庄职业技术学院学报》2013,25(4):27-29

设计了一种基于遗传算法的关联规则算法,该算法将遗传算法和关联规则相结合.对遗传算法的编码方法、适应度函数的构造、交叉算子和变异算子进行了分析,给出了所设计方法的具体步骤,并进行了试验.试验表明,改进后的算法的执行效率高于Apriori算法. 相似文献

20.

一种安全性高的医疗大数据隐私保护模型

刘浩然《教育技术导刊》2019,18(8):200-203

为了改善国内医疗云数据存储与共享中患者隐私泄露问题,加快互联网+医疗与医疗云建设,提出一种针对医疗大数据安全共享的隐私保护模型。模型将数据共享过程划分为3个阶段,明确各部分功能。采用一种适合医疗云数据加密场景的RS-Blowfish混合加密算法用于模型数据传输,在数据安全共享的同时兼具数字加密及身份认证功能。增添明文与密钥的Z形置换,改善初始密钥安全性,增添密钥认证,将传统的RSA算法、Blowfish算法和SHA-256算法结合为一个整体。实验结果表明, RS-Blowfish混合加密算法在增强Blowfish安全性的同时,加密速度较3DES快30%,较AES快10%。相似文献