首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
混合云存储系统的大数据部署和管理过程中,出现大量冗余数据,需要对冗余数据合理删除,获取想要云端的数据,提高系统稳定性。传统的冗余数据删除算法会在分数阶Fourier域出现伪峰峰值,不能有效地对冗余数据进行检测滤波和删除处理,提出一种基于压缩特征码的混合云冗余数据删除算法。预测出不同时间片内混合云的任务执行期望完成时间,对混合云数据冗余主成分进行特征编码,表征为校验信息存储子集对部分冗余数据的块层结构,提高冗余数据删除性能,实现算法改进。仿真结果得出,该算法对云存储系统中冗余数据的检测性能较好,有效避免数据信息流的干扰特征造成的误删和漏删,冗余数据删除准确性高,具有较好的应用价值。  相似文献   

2.
徐新爱 《科技通报》2012,28(10):144-146,149
针对大型网络数据系统中冗余信息过大,数据之间缺少正常的约束行为,而造成数据查询效率过低的问题,提出了一种基于约束校验的大型网络数据库查询方法.该方法对大型数据库中的正常数据和冗余数据在数据关联时进行必要的约束、判断分类,运用数据关联决策理论对冗余数据进行过滤,保证数据关联过程中较高的约束性.实验结果表明,在大型网络数据库的实验平台上,该方法大幅提高了数据搜索的效率,效果显著.  相似文献   

3.
单机计算资源难以满足海量数据的冗余检测,提出基于Spark的海量数据冗余检测方法。先基于Simhash算法实现待测数据与对应指纹间的映射(二进制串),再设计指纹检索树并提出基于指纹检索树的数据冗余检测算法ROFA;最后,设计了基于Spark和ROFA的海量数据的冗余检测策略,实现了海量数据的冗余检测;利用UCI提供的数据进行实例分析,证明了该方法的有效性。  相似文献   

4.
针对以大型烟草智能管理数据系统中冗余信息过大,搜索效率过低的问题,本文提出一种基于烟草兴趣属性的数据分类算法.该算法对烟草正常数据和冗余数据进行判断分类,运用朴素贝叶斯决策理论对冗余数据进行过滤,保证烟草数据检索的高效性.实验结果表明,在以云计算为基础的烟草数据库实验平台上,该方法大幅提高了数据搜索的效率.  相似文献   

5.
提出采用残差数据合并技术的冗余数据优化挖掘算法,利用训练集建立决策树模型,引入C4.5决策树模型进行冗余数据主特征建模,在主分量特征决策树下,引入残差数据合并技术,设定数据残差特征伴随追踪模式,把传统方法中用于滤除的数据信息进行拼接伴随追踪定位,实现了冗余数据特征的优化挖掘。把方法应用到网络流量时间序列数据处理中实现网络异常监测,仿真实验表明,新的数据挖掘算法能有效提取到冗余数据特征作为有用检测特征,数据挖掘效率大幅提高,有效促进了海量数据隐藏特征的挖掘和应用,设计的网络流量监测软件能提高网络管理和监测实效性。  相似文献   

6.
针对Surfer软件中剖面的物理场值提取时产生的数据冗余,提出利用高级程序设计语言来编制程序剔除这些冗余数据,从而实现剖面的物理场值的精确提取,并通过试验验证了这种技术的效果。  相似文献   

7.
针对专网通信计费系统中,由于互联信息存在大量的冗余特征,导致大幅降低了数据联系特征属性,使得计费信息查询效率较低的问题.本文提出一种改进关联规则的专网通信计费分析数据的挖掘算法.通过计费数据属性扩展算法,对计费数据属性间的关联性进行扩展,有效排除冗余数据的干扰,增强数据间的联系性.实验与仿真结果证明,这种算法能够有效地消除冗余数据的干扰,计费数据查询的准确率较高,耗时降低.  相似文献   

8.
对服务器数据的保护目前绝大多数采用备份盘技术,数据盘数量与备份盘数量相等。采用冗余盘技术,冗余盘数量小于数据盘数量,这主要得益于逻辑异或XOR算法。无论是单磁盘崩溃或者两个磁盘同时崩溃,利用冗余盘数据与未损数据盘数据进行XOR运算,均能对磁盘崩溃后的数据进行有效恢复。  相似文献   

9.
提出了基于相互扰动多叉树过滤算法的物联网食品追踪方法,该方法以物联网技术为基础,配合超高频射频识别技术(UHF RFID)作为食品追踪方法的记录载体,结合物联网技术适合解决大区域监控的特点,设计了食品正向追溯和逆向追溯两种追溯机制,食品安全追溯过程中,会产生数据冲突和数据冗余,采用相互扰动多叉树算法解决了数据冲突,借助基于Hashtable的冗余过滤技术处理RFID数据冗余。在以奶粉作为生产追溯对象的测试实验中,该追踪方法在进行食物追踪、多标签识别方面,可以实现大区域、大跨度的食品信息准确查询与追踪,吞吐率始终保持在0.6左右,同时也解决了冗余数据所引起的追踪方法负担过重的问题,具有良好的市场应用前景。  相似文献   

10.
远程教育中云存储机制下存有海量图像数据,在海量数据中存在大量与需要检索的特定图像特征相近的冗余图像,传统的基于图像特征的分类方法,由于关键帧准确性较低,造成图像分类不准确,导致远程教育中图像数据的检索准确性较低。为此,提出基于关联规则挖掘算法的图像数据优化分类方法。对可能是冗余的图像数据进行微调,使待检索图像关键帧处于准确的变化区间内,利用图像校验方法,消除冗余图像,对校验结果进行二次检验,降低了建立图像数据特征关联的偏差,实现了对图像数据的准确分类。实验结果表明,利用该方法能够对远程教育中云存储机制下的图像数据进行准确检索。  相似文献   

11.
为有效精确地挖掘海量数据流特征,提出采用数据集中位分割和冗余数据碎片合并的方法设计决策树并构建云平台数据特征挖掘模型。传统的云平台下数据挖掘中对碎片信息不做处理,使文本碎片成几何级增长,导致有用信息的丢失。通过挖掘冗余信息中符合挖掘条件的碎片特征,使用KD树进行数据挖掘索引,在迭代过程中,对数据进行层进中位分割,并结合碎片合并技术,构建数据挖掘云平台模型,对中位数进行维度匹配分箱,使数据的挖掘和传输率最大限度地得到利用。仿真实验证明了采用碎片合并的方法能有效提取冗余碎片中的有用特征信息,数据挖掘性能得到大幅度提升,在数据信息提取和管理中具有很好的推广意义。  相似文献   

12.
《软科学》2014,(8):125-129
从财务冗余结构出发研究财务冗余对企业绩效的影响,克服了仅研究财务冗余水平作用的局限性和不足,利用中国制造业相关数据研究组织环境对财务冗余与企业绩效关系的权变作用,结果表明:财务冗余结构与企业绩效呈倒"U"型关系。环境动态性对财务冗余结构与绩效关系具有显著的负向调节效应,环境适宜性的调节作用不显著。并在二维环境特征下,探讨了由环境动态性和适宜性构成的4个不同二维环境特征中财务冗余结构与企业绩效之间的关系,更加细致地揭示了不同组织环境对财务冗余作用的影响。  相似文献   

13.
在数据库应用系统中核心问题就是对数据库中数据的查询处理,本文就大学生创业实训中,就实际应用数据,如何在上万条记录中,检索出用户所要求数据而去掉冗余的数据,具有一定的启发意义。  相似文献   

14.
AFDX总线被客机、运输机选为干线通信总线。AFDX中冗余数据帧实时分析处理是其中重要环节。根据ARINC664标准,研究了冗余帧的处理机制及实现流程,采取分时的方式实现了对多路数据的实时捕获,CPU对内存条的实时读取。结果证明完全能够满足设计需求。  相似文献   

15.
针对嵌入式系统应用,在分析传统循环冗余校验算法原理的基础上,提出一种基于查表法的循环冗余校验算法,在保障嵌入式系统数据可靠性的同时,提高数据校验处理速度。  相似文献   

16.
随着信息技术的迅猛发展,大型数据库中的数据正在呈几何级数增长,冗余分类技术已经成为信息组织的重要手段。在总结归纳已有的冗余分类算法弊端的基础上,参考决策树算法提出了一种新的基于数据库抽样的海量数据冗余分类算法。算法引入宽度优先扩展思路,并给出了算法的基本思想和具体实现过程,探讨了并行环境下进行计算的优化步骤。在与SPRINT算法的比较实验中,新算法展现了良好的性能和分类效率。  相似文献   

17.
特征提取算法可以去除目标数据中的冗余特征、无关特征甚至噪声特征,从而得到一个无冗余、无噪声的样本集,有助于提高目标对象的识别率以及数据的挖掘速度。现有的特征提取方法在定性数据及噪声数据的处理上存在局限性,而定性数据及带噪声数据在现实建模过程中是不可避免的。本文从特征提取需解决的根本问题出发,就如何确定特征子集并选择适当的隶属函数来表示模糊子空间,使模糊规则归纳模型有最大的识别率及抗干扰性的方法进行讨论、研究。  相似文献   

18.
基于冗余资源的有限理性来源观,建立了企业决策方式与不同类型组织冗余之间的关系模型,利用河南省283家制造企业的数据,初步检验了目前制造业企业三种冗余资源与程序化决策和非程序化决策之间的关系。研究结果显示,物质资源冗余和人力资源冗余与非程序化决策具有显著的正相关关系,而关系资源冗余则与程序化决策具有显著的正相关关系;研究表明,不断改进程序化决策有利于企业减少物质资源冗余和人力资源冗余,却可能增加企业的关系资源冗余。本文的研究结果为组织冗余的有限理性来源观提供了初步的支持。  相似文献   

19.
利用河南省283家制造企业的调研数据,分析了企业的程序化决策和非程序化决策与组织冗余之间的关系.结果显示,企业的程序化决策与组织冗余之间负相关,而非程序化决策与组织冗余之间正相关;从企业决策方式的角度来看,目前我国制造业企业的冗余资源主要来源于企业的非程序化决策活动,不断改进的程序化决策有利于企业减少资源的冗余.  相似文献   

20.
随机森林是一种优秀的分类算法,然而随机森林算法不能有效的判断冗余属性,因此影响了在含有冗余属性的数据集上的分类效果。针对这一问题,本文提出了一种基于局部线性嵌入的随机森林算法。该算法利用局部线性嵌入算法对冗余属性数据集进行降维,然后利用随机森林算法进行分类学习。在UCI标准数据集上的仿真实验说明,本文算法是一种优秀的含冗余属性数据集分类算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号