首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
传统的基于数据流聚类算法的网络攻击检测技术自适应性不强、对问题的依赖性过高造成聚类质量不够理想、聚类效率低等缺陷,提出一种基于期望克隆率的数据流聚类算法。引入衰减函数和时刻权重来反映过去的数据与当前流入的网络数据在整个服务器集群网络数据流中的地位,通过计算抗体期望克隆率来限制抗体克隆的数目以及保持抗体的多样性,采取服务器集群网络中的淘汰策略使最终的网络结构更符合原始数据流的内在特性并生成网络数据的统计信息,然后利用最能反映当前网络行为的统计信息来检测攻击行为。仿真结果表明,该方法能够弥补传统服务器集群网络非确定攻击检测系统的缺陷,提高了网络攻击的检测率,降低了误报率。  相似文献   

2.
针对传统协同过滤技术在图书推荐中效率不高、数据极端稀疏性及主观性强等问题,提出一种基于云填充和蚁群聚类的协同过滤图书推荐方法,首先根据蚁群聚类算法得到用户群分类,然后在进行协同过滤前预先通过云模型填充用户——项目矩阵,以降低数据的稀疏性。实验结果表明,该算法在推荐精度上有明显的提高。  相似文献   

3.
云模型和谱聚类是近年来国内外进行数据聚类分析的两个研究热点。云模型刻画聚类过程的随机性和模糊性之间的关联性,分析聚类对象的不确定性。谱聚类不对数据的全局结构作假设,具有识别数据非凸分布的能力。首先介绍这两种聚类算法的基本理论,分析和比较它们的聚类本质,然后由图像分割实验实现聚类分析过程,最后阐述两种聚类算法的聚类特性,并给出各自的适用范围。  相似文献   

4.
传统的蚁群算法在迭代过程中产生逆转变异,新的结点与链路也可能在任意时刻加入到云中,给电网系统云数据的云计算和故障数据预测检测带来很大难度,出现拥塞控制,导致聚类效果不好。结合云计算处理数据的特点,对传统的蚁群算法进行改进,提出一种改进的蚁群引导电网系统云数据聚类和故障检测算法,根据基因位随机数大小决定输出概率的精度,更新状态类别充分统计量,得到故障特征观测概率和初始概率,执行聚类中心更新规则。搭建的Hadoop集群云计算原型系统,在开源的云计算平台框架和HBase电网系统数据库下进行数据采集和算法实现。仿真结果表明,算法在数据聚类和故障检测中具有较好的应用性能。  相似文献   

5.
许多现实应用中,由于数据流的特性,使人们难以获得全部数据的类标签。为了解决类标签不完整数据流的分类问题,本文首先分析了有标签数据集对基于聚类假设半监督分类算法分类误差的影响;然后,利用分类误差影响分析以及数据流的特点,提出一种基于聚类假设半监督数据流集成分类器算法(semi-supervised data stream ensemble classifiers under the cluster assumption,SSDSEC),并针对个体分类器的权值设定进行了探讨;最后,利用仿真实验验证本文算法的有效性。  相似文献   

6.
王冬秀 《科技通报》2013,(6):40-43,46
对目前主流数据流算法的优缺点进行分析后,提出了一种衰减窗口模型下基于密度的数据流聚类算法DWDCluSteam。算法采用衰减窗口技术,然后利用改进的树结构来维护和更新数据流的摘要信息,最后利用周期性的剪枝策略,定期删除过期、稀疏的网格单元。仿真实验表明,相对于以往的数据流聚类算法,该算法可获得较好的聚类质量,较小的内存开销和较高的数据处理能力。  相似文献   

7.
传统方法中,对XML数据库的融合中心带宽扩维算法采用谱估计方法,当融合中心出现了大量以海量数据为基础的信息服务数据时,后续访问需在多个服务器中遍历许多节点,影响访问效率。提出一种基于节点分裂日志的XML数据库融合中心带宽扩维感知算法。首先构建XML数据库相对状态系统模型与数据融合算法,设计节点分裂日志的数据融合结构,通过预获取有限的带宽中心信息,推导出实体关联知识库,利用表征关联知识有效指导XML数据库的资源融合和重整,构建实体模型,提高数据融合中心的聚类能力。仿真实验结果表明,该法能有效提高XML数据库融合中心宽带扩维匹配率,执行效率和数据聚类效率提高,展示其优越的应用价值。  相似文献   

8.
提出一种基于动态特征K-Means聚类的云计算中多源信息资源平台兼容性路由算法,构建了云计算环境下的多源信息资源通信模型,进行多源信息资源云分析及模型构建,基于动态特征K-Means聚类进行多源信息资源的平台的兼容性特征值挖掘与匹配。仿真结果表明,采用该算法进行云计算环境下的多源信息资源平台兼容路由设计,能提高了云计算平台资源使用效率,降低了CPU负载,节省了计算开销和通信开销,在云平台资源调度等领域就有较高的应用价值。  相似文献   

9.
二阶锥规划是在有限个二次锥的笛卡尔空间仿射变换交集上的极小化和极大化线性函数,采用修正的二阶锥规划模型,结合二阶锥的凸优化条件,进行大数据聚类算法改进,提高数据的聚敛性。传统方法中对大数据聚类的二阶锥规划模型采用线性对偶锥规划方法,对数据聚类的路径跟踪性能不好。提出一种基于修正的齐次二阶锥规划模型的大数据聚类算法。进行数据的特征挖掘和信息流模型构建,从大量的、有噪声的、模糊的数据中进行大数据的功率谱密度特征提取,采用粗糙概念格方法对大数据信息流进行二阶锥规划模型构建,结合齐次二阶锥规划模型算法有限收敛性,对每一数据聚类样本进行可靠性衡量,实现数据聚类中心的准确搜索。对聚类误差函数求最优解,使得误差收敛到零。仿真结果表明,该算法进行数据聚类的精度较高,收敛性较好,避免了出现局部最优解,性能优越于传统算法。  相似文献   

10.
对大数据的分层建树聚类,提高对大数据的检测和大数据应用系统的故障分析能力。传统方法中对大数据的分层聚类采用K-Means聚类算法,容易陷入局部收敛,聚类效果不好。提出一种基于核向量机的数据的分层建树聚类。采用四叉树算法对多维数据进行数据预处理,进行KNN中心区域的聚类中心扩展处理,针对大数据的类域交叉性进行了一次核向量机差分比较,得到KNN模糊划分矩阵,根据所属类别的不同对已知样本进行分层,得到一维差分分层建树模型和二维差分分层建树模型,计算数据核向量之间的相似度特征,实现矩阵的数据点数模糊集合贴近度填充,实现聚类算法改进。仿真结果表明,该算法具有优越的大数据聚类性能,收敛性好,应用到网络在线故障诊断中,实现对故障信号的和恢复跟踪,提高了故障诊断效益,展示了较好的应用价值。  相似文献   

11.
近年来,大数据浪潮兴起,大数据产业保持高速发展态势,大数据应用推进势头良好。政府数据作为价值密度高、涉足广度宽的数据资源,已成为各国争相创新开发的重要资产。但是长期以来,关于政府数据开发利用的理论研究却被忽视,如何科学有效地进行政府数据开发和利用已成为当前需要迫切关注的问题。文章系统总结了当前主要发达国家政府数据开发利用的政策措施和探索实践,以及通过梳理分析我国政府数据开发利用的政策体系和发展现状,尝试构建政府数据开发利用的过程机制模型,并提出:加强顶层立法,落实制度保障;扩大数据来源,提升数据质量;统一汇聚开放,深化行业应用;确立认证许可,明晰授权机制;创新开发模式,明确收益分配;推动试点先行,探索可行经验;强化技术支撑,保障数据安全等政策建议,以期为进一步推动政府数据开发利用提供决策参考。  相似文献   

12.
社会发展中日渐增长的巨量信息(大数据)引起了人们的极大兴趣和关注,已成为当今IT界研究的热点,是继云计算、物联网之后IT产业面临的又一次颠覆性的技术革命。但目前大数据还处在发展初期,相关的研究和应用都还停留探索研究阶段。为充分利用好大数据,发挥其在社会发展中的应有作用,文章对大数据发展现状和相关问题进行梳理分析,提出相关意见建议,为大数据发展提供参考与指导。  相似文献   

13.
[目的/意义]科学数据安全是国家信息安全的组成部分,随着数据科学研究的兴起,高校科学数据安全的政策研究有待深入。[方法/过程]采用网络调查的方法,对美国U.S.News前50名大学的科学数据管理内容进行分析,从“涉及对象”“保护方法”和“科学数据生命周期”等角度梳理政策重点和空白点。基于科学数据生命周期,从“制度层”“基础设施层”“数据素养层”和“实施层”四个主要层次,构建了高校科学数据安全的内容框架,并分别讨论了科学数据生命周期不同阶段与科学数据安全相关的各个主体的职责。[结果/结论]高校科学数据安全内容贯穿科学数据生命周期,相关主体包括制度层、基础设施层、数据素养层、执行层。  相似文献   

14.
张学文 《情报杂志》2022,41(2):176-181,189
[研究目的]数据经济的迅猛发展,进一步突显了数据的财产权属性和商业化价值。因此,“商业数据”的类型提出和权属确认便对数据出境的法治化运行及安全责任的具体化落实具有重大意义。[研究方法]以“商业数据”的概念廓清与权属分析为切入,通过数据企业的“应然权利”为视角正向解析现有数据出境中限制性规定的规范边界和实践运行。[研究结论]数据权属是数据跨境规则建构的逻辑起点,数据企业基于数据劳动、数据生产而将数据自复杂的权益诉求中剥离时,理应享有法律所确认的数据权利而不受自由干预。据此,强调个人数据、重要数据“安全性”的同时,理应强化经由数据剥离后商业数据的“自由性”,以实现数据保护和数据开放的结构平衡。  相似文献   

15.
通过对电视灯光数据来源与特性的理解,阐述数据管理对灯光工作的作用与意义,以期引发业内人士对电视灯光数据管理的重视与思考。  相似文献   

16.
首先对大数据做简要诠释;其次重点阐述大数据在国内外各个领域的应用现状,以此来对大数据产业的发展、社会定位以及价值实现途径进行探索;最后分析我国大数据产业发展当中存在的主要问题并给出相关建议。  相似文献   

17.
开放科研数据环境下科研人员的数据伦理框架研究   总被引:1,自引:0,他引:1  
[目的/意义]为推动开放科研数据的发展,国内外除了已有的实践内容,包括数据政策颁布、数据基础设施建设等外,各国也均积极探索如何帮助科研人员克服与数据伦理有关的障碍,以辅助科学界实现预先设想的开放理念。[方法/过程]文章通过文献综述和网络调研的方法,分析了开放科研数据的实践进展,提出了数据伦理的概念和面向科研人员的数据伦理框架。[结果/结论]开放科研数据背景下数据伦理的框架主要由4个要素构成:利己主义因素、功利主义因素、利他主义因素及实用主义因素。  相似文献   

18.
元数据以其对科学数据的描述与解释,为用户发现数据和再利用数据提供了方便。详细分析科学数据元数据的功能与内容,重点讨论用户在数据发现、数据评价过程中所关注的元数据内容,并对科学数据元数据内容的改进与完善提出展望。  相似文献   

19.
现有"大数据观"是在先入为主的情况下形成的,存在一些偏差或错误,有必要加以辨析、纠偏。从大数据概念角度分析,不能将数据规模的大小作为衡量大数据的标准,不必强调大数据与小数据之间的区分与对立,而应该推动不同数据的多元融合。从大数据功能角度分析,"让大数据发声""大数据革命""数据为王"等表述,夸大了大数据的作用,关于大数据功能的定位也不准确;其实,大数据同样存在缺陷和不足,它的功能是有限的,甚至还可能会带来危害。  相似文献   

20.
【目的/意义】对高校科研数据展开治理,是提升数据价值,优化决策能力,节约科研成本的有效途径,而实施治理行为的重点之一是构建高校科研数据治理模型,从而在理论上指导治理行为。【方法/过程】研究以协同治理理论辅以数据生命周期理论和利益相关者理论为基础,在探明已有数据治理模型逻辑路线后,通过半结构化访谈法,对国内外高校人员就科研数据治理认知进行深度沟通,最终利用NVivo 11软件对访谈结果进行质性分析,提炼模型构建要素。【结果/结论】据此分模块构建高校科研数据治理模型,拟为高校科研数据治理提供理论模型,同时也为提升高校科研数据治理服务水平提供借鉴。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号