首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
在流媒体大数据调度中,因路径损耗较大,产生调度延时和频谱失真,需要对路径损耗进行优化评估,提高对流媒体大数据库的访问速度和检索定位。提出一种基于交叉集聚变异最小延时的流媒体大数据调度路径损耗评估模型,基于遗传算法设计流媒体数据集聚调度模型,得到流媒体数据调度的位置变换策略。确定流媒体数据编码方案,构建流媒体网络通信代价矩阵控制的数据调度路径损耗模型,实现算法改进。实验结果表明,该模型能使流媒体数据调度路径损耗有效降低,优化流媒体数据传输,最终达到最小传输时延,避免了调度延时和失真。  相似文献   

2.
研究大型流媒体数据库的普适性调度问题,提高对数据库的优化访问和数据调度能力。传统方法采用遗传进化算法进行大型流媒体数据库的数据调度,数据库中海量信息流的分岔高维矢量特征不能得到有效利用,导致调度性能不好。提出一种基于混沌倍周期分岔的大型流媒体数据库普适调度算法,设计双态平稳的混沌倍周期分岔流媒体数据库调度模型,设置复激活函数,按实部和虚部分路对流媒体大数据库进行普适调度,提高数据库访问能力。仿真实验结果表明,该算法能有效提高流媒体数据调度数据吞吐量和调度成功率,普适性较好。  相似文献   

3.
在软件故障测试和数据库访问中,对非显著特征数据的挖掘是难点,通过对非显著特征数据的挖掘,处理数据分布比较稀疏且呈现模式分布不规则的数据访问问题。提出一种基于链距离估计的非显著特征数据挖掘算法,在时域上对链距离估计模型进行平移处理,给出非显著特征数据的离群因子概念,提取关联度主特征量,基于链距离估计结果,得到有效特征挖掘概率密度值,实现对非显著特征数据挖掘算法改进。仿真实验表明,该算法使得无论是不同密度的点簇相互靠近还是出现模式偏离的情况,都能有效的挖掘出非显著特征点,从而增强了数据挖掘算法的有效性和通用性,采用该法能有效提高非显著特征数据的挖掘性能,数据挖掘的命中率较高,在数据库访问和软件故障测试等领域具有应用价值。  相似文献   

4.
传统的粗糙集下挖掘算法挖掘能力有限,当海量数据类型多样化时,数据挖掘性能下降。提出一种基于绕点旋度修正的粗糙集下挖掘算法,在数据挖掘时,采用绕点的方法代表系统挖掘中的每个元素点,对于每个绕点,采用旋度评价的方法实现加权修正,通过绕点旋度修正的方法对所有的数据进行融合处理,提取出具体特征,建立数据库,采用迭代方法最大限度的提高挖掘性能。最后采用一组64维度的复杂数据进行测试实验,结果显示,基于绕点旋度修正的数据挖掘能够在大批量多样性数据时实现很好的数据挖掘,具有工程使用价值。  相似文献   

5.
只有对光纤网络异常数据快速有效的检测,才能保证光纤网络的正常通信。传统方法依据特征相似性进行光纤网络异常数据检测,当特征过于相近时,需添加很多模糊条件,导致实现过程复杂,效率低下,因此,提出一种基于改进遗传算法的光纤网络异常数据检测方法,通过调整交叉概率和变异概率改进遗传算法,避免算法陷入局部最优解。依据对遗传算法的分析,将光纤网络异常数据检测的问题转换成求取最优解的问题,采用改进遗传算法实现了对光纤网络异常数据的检测,并提出详细的遗传操作及实现过程。实验结果表明,该方法检测效果良好,检测效率及检测精度均高于传统算法。  相似文献   

6.
为了提高高维数据集合离群数据挖掘效率,在分析了传统的离群数据挖掘算法优点和缺点的基础上,提出了一种离群点检测算法,首先将非线性问题转化为高维特征空间中的线性问题,然后利用非线性数据变换进行维数约减,对从高维采样数据中恢复得到低维数据集,通过本文提出的离群数据假设,并结合本文给出的离群聚类方法对所得数据对象投影分量是否是离群数据进行判别。仿真实验的结果表明了该方法能够有效地发现高维数据集中的离群点。与此同时,该算法具有参数估计简单、参数影响不大等优点,为离群点检测问题的机器学习提供了一条新的途径。  相似文献   

7.
对大数据的频繁项集挖掘是关联规则挖掘的关键步骤,通过有效的频繁项挖掘提高大数据量数据库的访问效率。传统方法中对大数据的频繁项集挖掘采用FP-Growth的粗糙集挖掘算法,扩展性和容错性不好。提出一种基于贝叶斯粗糙集的大数据频繁项挖掘技术,引入后缀项表的概念,通过后缀项表的构建,保留频繁项集的完整信息。构建FP-Tree,生成闭频繁项集,计算样本的密度,并抽取高密度区域的点集作为聚类中心集合,进行后缀项表的构造,按支持度分成若干集合,对各约简集内的属性集合进行融合,用变精度粗糙集的贝叶斯粗糙进行数据挖掘算法改进,仿真结果表明,算法不受可变参数的影响,鲁棒性较高,数据挖掘的准确度较高,运行时间较短。算法将在人工智能和数据挖掘领域具有更广的应用前景。  相似文献   

8.
通过挖掘生物信息大数据,从生物信息大数据库中提取感兴趣的数据特征,分析生物信息大数据集的细节结构,提高对生物信息的采集、处理、存储、传播,分析能力。传统的生物信息大数据挖掘模型采用基于小波多窗谱提取的生物信息挖掘算法,由于生物特征的属性权重需求各异,数据挖掘精度不高,提出一种基于梯度采样局部收敛的生物信息大数据挖掘模型。首先构建生物信息大数据库模型和生物信息特征挖掘实体模型,采用提取采样局部收敛方法实现对数据挖掘模型的改进,通过求解最优输入控制序列以及索引系统最优目标函数,实现系统的控制输入和预测,使用梯度采样局部收敛的方法进行生物信息大数据挖掘检测,得到生物信息大数据的梯度采样局部收敛属性集合。仿真结果表明,能实时准确地实现对生物信息的储存、检索和分析,提高数据挖掘能力,收敛精度较高。  相似文献   

9.
针对旋转机械振动故障数据分类挖掘的效率极低、误差率大的问题。为此,提出基于相似性系数与粒子群算法融合的旋转机械振动故障数据优化挖掘方法。以故障数据之间的差异性为依据,对故障数据进行中心化、无量化及标准化处理,以此保证故障数据变量的统一性,为故障数据挖掘提供便利;依据相似系数理论,构建异常旋转机械振动故障数据库挖掘的数学模型,并采用粒子群算法对该模型进行求解,计算旋转机械振动故障数据库挖掘模型的最优解,实现并行数据库故障数据精确挖掘。实验结果表明,采用改进算法进行旋转机械振动故障数据优化挖掘,能够提高挖掘的速度与精度,提高算法鲁棒性,满足了机械振动故障数据库实际的应用需求。  相似文献   

10.
基于最优化网格分配的资源数据库访问控制   总被引:1,自引:0,他引:1  
对网络资源数据库的优化调度和访问控制是实现大型数据库管理和构建的关键技术,传统方法中采用非对称补偿的单模态资源数据库网络控制算法,受到网格分配不均衡的限制,访问控制性能不好。提出一种基于最优化网格分配的资源数据库访问控制方法,构建网格分配下的网络资源数据库结构模型,提取数据信息的最大熵,表征信号含有有用信息饱和量的有效特征,有效反映资源数据的特征信息,通过网格分配,求得的资源数据库的功率谱优化分配概率密度函数,通过概率分析生成具有反应数据显著特征的特定随机数产生序列,满足之前的概率密度的随机调配需求,实现最优化网格分配,实现资源数据库访问控制改进。仿真实验表明,该算法具有较好的资源数据库访问性能,控制精度较传统方法提升,控制的鲁棒性较好,在数据库访问和调度中应用价值高。  相似文献   

11.
基于Web的数据仓库与数据挖掘技术   总被引:14,自引:0,他引:14  
刘云  刘东苏 《情报理论与实践》2001,24(4):289-290,320
The paper discusses the Web-based data warehousing and data mining technologies, analyzes the similarities and differences between the traditional data warehousing and data mining and the Web-based data warehousing and data mining. The architecture of the Web-based data warehousing is presented. The problems that should be solved are pointed out and some solutions are given.  相似文献   

12.
开放科研数据环境下科研人员的数据伦理框架研究   总被引:1,自引:0,他引:1  
[目的/意义]为推动开放科研数据的发展,国内外除了已有的实践内容,包括数据政策颁布、数据基础设施建设等外,各国也均积极探索如何帮助科研人员克服与数据伦理有关的障碍,以辅助科学界实现预先设想的开放理念。[方法/过程]文章通过文献综述和网络调研的方法,分析了开放科研数据的实践进展,提出了数据伦理的概念和面向科研人员的数据伦理框架。[结果/结论]开放科研数据背景下数据伦理的框架主要由4个要素构成:利己主义因素、功利主义因素、利他主义因素及实用主义因素。  相似文献   

13.
数据挖掘技术可以帮助人们在海量的信息资源中提取隐含的、潜在的、有价值的信息,因此已经被引入到了处理爆炸式增长的档案信息资源中。而待挖掘的信息是否完整、规范直接关系到之后的挖掘质量。本文根据档案信息资源的现状以及档案数据的特性,在给出执行具体挖掘操作前的数据采集和数据预处理各个环节的概念描述的基础上,探讨各个环节的注意事项及具体实现方法。  相似文献   

14.
基于数据仓库的竞争数据管理系统   总被引:3,自引:1,他引:2  
刘玉照  曹君祥 《情报科学》2000,18(6):488-490
竞争数据管理系统的根本任务在于对竞争数据进行有效的收集、存储、处理,并提供面向工具的分析。数据仓库就提供了这样一个分析环境:它从业务管理系统中抽限数据,并将其转换、集成以及按不同的级别综合,以供进一步的信息分析和战略决策使用。数据仓库有三个基本的技术:数据仓库、联机分析处理(OLAP)、数据挖掘。  相似文献   

15.
[目的/意义]研究国外高校数据拥护者实践,为我国高校科研数据管理服务实践提供启示。[方法/过程]文章采用案例分析法和网络调查法。在分析数据拥护者计划产生背景的基础上,选取7所开展数据拥护者计划的高校,从数据拥护者的内涵和职责,角色和定位,以及项目构成要素对数据拥护者计划的基本情况等方面进行对比,并对数据拥护者社区的构成和运营管理进行分析,以了解高校数据拥护者计划的发展现状和特点。在研究国外高校数据拥护者计划的基础上,从学科针对性科研数据管理服务相关研究、数据政策支撑和高校科研数据管理服务实践等三个方面分析国内开展数据拥护者计划的基础。[结果/结论]结合国外高校数据拥护者实践案例,对我国高校科研数据管理服务提出建议,主要包括从对数据拥护者认可和奖励两个方面调动数据干系人参与科研数据管理的积极性,从筹备、招募、运营3个阶段建立数据拥护者社区。  相似文献   

16.
鉴于直接利用GPS数据分析道路车速存在比较大误差,本文提出利用数据融合技术来提高数据的可信度与准确度。在对数据融合技术进行简要介绍的基础上,重点分析探讨数据融合技术如何分析GPS采集的数据,主要采用关联检验方法来对GPS数据进行处理。最后,以对上海大众出租汽车公司提供的出租车GPS数据的处理为例,讨论了关联检验在GPS数据处理中的应用。  相似文献   

17.
[目的/意义]科学数据安全是国家信息安全的组成部分,随着数据科学研究的兴起,高校科学数据安全的政策研究有待深入。[方法/过程]采用网络调查的方法,对美国U.S.News前50名大学的科学数据管理内容进行分析,从“涉及对象”“保护方法”和“科学数据生命周期”等角度梳理政策重点和空白点。基于科学数据生命周期,从“制度层”“基础设施层”“数据素养层”和“实施层”四个主要层次,构建了高校科学数据安全的内容框架,并分别讨论了科学数据生命周期不同阶段与科学数据安全相关的各个主体的职责。[结果/结论]高校科学数据安全内容贯穿科学数据生命周期,相关主体包括制度层、基础设施层、数据素养层、执行层。  相似文献   

18.
谭立云  丁智斌  玉嘉邓 《现代情报》2009,29(12):120-122
本文通过构建图书借阅的数据仓库,建立了多维图书借阅数据集,使用数据挖掘中的决策树算法,对目标数据进行了分析,并从中得到了一些有关读者借阅图书的规则,可使图书馆了解读者借阅图书的特定取向,使得其在图书添加、图书摆放上更加合理,从而为读者提供方便,同时使图书馆对学校教学的辅助功能得到更加有效的发挥。  相似文献   

19.
数据仓库建模技术   总被引:1,自引:0,他引:1  
侯伟 《科技广场》2005,(2):80-83
维度模型设计是数据仓库研究中的一个重要问题。该文介绍了维度模型设计,分析几种维度桴型的特点,并对影响维度模型设计的有关因素进行了研究。  相似文献   

20.
大数据时代的数字图书馆异构数据集成研究   总被引:1,自引:0,他引:1  
在大数据时代,数字图书馆的数据处理及服务将会发生明显的变化,将从传统的信息查询、推送等服务转向在海量的数据中分析和挖掘出潜在有价值的信息,而关系型数据库的结构和机制不能很好地适应这种变化。针对数字图书馆在大数据背景下异构数据的集成问题,提出了基于NoSQL的中间件模型的数据集成方法。该方法有利于数字图书馆存储各种结构的数据,同时能够很好地适应海量数据分布式存储。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号