期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《实验室研究与探索》2013,(11):78-81

云计算平台的建设对于信息相关学科的科研和教学均具有重要的意义。就如何在实验室中搭建基于Hadoop的分布式云计算平台进行了详细的说明,包括安装环境的搭建、Hadoop安装与部署、开发环境的建立等方面,对于建设云计算平台具有较好的指导意义。相似文献

2.

一种基于Hadoop平台的分布式数据检索系统

曹恒瑞曹展硕《教育技术导刊》2017,16(4):118-120

企业级检索不同于普通的数据检索和网站检索,它包括复杂结构的数据检索、安全检索、高可靠的查全和查准、智能化的数据检索服务和实时的数据更新服务等。虽然可以利用已有数据检索系统提供的站内数据检索功能来构建企业级数据检索系统,但这种站内检索功能难以满足绝大多数企业自身检索需求。随着大数据时代来临,为处理海量数据,建立大数据平台成为趋势,使用分布式文件存储系统,通过云计算技术来分析海量数据,开发企业级智能云检索系统是提高企业综合效益的关键。基于自然语言的智能云检索,研究开发了基于Hadoop平台的分布式数据检索系统,实现了分布式文件系统和传统关系数据库协同运行的高效数据检索系统。相似文献

3.

网上评卷海量图像数据云存储技术应用探析

《中国考试》2017,(6)

针对目前国家教育考试网上评卷海量图像文件的存储管理问题,本文提出基于Hadoop的No Sq L云存储方案,提高评卷海量数据安全性和存储可靠性,构建分布式、可扩展、高可用性和可靠性的云存储平台。通过分析基于Hadoop平台云计算体系和基于HDFS/HBase的云存储技术,结合网上评卷海量图像文件的存储需求和实际,规划基于Hadoop/HDFS/HBase的国家教育考试云存储中心的数据交换平台,并对在国家教育考试中深入应用此平台给出设计方案,提出发展愿景。相似文献

4.

基于Spark的云计算平台在实验室的应用与实现

张恬恬孙绍华《教育技术导刊》2018,17(4):191-193

随着数据挖掘逐渐被应用到金融、娱乐、商业和医疗等多个行业,近年来涌现出各种用于处理海量数据的数据处理引擎,如MapReduce、Spark等。为了使高校实验室更深入地进行数据挖掘领域的理论研究,简要阐述分析了Spark技术及HDFS的概念与基本原理,详细介绍了基于Spark的云计算平台配置方法和实现过程,并对平台搭建过程中遇到的问题进行总结。实验结果证明,该平台能够有效完成分布式数据处理任务。相似文献

5.

基于Hadoop平台的任务调度方案分析

周航申秋慧王迤冉《周口师范学院学报》2013,30(2):89-91

信息社会是数据爆炸的时代,分布式并行计算在应对海量数据处理等大作业方面非常有效.Apache基金会下的Hadoop正是这样一个开源的分布式系统基础构架.首先介绍了Hadoop平台下作业的分布式运行机制,然后对Hadoop平台自带的3种任务调度器做分析和比较,最后在分析JobTracker类文件的基础上指出了创建自定义任务调度器所需完成的工作. 相似文献

6.

基于Hadoop的旧电脑机房改造与实验内容更新

《实验技术与管理》2017,(5):144-146

利用Hadoop技术将老旧电脑组成分布式集群,做成大数据处理平台,并在此基础上建成多媒体通信实验室。该平台具有数据采集、数据处理和用户访问功能,成为一个完整的实验体系。平台硬件主要由ARM、FPGA等开发板与摄像头组成的IP摄像头和电脑搭建的分布式集群组成,IP摄像头获取的数据通过分布式集群存储,并通过交换机接入网络。用户能够通过网页客户端对Hadoop分布式运算平台进行访问。相似文献

7.

云计算环境下GML空间数据存储研究

李玲瑞《洛阳师范学院学报》2013,(11):64-68

从云计算的定义与云存储的数据模型,GML的空间数据特征等方面探究云计算环境下GML空间数据存储方法.搭建单机与分布式的平台并对两者的存储性能进行对比,得出云计算环境下对GML空间的海量数据存储和访问采用分布式的存储优于采用单机存储的结论. 相似文献

8.

K-means聚类算法在Spark平台上的应用

程国建赵倩倩《教育技术导刊》2016,15(2):146-148

随着人类产生的数据量呈指数级增长,数据的海量、多样化等特征使传统的聚类算法无法处理这些数据,而近来较为流行的Hadoop平台在处理数据的速度上也达到瓶颈。因此,专家们想要研究一种更为适合的处理平台来处理遇到的海量数据,Spark平台应运而生。首先介绍了聚类算法定义与分类,随后提出了Spark平台,包括Spark核心技术(RDD)、Spark和Hadoop的对比,并介绍了K means在Spark平台上的实现,最后总结了Spark的应用现状并对其未来发展进行了展望。相似文献

9.

基于HDFS的大数据文件传输实验设计

《实验室研究与探索》2019,(12)

随着云计算应用技术及相关研究的发展,云编程模式也有了新的技术革新。在高校校园网实验教学体系中,云平台的相关实验已经成为大数据分析等课程配套实验的主要内容。使用HDFS架构,搭建稳定、实用、符合实验课程体系的大数据实验平台,成为高校校园网实验研究的新课题。选用开源云计算平台Hadoop,作为基础平台进行大数据分析实验,搭建基本的实验平台,进行数据处理平台的优化处理。通过HDFS为分布式计算存储提供底层应用支持,实现NameNode和DataNode的通信,将用户通过数据块的方式将文件存储到节点中,及时处理客户端的读写请求,并在NameNode的统一调度下进行数据块的创建、删除、复制和映射。根据具体的实验方法,有针对性的制定实验流程。相似文献

10.

Hadoop和Spark在实验室中部署与性能评估

《实验室研究与探索》2015,(11):77-81

随着互联网技术的发展,数据量成爆炸性增长趋势,单机难以存储、组织和分析这些海量数据。面对单机难以处理海量数据的现状,建立分布式计算平台对于今后科研工作和实验教学具有重要的意义。就如何在实验室环境下搭建分布式计算平台做了详细说明并对hadoop和spark的性能进行比较,包括Hadoop和Spark集群的安装和部署,Spark集成开发环境的建立,同一组数据集在两个平台上进行Kmeans聚类的时间对比。对于建设分布式计算平台具有一定的指导意义。相似文献

11.

基于虚拟机的云计算管理平台

《中国教育网络》2011,(2):45-46

作品介绍采用虚拟化技术构建一个云计算平台方案,同时采用SpringSource中的软件工具,开发一套面向虚拟Hadoop集群的管理平台：vCirrus。通过该平台配合虚拟机,可以方便的搭建一个Hadoop集群,对该集群进行监测和管理,还可以收集大量的系统运行信息,为整个云计算系统的维护和优化提供较好的依据。相似文献

12.

基于Hadoop的数据聚类算法研究

徐正巧赵德伟《教育技术导刊》2015,14(2):4-5

聚类算法一直备受研究者青睐。随着信息技术和数据技术的发展,数据的种类和数量急剧增长,云计算平台Hadoop成为这些数据存储和处理的新平台,基于云计算平台Hadoop的聚类算法逐渐成为热门。针对数据挖掘中的聚类问题,依托云计算模式及Hadoop平台,研究了K-means算法,有效改变了现有算法的局限性。相似文献

13.

基于虚拟机的云计算管理平台

漫步云端团队《中国教育网络》2011,(Z1):45-46

作品介绍采用虚拟化技术构建一个云计算平台方案,同时采用SpringSource中的软件工具,开发一套面向虚拟Hadoop集群的管理平台:vCirrus。通过该平台配合虚拟机,可以方便的搭建一个Hadoop集群,对该集群进行监测和管理,还可以收集大量的系统运行信息,为整个云计算系统的维护和优化提供较好的依据。相似文献

14.

基于Hadoop技术的数字化校园海量数据存储系统研究与设计

《实验技术与管理》2015,(9)

基于Hadoop技术开发了数字化校园海量数据存储系统,提出了基于Hadoop的大数据存储模型。将整个系统设计为系统管理、业务应用、数据处理、数据采集等4个大模块,采用开源分布式数据处理框架,高效处理海量数据。系统具有可伸缩性、高可靠性、低成本和高效性等优点,解决了传统数据处理成本高、数据管理困难、可靠性低、效率低、并行处理程序编写困难等诸多问题。相似文献

15.

基于Hadoop的数字化校园设计与实现

陆丽婷《教育技术导刊》2014,13(10):15-17

高校是进行教学与科研的场所,随着云计算技术的发展,如何管理和利用产生的海量数据已成为当前研究的热点。设计了一个基于Hadoop云计算平台的数字化校园,其由4层体系构建,对该系统从结构、功能等方面进行了设计与分析。相似文献

16.

基于大数据的电能质量监测分析系统设计与实现

郭晓乾武守晓王承栋刘思宇《教育技术导刊》2009,19(8):182-185

为解决传统电能质量监测系统数据接入可靠性不高,海量数据存储和统计分析能力不足的缺点,采用类数据库的事务处理机制设计数据调度采集过程,搭建基于 Cloudera 大数据平台的电能质量监测分析系统,对数据进行分布式存储、计算分析,实现对 TB 级电能质量数据的监测点指标与运行状态统计,以及对暂态事件的统计聚合分析等功能。实验证明该系统可靠、海量数据统计处理能力强,提高了数据存储可拓展性,为供电方提供了解决海量电能质量数据存储与分析的有效方案。相似文献

17.

基于虚拟化技术的Hadoop集群搭建与应用

王伟陶然《教育技术导刊》2016,15(4):50-54

Hadoop作为云计算开源项目,已得到工业界和学术界的广泛认可。传统的Hadoop环境大多基于物理服务器,难以获取足够的实验场地和设备来建立Hadoop实验环境。同时,存在维护和管理代价高、资源浪费严重等问题。基于东华云平台,提出一种在单台物理服务器上运行多台虚拟机来创建虚拟化Hadoop环境的方法,即便只有一台服务器,也可以快速搭建Hadoop环境并进行基础实验,实验证明了该集群的可用性。相似文献

18.

基于Hadoop平台的K-means算法优化综述

孟佳伟孙红《教育技术导刊》2017,16(6):208-211

在科技高速发展的今天,海量数据处理问题受到人们广泛关注。将K means聚类算法与Hadoop平台相结合是处理海量数据问题的一条可靠途径。简单介绍Hadoop和K means算法以及K means聚类算法MapReduce并行化实现,并阐述目前Hadoop平台下K means算法的几种优化方式,最后提出研究展望。相似文献

19.

基于MapReduce的ROCK聚类算法

赵雪 ;陈龙飞《河北职业技术师范学院学报》2014,(1):26-32

随着大数据时代的到来,聚类分析算法将面临如数据量巨大、数据维数增加等挑战,分布式处理是解决这类问题的方法之一.本研究将ROCK算法与Hadoop平台相结合,按照分布式处理原则,通过计算机集群模式去处理大规模的多样性数据.实验证明,在Hadoop平台下的ROCK聚类算法很大程度上提升了对高维数据进行聚类的能力. 相似文献

20.

基于Hadoop生态系统的大数据解决方案

韩朵朵刘会杰许爱雪《石家庄铁路职业技术学院学报》2019,(2):71-75

作为深受开发者青睐的主流大数据平台,Hadoop在数据的处理、分析及应用上拥有着其他平台不可比拟的优势。在介绍了大数据定义和Hadoop生态系统架构的基础上,分别对基于Hadoop提出的大数据存储、分析、管理、安全及应用等关键问题的解决方案进行了研究和综述。最后,对基于Hadoop的大数据平台的研究和应用发展方向进行了展望。相似文献