首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 133 毫秒
1.
高性能计算是计算科学的一个分支,研究并行算法和开发相关软件,并致力于开发高性能计算机。目前较为流行的并行程序设计模型为基于消息传递M P I(Message Passing interface)的编程模式,基于共享内存的O p e n M P模式和结合MPI+OpenMP的混合编程模型,以及利用GPU作为并行数据计算设备(GPU计算的模式就是在异构协同处理计算模型中,将CPU与GPU结合起来加以利用,应用程序的串行部分在CPU上运行,而计算任务繁重的部分则由GPU来加速)的MPI+OpenMP+CUDA的三级混合编程模型。本文基于中国科学院近代物理研究所超算中心的深腾7000G集群,进行GPU通用计算能力和并行编程模型的研究,采用MPI+CUDA多粒度混合编程模型,节点间使用MPI进行通信,  相似文献   

2.
针对多核机群系统的硬件体系结构特点,提出了节点间MPI消息传递、节点内部OpenMP共享存储的混合并行编程技术。该编程模型结合了两者的优点,更为有效地利用了多核机群的硬件资源。建立了单层混合并行的Jacobi求对称矩阵特征值算法。实验结果表明,与纯MPI算法相比,混合并行算法能够取得更好的加速比。  相似文献   

3.
针对多核机群系统的硬件体系结构特点,提出了节点间MPI消息传递、节点内部OpenMP共享存储的混合并行编程技术。该编程模型结合了两者的优点,更为有效地利用了多核机群的硬件资源。建立了单层混合并行的Jacobi求对称矩阵特征值算法。实验结果表明,与纯MPI算法相比,混合并行算法能够取得更好的加速比。  相似文献   

4.
随着多核处理器的普及,传统的串行编程方式已无法充分利用多核处理器资源,业界提出了用并行编程模型解决此类问题的多种方法,OpenMP便是其中一种。OpenMP并行编程模型提供了一种可以通过编译语句对现有串行程序进行并行化运行的方法,提高了现有程序对计算机处理器的利用率。基于OpenMP探讨大型稀疏矩阵转置分别在串行编程模型与并行编程模型中计算机处理器的利用率,针对矩阵转置中数据相关性进行加锁操作,通过实验数据分析总结OpenMP并行编程模型的设计方案。  相似文献   

5.
并行编程环境与工具   总被引:2,自引:0,他引:2  
随着多核技术的发展,并行计算及并行编程日益成为人们关注的焦点.文章主要介绍了并行计算的概念及并行机的体系结构,讨论了并行编程的环境与工具.  相似文献   

6.
有限元方法是一种灵活而高效的数值求解偏微分方程的计算方法,是工程分析和计算中不可缺少的重要工具之一。在计算机技术的快速发展使得并行机的价格日益下降的今天,并行有限元计算方法受到了学术界和工程界的普遍关注。讨论了基于MPI+FreeFem++的有限元并行计算环境的构建,阐述了在该环境下有限元并行程序的编写、编译及运行等过程,并通过具体编程实例,说明了MPI+FreeFem++环境下的有限元并行编程的简单和高效。  相似文献   

7.
论述了图像校正算法的并行集群实现方法。针对图像复原问题,对复原算法结构与流程的并行处理进行研究,提出了整体数据传输、按行分片计算复原的并行处理方法。该方法在基于MPI的计算机并行集群系统中的8个计算节点上通过了测试,给出了集群校正实验结果和MPI并行计算时空图。实验结果表明,基于集群计算的并行复原方法十分有效,可缩短计算时间,提高计算效率。  相似文献   

8.
这篇论文介绍了SMARTMAP,一种实现了虚拟内存固定偏移编址的操作系统技术。SMARMAP可以让应用程序在多核处理器上直接访问对方的内存,而不需要额外的内核开销。当这种方法应用到MPI上的时候,SMARTMAP消除了所有由UNIX共享内存策略造成的内存到内存的拷贝。此外SMARTMAP可以方便地支持UNIX共享内存所不支持的操作,比如直接原地的MPI减操作,以及单边的取值赋值操作。  相似文献   

9.
为提高BP神经网络算法的运行效率,利用遗传算法和并行编程思想,提出了Hadoop平台下基于MapReduce的遗传算法优化BP神经网络的并行化设计及实现方法。利用遗传算法优化BP神经网络的初始权值和阈值,提高算法分类准确率;采用MapReduce并行编程模型实现算法的并行化处理,解决BP神经网络在处理大规模样本数据集时存在的硬件开销和通信开销大的问题。选用Caltech256图像数据集,与传统的串行遗传算法优化BP神经网络算法实验对比,验证了并行化GA BP神经网络算法的优越性。  相似文献   

10.
针对共享存储式(SMP)并行处理机的特点,以PowerChallengeXL并行处理机为例,对并行编程所涉及到的影响并行性能的因素以及程序并行的方式进行了探讨.结果表明,在编程的过程中,通过减少并行开销、解决负载不均衡以及选择合理的并行粒度,可提高并行程序的加速比,改善机器的运行效能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号