首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   17篇
  免费   0篇
  国内免费   1篇
教育   11篇
科学研究   2篇
综合类   5篇
  2019年   1篇
  2016年   1篇
  2014年   4篇
  2013年   7篇
  2012年   3篇
  2011年   2篇
排序方式: 共有18条查询结果,搜索用时 15 毫秒
1.
针对扩频信号捕获中计算量大和运算速度慢的问题,提出基于图形处理器(GPU)加速的捕获方法,将基于循环相关的捕获算法转化为计算统一设备架构(CUDA)线程块执行过程,使扩频捕获过程完全在GPU中加速执行,在保持原有扩频信号捕获概率的同时,显著提高了算法的运算速度.实验结果表明,基于GPU的捕获方法有效地提高了系统的执行效率.  相似文献   
2.
通过分析AC多模式匹配算法和正则语句搜索匹配在功能上的优劣,研究它们在生成确定性有穷自动机时的相同与差异,融合AC算法和正则语句运用于文本的多模式串匹配,使得AC算法能够识别正则语句,并且保持原有算法在匹配失败后,目标模式串指针不回退且AC自动机回退少的特点,使得算法兼有二者优点. 同时,讨论了在GPU上通过CUDA的并行程序环境实现算法的并行化,并详细比较了在GPU上利用不同类型存储器实现的算法的性能差异.  相似文献   
3.
序列最小优化算法(Sequential Minimal Optimization,SMO)是针对支持向量机算法执行速度慢而提出来的,它通过最小化分块来加速算法,对不同数据集来说,其算法加速可达100x~1 000x。但是随着数据量的增大,其算法执行时间仍然较慢。为了加速算法,本文结合现代较发达的图形处理单元(Graphics Processing Unit,GPU)计算,通过多处理器并行执行方式,提出对算法并行化。主要的并行点在于确定了两个参数α_1、α_2之后,求解局部最优,从而更新所有参数的过程是天然并行的,而且SIMD形式的并行性非常符合GPU的运算模式,通过将计算量大的参数更新部分转移到GPU进行计算,可以加速整个算法的运行。实验表明,并行算法可以达到150倍的加速效果。  相似文献   
4.
本文阐述了GPU并行运算的一种主流架构——CUDA架构,包括CUDA编程模型、程序的运行模式、线程架构、存储器结构、指令结构等。  相似文献   
5.
由于GPU(Graphic Processing Unit)在图像处理方面的良好性能,国内外已经有很多专家学者在应用GPU进行图像的并行处理.基于CUDA(Compute Unified Device Architecture)这种并行计算平台,利用GPU的强大计算功能对Hough变换中最耗时的部分进行计算.实验表明,这种方法对Hough变换的并行化有很好的加速效果.  相似文献   
6.
本文采用OpenMP和CUDA技术,对蒙特卡洛算法进行并行化改进,以充分利用多核处理器和GPU的计算能力,通过对比算法改进前后的性能表现,可以看到采用OpenMP和CUDA技术,能够极大提高计算性能。借鉴该方法,我们可以在个人计算机上改进相关软件计算性能。  相似文献   
7.
分析了光线跟踪渲染算法在GPU上实现的流程;设计了CUDA平台上基于BVH加速结构的光线跟踪渲染引擎,针对CUDA架构的特点重新设计了BVH遍历算法和间接反射计算算法;并在四个场景和两种分辨率下针对GPU和CPU实现进行了详细对比测试。通过分析实验结果,基于GPU加速的光线跟踪算法在不同复杂度的场景下相比其CPU实现都有较高的性能提升。  相似文献   
8.
分析了均值滤波算法的并行特性,提出了一种基于计算统一设备架构(CUDA)的均值滤波图形处理单元(GPU)并行算法。算法首先依据椒盐噪声的特征,建立信号点标记矩阵;其次计算信号密度,并确定滤波半径;最后仅处理噪声像素,用其邻城内信号点像素灰度的均值代替它。实验结果表明,随着图像尺寸的增大,该并行算法相比串行算法速度,可以获得300倍以上的加速比。  相似文献   
9.
本文基于矩量法(MOM)中阻抗矩阵与入射角度的不相关性,提出将压缩传感(CS)技术引入电磁散射问题的方法,以达到在不降低计算精度的前提下减少计算时间的目的.该方法结合了压缩感知和计算统一设备架构(CUDA)技术,通过利用图形处理器(GPU)的并行计算解决了宽角度的电磁散射问题.数值计算结果表明,该方法与传统计算方法相比,在保持精度的同时,大大降低了计算所需的时间.  相似文献   
10.
为了提高蛋白质二级结构预测的效率,对具有完全学习策略的量子行为粒子群(CLQPSO)算法进行了研究,实现了一种融合混沌优化与完全学习策略的量子行为粒子群算法;通过在粒子群进化过程中对收缩扩张因子和局部吸引子的混沌优化,提高了敛速和精度.基于统一计算设备架构(CUDA ),利用GPU 的并行计算能力,将该算法并行化并应用到蛋白质二级结构预测中.实验表明:相比串行实现,该并行算法在对长度较短的残基序列进行蛋白质二级结构预测时,加速比可超过40.  相似文献   
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号