期刊专题 | 加入收藏 | 设为首页 12年实力经营,12年信誉保证!论文发表行业第一!就在400期刊网!

全国免费客服电话:
当前位置:首页 > 免费论文 > 管理论文 > 工商管理 >

无线电通用计算及性能分析

一、基于CUDA技术实现GPU通用计算与CPU的性能比较

1.1CUDA架构下程序流程仿真程序将做二维N阶随机矩阵的FFT快速傅里叶变换,程序调用了CUFFT库中的cufftExecC2C(cufftHandleplan,cufftComplex*idata,cufftComplex*odata,intdirection)基于复数的快速傅里叶变换函数实现FFT计算,不同的N将得有不同的计算速度,可以得到使用CU-DA技术时的计算时间,同时与不使用CUDA的基于CPU的计算时间比较,观察CUDA对FFT的加速效果。1.2试验方法由于CUDA技术比较适合并行计算,仿真程序将FFT的以不同的点数计算结果作比较,观察CPU和GPU在N取不同值时的表现。为了排除平台中其他程序的运行造成的对结果的影响,在MATLAB的仿真环境中,使用CPU计算的时候直接调用了MATLAB的二维快速傅里叶变化函数fft2(),使用GPU计算时适用了程序fft2withcu-daacc(),该函数通过MATLAB的MEX功能接口调用了CUFFT的快速傅里叶变换函数cufftExecC2C。

二、试验结果分析

仿真平台采用主流PC平台THINKPADSL400电脑,其CPU是INTEL酷睿二代双核处理器T5870,GPU是NVIDIAGeForceG105M,GPU拥有8个处理核心。计算二维128、512、1024和2048阶随机矩阵的FFT。利用MATLAB的计时功能函数(tic,toc),实现对快速傅里叶变换的计时。在试验中发现,当处理的数据比较小时,基于GPU和基于CPU的二维快速傅里叶变换速度没有太大区别,这是因为这时候的数据量没有使GPU和CPU满负荷功能工作,不能很好的体现两者的区别,但是当提高二维随即矩阵的阶数时,随着数据量的增大,基于GPU和基于CPU的计算速度有了区别,说明当两者满负荷工作的时候,基于GPU的数据处理由于启用的多线程并行处理,可以实现高度的并行操作,可以在较短的时间内完成数据的处理。从MATLAB的仿真结果来看,使用CUDA架构的GPU对数字信号处理中的FFT快速傅里叶变换有着比较明显的加速效果。

三、小结

在仿真实验中,选择了具有高密度乘法和加法运算的FFT快速傅里叶变换,观察CPU和GPU在高密度乘法加法运算上的计算能力,即使GPU板卡的运算速度等于CPU的计算速度,在实际的应用中也会有很好的应用价值。仿真所得出的结果是GPU板卡比CPU处理相等数据量的乘法和加法运算要快三倍以上,就是说如果在工作站中扩展两块GPU板卡,GPU的计算能力将是CPU的六倍以上。如果是在计算机集群中,一台工作站安装了两块板卡就可以节省多台计算机节点,这样在虚拟无线电的集群计算机中,就可以明显的减少计算节点的数量。节省大量的财力,达到降低成本和系统体积的目的。

作者:席宁 单位:辽宁石化职业技术学院


    更多工商管理论文详细信息: 无线电通用计算及性能分析
    http://www.400qikan.com/mflunwen/gllw/gsgl/90496.html

    相关专题:swot分析优势 畜牧业论文


    上一篇:皮影造型艺术论文
    下一篇:信息技术在网络的应用

    认准400期刊网 可信 保障 安全 快速 客户见证 退款保证


    品牌介绍