1 / 15
文档名称:

三峡大学.ppt

格式:ppt   大小:1,424KB   页数:15页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

三峡大学.ppt

上传人:majx0413 2020/12/25 文件大小:1.39 MB

下载得到文件列表

三峡大学.ppt

相关文档

文档介绍

文档介绍:三峡大学
徐洋
报告内容
1、射电信号交叉关联GPU加速
2、银河系整体消光——贝叶斯定理GPU加速
射电信号交叉关联GPU加速
GPU的性价比越来越高,能耗越来越低,随着官方开发工具的逐步升级,学****及开发难度逐渐降低。
研究背景
研究内容
1、单GPU关联模型的建立及测试
2、GPU集群关联模型的建立及测试
射电干涉仪阵列规模的不断扩大带来了海量的数据处理需求,该需求的实时处理对传统解决方案的性能和成本等带来巨大的挑战,针对该挑战,我们提出了GPU解决方案。
射电信号交叉关联GPU加速
GPU与CPU架构的区别
射电信号交叉关联数据处理流程
FFT:快速傅里叶变换
CMAC:复数的乘累加
射电信号交叉关联GPU加速
单GPU模型的建立
CMAC GPU实现模型
射电信号交叉关联GPU加速
B(B+1)/2
射电信号交叉关联GPU加速
单GPU模型的测试
天线个数
256个
天线极化个数
2极
单位数据的长度
8个数据点
累加次数
1024次
主机拷入数据到设备(源数据)
32MB
设备拷出数据到主机(结果)

计算量

CMAC阶段测试数据参数及规模
射电信号交叉关联GPU加速
单GPU模型的测试
分块大小
128
256
512
1024
同步方式
主机到设备(ms)




CMAC(ms)




设备到主机(ms)




总时间(ms)




吞吐率(Gflops)
560
597
616
613
异步方式
总时间(ms)



14
吞吐率(Gflops)
747
802
751
616
基于GTX580单GPU的CMAC测试结果
“分块”即对累加过程分多次进行,测试结果性能最好的情况为异步方式下分块大小为256时的802GFLOPS,约为GTX580理论峰值的51%,还有一定的提升空间。
射电信号交叉关联GPU加速
GPU集群模型的建立
Recv1
Recv2
Recvi

FFT1
FFT2
FFTi

CMAC1
CMAC2
CMACi

M个接收节点
N个FFT节点
K个相关节点
交叉相关GPU集群模型
射电信号交叉关联GPU加速
GPU集群模型的测试
GPU集群基本处理过程测试(串行方式)
节点类型
处理阶段
时间(ms)
部分总时间(ms)
总时间(ms)
FFT节点
接收数据
23
23
78
拷入显存

32
数据重组1

FFT

转置

数据重组2

拷出显存
23
发送数据
23
23
CMAC节点
接收数据
28
28
78
数据重组3


拷入显存
16
38
CMAC

拷出显存