1 / 76
文档名称:

GPS掩星资料处理的GPU并行算法研究.pdf

格式:pdf   页数:76
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

GPS掩星资料处理的GPU并行算法研究.pdf

上传人:banana 2014/2/8 文件大小:0 KB

下载得到文件列表

GPS掩星资料处理的GPU并行算法研究.pdf

文档介绍

文档介绍:国防科学技术大学
硕士学位论文
GPS掩星资料处理的GPU并行算法研究
姓名:银福康
申请学位级别:硕士
专业:计算机科学与技术
指导教师:宋君强
2010-11
国防科学技术大学研究生院硕士学位论文
摘要
与传统的大气探测手段及一般气象卫星观测相比,GPS(Global Positioning
System)RO(radio occulation)技术能够提供全天候、无需校正、全球均匀分布、
高垂直分辨率的观测数据。将 GPS 掩星资料同化到数值天气预报(NWP)系统中,
对于提高 NWP 的准确性具有重要意义。目前在数值天气预报系统中应用 GPS 掩
星资料主要有两种方式:一是利用 GPS 掩星资料反演得到温度等基本大气参数,
再将这些参数同化到模式中;二是直接将 GPS 弯曲角或折射率资料直接同化到
NWP 的变分同化系统中。与反演方法相比,正演方法能够提供更高的精度。正演
方法通过使用正演模式(算子)由温度、湿度、压强等模式变量计算弯曲角和折
射率剖面的初估值。
在使用弯曲角或折射率的同化系统中每一次迭代都需要计算正演模式和伴随
模式。与折射率资料同化相比,弯曲角资料同化能够获得更为准确的大气初始状
态信息,但是正演模式中弯角观测算子的计算量比折射率观测算子大得多。每天
需要处理的有效掩星观测大约有 4000 个,计算量的巨大开销严重制约了弯曲角资
料同化在目前同化业务系统中的有效应用。国内外已有许多关于 GPS 掩星资料处
理的基于数据集或任务划分的并行算法研究,但都是采用 MPI(消息传递接口)
编程模型的粗粒度并行。近年来,GPU 以其强劲计算能力、高性价比和低能耗等
特点吸引了越来越多的领域科学家使用 GPU 来加速大规模科学计算任务,许多应
用取得了数十倍甚至上百倍的性能提升。掩星资料处理过程蕴含了大量的数据并
行性,非常适合利用具有大量硬件线程的 GPU 进行加速。
本文基于 GPU 平台研究了 GPS 掩星资料处理过程中正演模式的加速方法,主
要内容如下:
(1)深入分析了 NVIDIA GPU 体系结构特点以及 GPS 掩星探测原理;
(2)仔细研究并实现了 GPS 掩星资料处理正演模式的 GPU、CPU/GPU 并行
算法;针对 600 个廓线资料的处理,分别在单 GPU 和 3 节点的 CPU/GPU 异构集
群上进行了测试。实验结果表明,当正演模式包括梯度在内的计算时,分别获得
了 205 倍和 549 倍的性能提升;
(3)采用计算核心分解和合并、提高 SM 资源占用率、消除分支、异步执行、
弯角和弯角梯度优化等策略,对 GPS 掩星资料处理正演模式的 GPU 实现进行优化,
最终在正演模式包括梯度在内的计算时使其性能提高了 29%。

主题词:GPS 掩星,正演模式,GPU,MPI+CUDA
第 i 页
国防科学技术大学研究生院硕士学位论文
ABSTRACT
Unlike the conventional and satellite observations, the Global Positioning System
(GPS) radio occultation (RO) techniques provide all-weather, high-vertical-resolution
and global uniform coverage observations that require no calibration. Assimilating the
GPS RO data into the global numerical weather prediciton system (NWPs) has a great
siginificance for improving the accuracy of NWP. Currently, the GPS RO data is used
in the following two ways: (1) retrieving the basic atmospheric parameters from the
GPS RO data, and then assimilating these parameters into variational assimilation
system of NWPs; (2) directly assimilating the bending angle and refractive index
profiles in variational assimi