1 / 4
文档名称:

NVIDIAGPU结构(精).docx

格式:docx   大小:15KB   页数:4页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

NVIDIAGPU结构(精).docx

上传人:温柔的兰花 2022/9/5 文件大小:15 KB

下载得到文件列表

NVIDIAGPU结构(精).docx

相关文档

文档介绍

文档介绍:NVIDIAGPU结构
目前市场上的NVIDIA显卡都是基于Tesla架构的,分为G80、G92、GT200三个
系列。Tesla系统架构是一块拥有可扩展处器数目的办理器阵列。每个
GT200
GPU

包括

240个
NVIDIAGPU结构
目前市场上的NVIDIA显卡都是基于Tesla架构的,分为G80、G92、GT200三个
系列。Tesla系统架构是一块拥有可扩展处器数目的办理器阵列。每个
GT200
GPU

包括

240个流办理器(streamingprocessor,SP

每8个流办理器又组成了一个流


办理器(streamingmultiprocessor

’因sM此共有

30个流多办理器。

GPU

在工作时

,

工作
负载由

PCI-E

总线从

CPU

传入

GPU

显存,依据系统架构的层次自顶向下分

发。PCI-
规范中,每个通道上下行的数据传输速度达到了



,这样

PCI-


*16Gbit/s=10GB/s的带宽,故有效带宽为
8GB/S,而PCI-。但是因为PCI-E数据封包的影响,实质可用的带宽大体在5-6GB/s(PCI-。
在GT200架构中,每3个SM组成一个TPC(ThreadProcessingCluste线程办理器集群,而在G80架构中,是两个SM组成一个TPC,G80里面有8个TPC,因为G80
有128(2*8*8个流办理器,而GT200中TPC增添到了10(3*10*8个,此中,每个TPC
内部还有一个纹理流水线。
大多数时候,称呼streamingprocess。为流办理器,其实其实不太正确,因为若是
称streamingprocess。为流办理器的话,自然是隐式的与CPU相对,但是CPU有独立的一套输入输出机构,而streamingprocesso并无,不能够在GPU编程中使用printf
就是一个例证。将SM与CPU的查对照更加适合。和现在的CPU的核同样,SM也拥有
完好前端。
GT200和G80的每个SM包括8个流办理器。流办理器也有其余的名称,如线程办理器,核”等,而最新的Fermi架构中,给了它一个新的名称:CUDACore。SP并不是独立的办理器核,它有独立的寄存器和程序计数器(PC,但没有取指和调换单元来组成完好的前端(由SM供给。所以,SP更加近似于今世的多线程CPU中的一条流水线。SM每发射一条指令,8个SP将各执行4遍。所以由32个线程组成的线程束(warp是Tesla架构的最小执行单位。因为GPU中SP的频率略高于SM中其余单元的两倍,所以每两个SP周期SP才能对片内储藏器进行一次接见,所以一个warp中的32个线程又
能够分为两个

half-warp,

这也是为何取数会成为运算的瓶颈原

因。Warp

的大小对操作
延和缓访存延缓会产生影响,取

Warp

大小为

32是