现代GPGPU 架构汇总

2022-12-07,

本篇是GPGPU 架构汇总的总章,参考的是AMD公布OpenCL 手册,该手册总结了AMD. Nvdia 早年的GPGPU体系架构,以及Opencl 各个API 与硬件结构的映射关系。本篇除了整理这两家的GPU 架构,也会增加Intel dGPU的架构(牙膏厂终于回过神了。。。。)

对于现代的 GPU,通常的它的控制逻辑单元比较简单(和 cpu 相比), cache 也比较小 。

线程切换开销比较小,都是轻量级的线程

GPU 的每个“核”有大量的 ALU 以及很小的用户可管理的 cache。

内存总线都是基于带宽优化的。 150GB/s 的带宽可以使得大量 ALU 同时进行内存操作 。

*  AMD GPU 硬件架构

*  Nvdia GPU Femi 架构

*  Intel  GPU Gen11 架构

现代GPGPU 架构汇总的相关教程结束。

《现代GPGPU 架构汇总.doc》

下载本文的Word格式文档,以方便收藏与打印。