衡量GPU的计算能力

2019年4月28日下午2:47

1)数据从 CPU 的内存拷贝到 GPU 的内存．
2) CPU 把计算指令传送给 GPU
3) GPU 把计算任务分配到各个 CUDA core 并行处理
4) 计算结果写到 GPU 内存里, 再拷贝到 CPU 内存里.
除了时钟的速度, 衡量GPU计算能力的其它几个重要参数是:
(CUDA cores) 并行计算的核心处理器的数目. (类似轮船的吨位)
内存大小 (类似港口的大小).
内存带宽 (Bandwidth, 指数据传输的速度, 类似轮船装卸货的速度)
GPU\CPU之间通讯的带宽. (类似从港口到火车/卡车上的装卸货的速度)
任何一个技术参数过慢, 都可能成为妨碍计算能力进步的瓶颈.
反过来说, 提高计算能力的关键, 在于改进提高计算过程中的瓶颈.