Ampere

资料

Ada Architecture

资料

ada vs ampere

  • H100/A100使用HBM3和HBM2e,因此内存带宽远高于RTX Ada系列;
  • RTX Ada有更高的non-Tensor Cores峰值性能,4090:80TFLops,A100:20TFLops,H100:67TFLops;
  • H100的Tensor Cores峰值性能远高于A100, Ada 4090;
  • Ada 4090的FP16性能是FP32的2倍,而其它卡FP32与FP16的峰值性能一样;

SM

  • 架构图
A100 SM Arch