GPU 架构:
NVIDIA Blackwell 架构
CUDA 平行处理核心:
24,064
NVIDIA RT 核心:
188 (第四代)
FP4 Tensor 核心:
4 PFLOPS
FP8 Tensor 核心:
2 个 PFLOPS
FP16 | BF16 Tensor 核心:
1 PFLOP
TF32 Tensor 核心:
234 每秒浮点运算次数
单精度性能 (FP32):
120 每秒浮点运算次数
顶尖 RT 核心性能:
355 每秒浮点运算次数
GPU 内存:
96 GB GDDR7
内存接口:
512 位
记忆体带宽:
1597 GB/s