Hopper (мікроархітектура)

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Nvidia Hoper
Процес виробництва (нм) TSMC 4 нм
Попередник Ampere

Hoper — кодова назва мікроархітектури графічних процесорів, розробленої Nvidia в якості наступника архітектури Ampere, яка була випущена в 2022 році. Вона названа на честь Ґрейс Мюррей Гоппер (англ. Grace Murray Hopper) — американської вченої у галузі комп'ютерних наук та контр-адмірала військово-морських сил США, що була одною з перших програмістів комп'ютера Марк I.

Спроможності[ред. | ред. код]

Порівняльна таблиця GP100, GV100, GA100 та GH100[1][2]

GPU features NVIDIA Tesla P100 NVIDIA Tesla V100 NVIDIA A100 NVIDIA H100
GPU codename GP100 GV100 GA100 GH100
GPU architecture NVIDIA Pascal NVIDIA Volta NVIDIA Ampere NVIDIA Hopper
Compute capability 6.0 7.0 8.0 9.0
Threads / warp 32 32 32 32
Max warps / SM 64 64 64 64
Max threads / SM 2048 2048 2048 2048
Max thread blocks / SM 32 32 32 32
Max Thread Blocks / Thread Block Clusters N/A N/A N/A 16
Max 32-bit registers / SM 65536 65536 65536 65536
Max registers / block 65536 65536 65536 65536
Max registers / thread 255 255 255 255
Max thread block size 1024 1024 1024 1024
FP32 cores / SM 64 64 64 128
Ratio of SM registers to FP32 cores 1024 1024 1024 512
Shared Memory Size / SM 64 KB Configurable up to 96 KB Configurable up to 164 KB Configurable up to 228 KB

Матриця порівняння підтримки точності обчислень[3][4]

Supported CUDA Core Precisions Supported Tensor Core Precisions
FP8 FP16 FP32 FP64 INT1 INT4 INT8 TF32 BF16 FP8 FP16 FP32 FP64 INT1 INT4 INT8 TF32 BF16
NVIDIA Tesla P4 Ні Ні Так Так Ні Ні Так Ні Ні Ні Ні Ні Ні Ні Ні Ні Ні Ні
NVIDIA P100 Ні Так Так Так Ні Ні Ні Ні Ні Ні Ні Ні Ні Ні Ні Ні Ні Ні
NVIDIA Volta Ні Так Так Так Ні Ні Так Ні Ні Ні Так Ні Ні Ні Ні Ні Ні Ні
NVIDIA Turing Ні Так Так Так Ні Ні Так Ні Ні Ні Так Ні Ні Так Так Так Ні Ні
NVIDIA A100 Ні Так Так Так Ні Ні Так Ні Так Ні Так Ні Так Так Так Так Так Так
NVIDIA H100 Ні Так Так Так Ні Ні Так Ні Так Так Так Ні Так Ні Ні Так Так Так

Позначення:

  • FPnn: floating point with nn bits
  • INTn: integer with n bits
  • INT1: binary
  • TF32: TensorFloat32
  • BF16: bfloat16

Порівняння потужностей декодування

Відео H.264 decode (1080p30) H.265 (HEVC) decode (1080p30) VP9 decode (1080p30)
V100 16 22 22
A100 75 157 108
H100 170 340 260
Зображення/сек[2] JPEG 4:4:4 decode(1080p) JPEG 4:2:0 decode(1080p)
A100 1490 2950
H100 3310 6350

Примітки[ред. | ред. код]

  1. NVIDIA A100 Tensor Core GPU Architecture (PDF). www.nvidia.com. Процитовано 18 вересня 2020.
  2. а б NVIDIA H100 Tensor Core GPU Architecture Whitepaper. NVIDIA.
  3. NVIDIA Tensor Cores: Versatility for HPC & AI. NVIDIA.
  4. Abstract. docs.nvidia.com.