Матеріал з Вікіпедії — вільної енциклопедії.
Hoper — кодова назва мікроархітектури графічних процесорів, розробленої Nvidia в якості наступника архітектури Ampere, яка була випущена в 2022 році. Вона названа на честь Ґрейс Мюррей Гоппер (англ. Grace Murray Hopper) — американської вченої у галузі комп'ютерних наук та контр-адмірала військово-морських сил США, що була одною з перших програмістів комп'ютера Марк I.
Порівняльна таблиця GP100, GV100, GA100 та GH100[1][2]
GPU features
|
NVIDIA Tesla P100
|
NVIDIA Tesla V100
|
NVIDIA A100
|
NVIDIA H100
|
GPU codename
|
GP100
|
GV100
|
GA100
|
GH100
|
GPU architecture
|
NVIDIA Pascal
|
NVIDIA Volta
|
NVIDIA Ampere
|
NVIDIA Hopper
|
Compute capability
|
6.0
|
7.0
|
8.0
|
9.0
|
Threads / warp
|
32
|
32
|
32
|
32
|
Max warps / SM
|
64
|
64
|
64
|
64
|
Max threads / SM
|
2048
|
2048
|
2048
|
2048
|
Max thread blocks / SM
|
32
|
32
|
32
|
32
|
Max Thread Blocks / Thread Block Clusters
|
N/A
|
N/A
|
N/A
|
16
|
Max 32-bit registers / SM
|
65536
|
65536
|
65536
|
65536
|
Max registers / block
|
65536
|
65536
|
65536
|
65536
|
Max registers / thread
|
255
|
255
|
255
|
255
|
Max thread block size
|
1024
|
1024
|
1024
|
1024
|
FP32 cores / SM
|
64
|
64
|
64
|
128
|
Ratio of SM registers to FP32 cores
|
1024
|
1024
|
1024
|
512
|
Shared Memory Size / SM
|
64 KB
|
Configurable up to 96 KB
|
Configurable up to 164 KB
|
Configurable up to 228 KB
|
Матриця порівняння підтримки точності обчислень[3][4]
|
Supported CUDA Core Precisions
|
Supported Tensor Core Precisions
|
FP8
|
FP16
|
FP32
|
FP64
|
INT1
|
INT4
|
INT8
|
TF32
|
BF16
|
FP8
|
FP16
|
FP32
|
FP64
|
INT1
|
INT4
|
INT8
|
TF32
|
BF16
|
NVIDIA Tesla P4
|
Ні |
Ні |
Так |
Так |
Ні |
Ні |
Так |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні
|
NVIDIA P100
|
Ні |
Так |
Так |
Так |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні
|
NVIDIA Volta
|
Ні |
Так |
Так |
Так |
Ні |
Ні |
Так |
Ні |
Ні |
Ні |
Так |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні |
Ні
|
NVIDIA Turing
|
Ні |
Так |
Так |
Так |
Ні |
Ні |
Так |
Ні |
Ні |
Ні |
Так |
Ні |
Ні |
Так |
Так |
Так |
Ні |
Ні
|
NVIDIA A100
|
Ні |
Так |
Так |
Так |
Ні |
Ні |
Так |
Ні |
Так |
Ні |
Так |
Ні |
Так |
Так |
Так |
Так |
Так |
Так
|
NVIDIA H100
|
Ні |
Так |
Так |
Так |
Ні |
Ні |
Так |
Ні |
Так |
Так |
Так |
Ні |
Так |
Ні |
Ні |
Так |
Так |
Так
|
Позначення:
- FPnn: floating point with nn bits
- INTn: integer with n bits
- INT1: binary
- TF32: TensorFloat32
- BF16: bfloat16
Порівняння потужностей декодування
Відео
|
H.264 decode (1080p30)
|
H.265 (HEVC) decode (1080p30)
|
VP9 decode (1080p30)
|
V100
|
16
|
22
|
22
|
A100
|
75
|
157
|
108
|
H100
|
170
|
340
|
260
|
Зображення/сек[2]
|
JPEG 4:4:4 decode(1080p)
|
JPEG 4:2:0 decode(1080p)
|
A100
|
1490
|
2950
|
H100
|
3310
|
6350
|
|
---|
|
| |
|
---|
|
Серія GeForce |
|
---|
| Серія nForce |
|
---|
| Технології |
|
---|
|
| |
|
|