Серверы NVIDIA DGX: A100, H100 и SuperPOD для машинного обучения и HPC

Серверы NVIDIA DGX: A100, H100 и SuperPOD для машинного обучения и HPC

NVIDIA DGX A100: Универсальная платформа для ИИ

Сервер NVIDIA DGX A100 — это флагманское решение для задач машинного обучения и высокопроизводительных вычислений (HPC). Оснащенный 8 GPU NVIDIA A100, он обеспечивает производительность до 5 петафлопс для обучения моделей ИИ.

Ключевые преимущества:

  • Архитектура Ampere: Поддержка Multi-Instance GPU (MIG) для разделения ресурсов.
  • Оптимизированное ПО: Предустановленные фреймворки (TensorFlow, PyTorch) и контейнеры NGC.
  • Масштабируемость: Возможность объединения в кластеры через NVLink и InfiniBand.

Пример использования: Компания Siemens Healthineers применяет DGX A100 для анализа медицинских изображений, сокращая время диагностики на 60%.

Сервер NVIDIA DGX A100 в дата-центре


NVIDIA DGX H100: Новое поколение вычислений

Сервер NVIDIA DGX H100 — это революционная платформа на базе GPU H100, созданная для экзафлопсных вычислений. С архитектурой Hopper он предлагает в 4 раза большую производительность, чем предыдущее поколение.

Особенности DGX H100:

  • Transformer Engine: Ускорение моделей на основе трансформеров (GPT-4, BERT).
  • NVLink 4.0: Пропускная способность до 900 ГБ/с между GPU.
  • DPX инструкции: Оптимизация для динамического программирования и биоинформатики.

Кейс применения: В проекте Earth-2 DGX H100 используется для климатического моделирования с разрешением 1 км².

Инфраструктура на базе NVIDIA DGX H100


NVIDIA DGX SuperPOD: Масштабируемая инфраструктура

Сервер NVIDIA DGX SuperPOD — это масштабируемое решение для создания суперкомпьютеров "под ключ". Один кластер SuperPOD объединяет до 140 узлов DGX, обеспечивая экзафлопсную производительность.

Преимущества SuperPOD:

  • Быстрое развертывание: Готовность к работе за 3-4 недели.
  • Единая экосистема: Интеграция с NVIDIA Base Command и Fleet Command.
  • Энергоэффективность: Оптимизация PUE (Power Usage Effectiveness) до 1.1.

Пример: Метавселенная NVIDIA Omniverse работает на кластерах SuperPOD, обрабатывая миллионы 3D-объектов в реальном времени.

Кластер NVIDIA DGX SuperPOD


Сравнение серверов DGX

Характеристика DGX A100 DGX H100 DGX SuperPOD
GPU 8x A100 8x H100 До 140 узлов (A100/H100)
Производительность 5 PFLOPS 20 PFLOPS 1+ EFLOPS
Память 640 GB HBM2 1 TB HBM3 Масштабируемая
Целевое применение Корпоративный ИИ Экзафлопсные задачи Суперкомпьютеры

*PFLOPS = петафлопс; EFLOPS = экзафлопс


Заключение

Серверы NVIDIA DGX — A100, H100 и SuperPOD — предлагают решения для любых задач: от локального обучения моделей до создания экзафлопсных суперкомпьютеров.

  • DGX A100: Идеален для стартапов и корпоративных исследований.
  • DGX H100: Выбор для работы с GPT-4 и сложными симуляциями.
  • SuperPOD: Основа для национальных лабораторий и метавселенных.

Выбор зависит от масштаба задач: A100 подойдет для большинства проектов ИИ, H100 — для прорывных исследований, а SuperPOD — для глобальной инфраструктуры.


Наши предложения:

Dell PowerEdge C6220 II A2

Категория товара
Сервер
DGX/HGX/PCI/AMD
PCI Express
Форм-фактор
2U
GPU
A2
Макс. кол-во GPU
2
Серия CPU
Intel Xeon E5-2600
Кол-во CPU
1
Кол-во дисков
12
Форм фактор дисков
2,5 дюйма / 3.5 дюйма
Кол-во DIMM
16
Производитель
Dell
Тип охлаждения
Воздушное охлаждение
Платформа сервера
x86
Сертифицирован Nvidia
Да
GPU Type
  • A2
  $0
шт

Lenovo ThinkSystem SR665 L40 A40 H100 A100 MI210 A30 L4

Категория товара
Сервер
DGX/HGX/PCI/AMD
PCI Express
Форм-фактор
2U
GPU
H100 / MI210 / A100 / A40 / A30 / L4 / L40
Макс. кол-во GPU
6
Серия CPU
AMD EPYC 7003 / AMD EPYC 7002
Кол-во CPU
2
Кол-во дисков
32
Форм фактор дисков
2,5 дюйма
Кол-во DIMM
32
Артикул
7D2V100BNA
Производитель
Lenovo
Тип охлаждения
Воздушное охлаждение
Платформа сервера
x86
Сертифицирован Nvidia
Да
GPU Type
  • H100
  • MI210
  • A100
  • A40
  • A30
  • L40
  • L4
  $0
шт

GIGABYTE G242-Z11 Rev. A00 A100 T4

Категория товара
Сервер
DGX/HGX/PCI/AMD
PCI Express
Форм-фактор
2U
GPU
A100 / T4
Макс. кол-во GPU
4
Серия CPU
AMD EPYC 7003 / AMD EPYC 7002
Кол-во CPU
1
Кол-во дисков
6
Форм фактор дисков
2,5 дюйма / 3.5 дюйма
Кол-во DIMM
8
Артикул
6NG242Z11MR-00-A
Производитель
GIGABYTE
Тип охлаждения
Воздушное охлаждение
Платформа сервера
x86
Сертифицирован Nvidia
Да
GPU Type
  • A100
  • T4
  $0
шт

GIGABYTE E152-ZE0 Rev. A00 A100 A16 A2

Категория товара
Сервер
DGX/HGX/PCI/AMD
PCI Express
Форм-фактор
1U
GPU
A100 / A16 / A2
Макс. кол-во GPU
2
Серия CPU
AMD EPYC 7003 / AMD EPYC 7002
Кол-во CPU
1
Кол-во дисков
4
Форм фактор дисков
2,5 дюйма
Кол-во DIMM
8
Артикул
6NE152ZE0MR-00-A
Производитель
GIGABYTE
Тип охлаждения
Воздушное охлаждение
Платформа сервера
x86
Сертифицирован Nvidia
Да
GPU Type
  • A100
  • A16
  • A2
  $0
шт