Перейти к основному содержимому

Создать кластер Managed Kubernetes на облачном сервере с GPU

К кластеру Managed Kubernetes на облачном сервере можно добавить GPU (графические процессоры) — при создании кластера Managed Kubernetes на облачном сервере или добавлении группы нод на облачном сервере.

Посмотреть доступность GPU в регионах можно в матрице доступности GPU для Managed Kubernetes.

На нодах с GPU можно использовать предустановленные драйверы или установить драйверы самостоятельно. Для групп нод с GPU без драйверов недоступно автоматическое масштабирование кластера.

Создать кластер на облачном сервере с GPU

Используйте инструкцию Создать кластер Managed Kubernetes на облачном сервере.

Выберите:

  • конфигурацию — фиксированную конфигурацию группы нод с GPU;
  • драйверы GPU — по умолчанию тумблер Драйверы GPU включен и в кластере используются предустановленные драйверы. Чтобы установить драйверы GPU самостоятельно, отключите тумблер Драйверы GPU.

Доступные GPU

ПамятьCUDA ядраТензорные ядра

NVIDIA® A100 40Gb

40 ГБ
HBM2

6192432
NVIDIA® A100 80Gb80 ГБ
HBM2
6912432
NVIDIA® Tesla T416 ГБ
GDDR6
2560320
NVIDIA® A3024 ГБ
HBM2
3804224
NVIDIA® A2
(обновленный аналог
NVIDIA® Tesla T4)
16 ГБ
GDDR6
128040
NVIDIA® GTX 10808 ГБ
GDDR5X
2560
NVIDIA® RTX 2080 Ti11 ГБ
GDDR6
4352544
NVIDIA® RTX 4090 24 Gb24 ГБ
GDDR6X
16384512
NVIDIA® RTX 4090 48 Gb48 ГБ
GDDR6X
16384512
NVIDIA® RTX 6000 Ada
(аналог L40)
48 ГБ
GDDR6X
18176568
NVIDIA® A2000
(аналог RTX 3060)
6 ГБ
GDDR6
3328104
NVIDIA® A5000
(аналог RTX 3080)
24 ГБ
GDDR6
8192256
NVIDIA® H10080 ГБ
HBM3
16896528
NVIDIA® H200141 ГБ
HBM3e
16896528
NVIDIA® L424 ГБ
GDDR6
20480640
NVIDIA® RTX 6000 Pro48 ГБ
GDDR7
18432576

Посмотреть актуальный список GPU можно в панели управления: в верхнем меню нажмите ПродуктыManaged KubernetesСоздать кластер → этап Группы нодОблачный сервер Конфигурация нодыФиксированная с GPU.

Посмотреть доступность GPU в регионах можно в матрице доступности GPU для Managed Kubernetes.

NVIDIA® A100 40Gb

Обладает максимальной производительностью для AI, HPC и обработки данных. Подходит для глубокого обучения, научных исследований и аналитики данных.

На базе архитектуры Ampere®, пропускная способность до 1,5 ГБ/с. Посмотрите подробные характеристики NVIDIA® A100 40Gb в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 8 GPU × 40 ГБ, при vCPU от 6 до 48, RAM от 87 до 704 ГБ.

NVIDIA® A100 80Gb

Обладает максимальной производительностью для AI, HPC и обработки данных, а также большим объемом памяти для выполнения ресурсоемких задач. Подходит для глубокого обучения, научных исследований и аналитики данных.

На базе архитектуры Ampere®, с памятью 80 ГБ HBM2 и пропускной способностью до 1,5 ГБ/с. Посмотрите подробные характеристики NVIDIA® A100 80Gb в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 8 GPU × 80 ГБ, при vCPU от 12 до 192, RAM от 128 до 1 000 ГБ.

NVIDIA® Tesla T4

Подходит для Machine Learning и Deep Learning, инференса, работы с графикой и рендерингом видео. Работает с большинством AI-фреймворков и совместим со всеми типами нейросетей.

На базе архитектуры Turing®, пропускная способность до 300 ГБ/с. Посмотрите подробные характеристики NVIDIA® Tesla T4 в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 4 GPU × 16 ГБ, при vCPU от 4 до 24, RAM от 32 до 320 ГБ.

NVIDIA® A30

Подходит для AI-инференса, HPC, обработки языка, разговорного искусственного интеллекта, рекомендательных систем.

На базе архитектуры Ampere®, пропускная способность до 933 ГБ/с. Посмотрите подробные характеристики NVIDIA® A30 в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 2 GPU × 24 ГБ, при vCPU от 16 до 48, RAM от 64 до 320 ГБ.

NVIDIA® A2

GPU для начального уровня. Подходит для простого инференса, видео и графики, Edge AI (периферийных вычислений), Edge-видео, мобильного облачного гейминга.

На базе архитектуры Ampere®, пропускная способность до 200 ГБ/с. Посмотрите подробные характеристики NVIDIA® A2 в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 4 GPU × 16 ГБ, при vCPU от 12 до 48, RAM от 32 до 320 ГБ.

NVIDIA® GTX 1080

Производительный и энергоэффективный GPU. Решение реализовано с помощью технологии FinFET и памяти GDDR5X. Динамическая балансировка нагрузки помогает разделять задачи, чтобы ресурсы не простаивали в ожидании. Обладает максимальной производительностью для отображения информации, VR, параметров ультра высокого разрешения и обработки данных.

На базе архитектуры Pascal®, пропускная способность до 320 ГБ/с. Посмотрите подробные характеристики NVIDIA® GTX 1080 в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 8 GPU × 8 ГБ, при vCPU от 8 до 28, RAM от 24 до 96 ГБ.

NVIDIA® RTX 2080 Ti

Высокопроизводительный GPU для выполнения сложных графических задач. Подходит:

  • для обработки видео в высоком разрешении;
  • создания 3D-моделей;
  • рендеринга и обработки фотографий;
  • обучения нейросетей;
  • выполнения сложных вычислений в области искусственного интеллекта;
  • обработки больших объемов данных.

На базе архитектуры Turing®, пропускная способность до 616 ГБ/с. Посмотрите подробные характеристики NVIDIA® RTX 2080 Ti в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 4 GPU × 11 ГБ, при vCPU от 2 до 48, RAM от 32 до 320 ГБ.

NVIDIA® RTX 4090 24 Gb

Производительный GPU серии GeForce. Подходит для профессионального проектирования и 3D-моделирования, работы с видео, рендеринга, ML-задач (обучения и инференса моделей), работы с языковыми моделями (LLM), научных и инженерных вычислений (например, в моделировании климата или биоинформатике).

На базе архитектуры Ada Lovelace®, пропускная способность до 1008 ГБ/с. Посмотрите подробные характеристики NVIDIA® RTX 4090 в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 4 GPU × 24 ГБ, при vCPU от 4 до 64, RAM от 16 до 356 ГБ.

NVIDIA® RTX 4090 48 Gb

Производительный GPU серии GeForce с увеличенным объемом памяти по сравнению с NVIDIA® RTX 4090 24 Gb, который подходит:

  • для профессионального проектирования и 3D-моделирования;
  • работы с видео и рендеринга;
  • ML-задач (обучения и инференса моделей);
  • работы с языковыми моделями (LLM);
  • научных и инженерных вычислений (например, в моделировании климата или биоинформатике).

На базе архитектуры Ada Lovelace®, с памятью 48 ГБ GDDR6X и пропускной способностью до 1008 ГБ/с. Посмотрите подробные характеристики NVIDIA® RTX 4090 в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 8 GPU × 48 ГБ, при vCPU от 12 до 192, RAM от 64 до 896 ГБ и локальным диском от 64 до 800 ГБ.

NVIDIA® RTX 6000 Ada

Профессиональный GPU для вычислительной и графической мощности. Подходит для ML-задач, рендеринга, научных вычислений и высокопроизводительной визуализации.

На базе архитектуры Ada Lovelace®, с памятью 48 ГБ GDDR6X и пропускной способностью до 960 ГБ/с. Посмотрите подробные характеристики NVIDIA® RTX 6000 Ada в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 4 GPU × 48 ГБ, при vCPU от 12 до 96, RAM от 64 до 450 ГБ.

NVIDIA® A2000

Энергоэффективный GPU для компактных рабочих станций. Подойдет для AI, графики и рендеринга видео.

На базе архитектуры Ampere®, пропускная способность до 288 ГБ/с. Посмотрите подробные характеристики NVIDIA® A2000 в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 4 GPU × 6 ГБ, при vCPU от 6 до 24, RAM от 16 до 320 ГБ.

NVIDIA® A5000

Универсальный GPU, подходит для любых задач в рамках своей производительности.

На базе архитектуры Ampere®, пропускная способность до 768 ГБ/с. Посмотрите подробные характеристики NVIDIA® A5000 в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 2 GPU × 24 ГБ, при vCPU от 8 до 48, RAM от 32 до 320 ГБ.

NVIDIA® H100

Мощный GPU, который подходит для AI, HPC и масштабируемых вычислений.

На базе архитектуры Hopper™, с памятью 80 ГБ HBM3 и пропускной способностью до 3 ТБ/с. Посмотрите подробные характеристики NVIDIA® H100 в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 2 GPU × 80 ГБ, при vCPU от 12 до 48, RAM от 128 до 256 ГБ.

NVIDIA® H200

Профессиональный GPU:

  • для ускорения генеративного AI;
  • высокопроизводительных вычислений (HPC);
  • инференса больших языковых моделей (LLM);
  • файн-тюнинга моделей;
  • генерации изображений и видео.

На базе архитектуры Hopper™, с памятью 141 ГБ HBM3 и пропускной способностью до 4,8 ТБ/с. Посмотрите подробные характеристики NVIDIA® H200 в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 8 GPU × 141 ГБ, при vCPU от 12 до 192, RAM от 120 ГБ до 1 ТБ.

NVIDIA® L4

Универсальный GPU для ускорения AI/ML-рабочих нагрузок, обработки видео, стриминга и VDI. Подходит для запуска современных языковых моделей (LLM) и мультимодальных моделей.

На базе архитектуры Ada Lovelace®, с памятью 24 ГБ GDDR6 и пропускной способностью до 3 ТБ/с. Посмотрите подробные характеристики NVIDIA® L4 в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 8 GPU × 24 ГБ, при vCPU от 8 до 128, RAM от 32 ГБ до 512 ГБ.

NVIDIA® RTX 6000 Pro

Профессиональный GPU:

  • для ускорения генеративного AI;
  • инференса языковых моделей (LLM);
  • файн-тюнинга моделей;
  • генерации изображений и видео;
  • 3D-рендеринга и видеообработки.

На базе архитектуры Blackwell®, с памятью 96 ГБ GDDR7 и пропускной способностью до 1,6 ТБ/с. Посмотрите подробные характеристики NVIDIA® RTX 6000 Pro в документации NVIDIA®.

В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 8 GPU × 96 ГБ, при vCPU от 16 до 256, RAM от 120 ГБ до 1 ТБ.