Автор: Александр Казанцев, руководитель направления по работе с документацией и контентом HOSTKEYПрофессиональную видеокарту RTX PRO 2000 Blackwell сама NVIDIA Автор: Александр Казанцев, руководитель направления по работе с документацией и контентом HOSTKEYПрофессиональную видеокарту RTX PRO 2000 Blackwell сама NVIDIA

NVIDIA RTX PRO 2000 Blackwell. На что способен «младшенький GPU» нового семейства профессиональных карт NVIDIA

Автор: Александр Казанцев, руководитель направления по работе с документацией и контентом HOSTKEY

Профессиональную видеокарту RTX PRO 2000 Blackwell сама NVIDIA позиционирует как компактное и энергоэффективное решение для профессиональных рабочих станций, ускоряющее графику и ИИ-задачи. Обещается максимальная AI-производительность с FP4, DLSS 4 и оптимизацией для RTX Neural Shaders, Mega Geometry, а также поддержка сложных multi-app workflow: генеративный ИИ, 8K-видео, реал-тайм рендеринг, CAD с ray tracing.​ То есть карта создана для применения в создании контента, 3D-дизайне, видео- и CAD-воркфлоу.

У нас в HOSTKEY эта карта рассматривается как замена в серверах не поддерживаемых уже драйверами 1080Ti и как альтернатива 16Гб A4000. Но что мы реально получаем за 85000 рублей?

Арендуйте сервер с RTX PRO 2000 Blackwell
Оцените производительность недорогого GPU-сервера для ваших задач.

Выбрать

Странные спеки

Начнем со спецификации. Так как это карта семейства Blackwell, то сравнить ее можно по характеристикам с той же RTX 6000 PRO Blackwell.

Характеристика

NVIDIA RTX PRO 6000 Blackwell

NVIDIA RTX PRO 2000 Blackwell

Архитектура

Blackwell

Blackwell

CUDA-ядра

24 064

4352

Tensor Cores

752 (5-го поколения)

136 (5-го поколения)

RT Cores

188 (4-го поколения)

34 (4-го поколения)

Память

96 ГБ GDDR7 ECC

16 ГБ GDDR7 ECC

Пропускная способность

1597–1792 ГБ/с

288 ГБ/с

TDP

600 Вт

70 Вт

Интерфейс

PCIe 5.0 x16

PCIe 5.0 x8

AI TOPS

До 4000

545

Форм-фактор

FHFL, dual-slot, пассивное охлаждение

Компактный SFF

Как видно, урезание произошло даже не в три раза, и по факту мы получили карту, урезанную до пятой части от старшей серверной модели.

323eba0d0d46586fc516c8c8ebe74ad9.jpeg280f5d0568cd6c85fdfda661e912d94e.jpeg

А как эта карта выглядит в сравнении с потребительским сегментом? Учитывая ее характеристики, можно было бы предположить, что она будет примерно совпадать с 5060 Ti на 16 Гб. Но результат и тут немного обескуражил:

RTX PRO 2000 Blackwell, RTX 5060 Ti 16 ГБ и RTX 5060 — всё это GPU на архитектуре Blackwell начального уровня. Все используют PCIe 5.0 x8 и память GDDR7.

Сравнение спецификаций

Характеристика

RTX PRO 2000 Blackwell

RTX 5060 Ti 16 ГБ

RTX 5060 8 ГБ

CUDA-ядра

4352

4608

3840

Tensor Cores

136 (5-го поколения)

144 (5-го поколения)

120 (5-го поколения)

RT Cores

34 (4-го поколения)

36 (4-го поколения)

30 (4-го поколения)

Память

16 ГБ GDDR7 ECC

16 ГБ GDDR7

8 ГБ GDDR7

Пропускная способность

288 ГБ/с

448 ГБ/с

448 ГБ/с

TDP

70 Вт

180 Вт

145 Вт

AI TOPS

545

759

~500

FP32 производительность

16.97 TFLOPS

23.7 TFLOPS

19.2 TFLOPS

Форм-фактор

Компактный SFF

2.5-слотовый

2-2.5 слотовый

По характеристикам ядер наша RTX PRO 2000 лежит между RTX 5060 Ti и RTX 5060, по AI превосходит 5060 (хотя и ненамного), как и по характеристикам, но проигрывает по производительности FP32. Хотя, возможно, тут играет роль «задушенное» питание карты, так как ее энергопотребление меньше в два раза даже 5060, и меньшая пропускная способность (хотя память тут та же GDDR7 с ECC, и шина PCI-E урезана так же, как у 5060).

И последнее сравнение с A4000. Начнем с цены: сейчас A4000 можно найти в районе 130 000 рублей. То есть RTX PRO 2000 Blackwell обойдется на 35% дешевле, чем A4000. Но что там по спекам?

Характеристика

NVIDIA RTX A4000

NVIDIA RTX PRO 2000 Blackwell

Архитектура

Ampere

Blackwell

CUDA-ядра

6144

4352

Tensor Cores

192 (3-го поколения)

136 (5-го поколения)

RT Cores

48 (2-го поколения)

34 (4-го поколения)

Память

16 ГБ GDDR6 ECC

16 ГБ GDDR7 ECC

Пропускная способность

448 ГБ/с

288 ГБ/с

TDP

140 Вт

70 Вт

Интерфейс

PCIe 4.0 x16

PCIe 5.0 x8

AI TOPS

Не указано

545

Форм-фактор

Single-slot

Компактный, SFF

Как видно, A4000 обладает лучшей пропускной способностью памяти, но предыдущей архитектуры, и большим числом всех ядер (хоть и предыдущего поколения Ampere), но при этом потребляет в два раза больше энергии, чем RTX PRO 2000 Blackwell. Также она обменивается данными по 16 линиям PCI-E, но Gen4, а не Gen5.

Надо тестировать

Проверять карту будем в сравнении с A4000 в рекомендованных самой NVIDIA применениях: инференсе LLM, генерации изображений и видео, а также проверим работу карты в рендере Blender.

Для тестирования инференса будет использовать наш тест скрипт на основе Ollama.

Конфигурация сервера у нас такая: AMD Ryzen 9 5900X 3.7ГГц (12 ядер)/​64Гб/​1Тб NVMe SSD/​PSU+RTX PRO 2000.

ec752edcb42162e94857fa66b2dfea77.jpeg


Хотя наша подопытная имеет компактный короткий PCB, но референсный дизайн всё равно делает её двухслотовой картой длиной около 6,6 дюйма с турбинным охлаждением.

«Странный» черный кожух на фото, увеличивающий размеры нашей малютки, позволяет забирать воздух изнутри корпуса и выдувать его наружу, чтобы горячий воздух не скапливался вокруг процессора и памяти.

687d6b04777a784682e0da31a3b9dff0.jpeg

За A4000 будет отдуваться похожая конфигурация, только процессор был Ryzen 5950X 16x3.4 ГГц, но он у нас в тестировании не участвует и на сравнение не влияет.

Ставим на обе машины Ubuntu 22.04 и с помощью нашего скрипта накатываем драйвера и CUDA. В итоге имеем для RTX PRO 2000 Blackwell в простое следующие значения:

4a95c31ae729d7563b1ab27705901901.png

Как видно, без нагрузки карта банально «комнатной температуры». Тестирование будем проводить на нескольких моделях, включая «старичка» DeepSeek-R1:14B, чуть более свежий gpt-oss:20B с MOE и новенький мультимодальный mixstral3:14B (и заодно более быстрый 8B) с распознаванием картинок. Все модели с квантизацией Q4.

b96ff4f47cee0642b1607746ed84b924.png

Итоговый результат сведем в таблицу, где для сравнения приведем для deepseek цифры у RTX 6000 PRO Blackwell.

GPU

Модель

Скорость генерации
(токенов в секунду)

max ctx

Скорость загрузки модели (секунд)

Скорость генерации (секунд)

Примечание

NVIDIA RTX 6000 PRO Blackwell (gen5)

deepseek-r1:14b

114.02

128 000

1.74

22.71

NVIDIA RTX A4000 (gen4)

deepseek-r1:14b

35.81

24 000

11.72

74.37

NVIDIA RTX PRO 2000 Blackwell

deepseek-r1:14b

27.79

24 000

3.68

91.91

NVIDIA RTX A4000 (gen4)

ministral-3:8b

65.42

64 000

12.92

44.98

Visual

NVIDIA RTX PRO 2000 Blackwell

ministral-3:8b

48.21

68 000

3.17

63.97

Visual

NVIDIA RTX A4000 (gen4)

ministral-3:14b

42.28

36 000

13.99

86.12

Visual

NVIDIA RTX PRO 2000 Blackwell

ministral-3:14b

30.97

36 000

3.68

115.42

Visual

NVIDIA RTX A4000 (gen4)

gpt-oss:20b

84.06

120 000

14.89

30.85

Mixture of Experts

NVIDIA RTX PRO 2000 Blackwell

gpt-oss:20b

62.54

120 000

4.23

43.26

Mixture of Experts


Краткий итог: RTX PRO 2000 Blackwell медленнее в инференсе, чем A4000. Единственный параметр, по которому она выигрывает, это время старта, то есть время первичной загрузки в память. Цифры скорости по моделям следующие (проценты, на сколько A4000 медленнее RTX PRO 2000 Blackwell при инференсе токенов в секунду):

  • Deepseek-r1:14b ~ 28%

  • ministral-3:8b ~ 27%

  • Ministral-3:14b ~ 27%

  • gpt-oss:20b ~ 26%

Как видно, в среднем цифра примерно одинакова для классических моделей, так и для MoE. Несмотря на особенности архитектуры Mixture of Experts (MoE), где активируется лишь малая доля параметров, что лучше использует сильные стороны Ampere-архитектуры A4000 с её высокой пропускной способностью памяти (384 ГБ/с GDDR6 на 16 ГБ) и большим кэшем L2, наш «огрызок» прекрасно справляется при меньших мощностях благодаря новому Tensor Core.

При этом A4000 раскочегаривается под нагрузкой до 83°C и потребляет более 130 Вт из 140 возможных. RTX PRO 2000 Blackwell при этом держит 59°C при потреблении 65 Вт из 70 возможных.

Генерация изображений и видео

Здесь мы воспользуемся ComfyUI, в котором протестируем генерацию картинок через Z-image Turbo и видео в режиме текст-в-видео и изображение-в-видео в модели Kandinsky 5 Lite. Поставить ComfyUI на сервер можно так (для тестов мы ставим всё от root и без использования виртуального окружения):

#!/usr/bin/env bash set -euo pipefail COMFY_DIR="/root/comfy/ComfyUI" LISTEN_IP="${LISTEN_IP:-0.0.0.0}" export DEBIAN_FRONTEND=noninteractive apt-get update -y apt-get install -y git python3 python3-pip ca-certificates # install/update ComfyUI if [[ -d "${COMFY_DIR}/.git" ]]; then git -C "$COMFY_DIR" pull --ff-only else mkdir -p "$(dirname "$COMFY_DIR")" git clone https://github.com/comfyanonymous/ComfyUI.git "$COMFY_DIR" fi # python deps (system-wide, since venv is not wanted) cd "$COMFY_DIR" python3 -m pip install --upgrade pip wheel python3 -m pip install -r requirements.txt # run exec python3 main.py --listen "${LISTEN_IP}"

Для быстрой установки модели Z-image Turbo на сервере (после установки ComfyUI) вы можете применить такой скрипт:

#!/usr/bin/env bash set -euo pipefail COMFY_DIR="/root/comfy/ComfyUI" MODELS_DIR="${COMFY_DIR}/models" # URL -> relative path inside ComfyUI/models/ declare -A FILES=( ["https://huggingface.co/Comfy-Org/z_image_turbo/resolve/main/split_files/text_encoders/qwen_3_4b.safetensors"]="text_encoders/qwen_3_4b.safetensors" ["https://huggingface.co/Comfy-Org/z_image_turbo/resolve/main/split_files/vae/ae.safetensors"]="vae/ae.safetensors" ["https://huggingface.co/Comfy-Org/z_image_turbo/resolve/main/split_files/diffusion_models/z_image_turbo_bf16.safetensors"]="diffusion_models/z_image_turbo_bf16.safetensors" ["https://huggingface.co/tarn59/pixel_art_style_lora_z_image_turbo/resolve/main/pixel_art_style_z_image_turbo.safetensors"]="loras/pixel_art_style_z_image_turbo.safetensors" ) # sanity checks if [[ ! -d "$COMFY_DIR" ]]; then echo "ERROR: ComfyUI dir not found: $COMFY_DIR" exit 1 fi mkdir -p \ "${MODELS_DIR}/text_encoders" \ "${MODELS_DIR}/vae" \ "${MODELS_DIR}/diffusion_models" \ "${MODELS_DIR}/loras" # downloader (aria2c preferred for resume + parallel chunks) if command -v aria2c >/dev/null 2>&1; then DL="aria2c -c -x 8 -s 8 -k 1M --allow-overwrite=true --file-allocation=none" else apt-get update -y apt-get install -y curl ca-certificates DL="curl -L --fail --retry 5 --retry-delay 2 -C - -o" fi for url in "${!FILES[@]}"; do rel="${FILES[$url]}" out="${MODELS_DIR}/${rel}" tmp="${out}.part" echo "==> ${rel}" mkdir -p "$(dirname "$out")" if command -v aria2c >/dev/null 2>&1; then # aria2c writes directly to target $DL -d "$(dirname "$out")" -o "$(basename "$out")" "$url" else $DL "$tmp" "$url" mv -f "$tmp" "$out" fi done echo echo "Done. Files are in:" echo " ${MODELS_DIR}/text_encoders/" echo " ${MODELS_DIR}/vae/" echo " ${MODELS_DIR}/diffusion_models/" echo " ${MODELS_DIR}/loras/"

Промт для изображения следующий:

Результаты получаем следующие. Холодный прогон (он же первый) в Z-Image Turbo. Все параметры на изображении.

fdbab997ad08f414cc6e7580882d9625.png5910062b4f6eac7eca0aa2c2b782747d.png169d9837b7b59b72d59e1e263cb60797.png

Двадцать шесть секунд секунд для картинки 1024x1024 при 9 итерациях. Последующие генерации или изменение размера будут происходить чуть быстрее. Например, изменим соотношение сторон на 1280x720.

dc3044a25616f6f72f849c99e8c74ba3.png42eaa8af24385bae4516aa10499006d5.png

Теперь сгенерируем видео Kandinsky 5 Lite. Нам же обещали, что мощности RTX PRO 2000 Blackwell хватит и для такой задачи.

Сперва пробуем наш промт в режиме «текст в видео». Модель ставим таким скриптом:

#!/usr/bin/env bash set -euo pipefail COMFY_DIR="/root/comfy/ComfyUI" MODELS_DIR="${COMFY_DIR}/models" declare -A FILES=( ["https://huggingface.co/Comfy-Org/HunyuanVideo_1.5_repackaged/resolve/main/split_files/text_encoders/qwen_2.5_vl_7b_fp8_scaled.safetensors"]="text_encoders/qwen_2.5_vl_7b_fp8_scaled.safetensors" ["https://huggingface.co/comfyanonymous/flux_text_encoders/resolve/main/clip_l.safetensors?download=true"]="text_encoders/clip_l.safetensors" ["https://huggingface.co/Kijai/HunyuanVideo_comfy/resolve/main/hunyuan_video_vae_bf16.safetensors"]="vae/hunyuan_video_vae_bf16.safetensors" ["https://huggingface.co/kandinskylab/Kandinsky-5.0-T2V-Lite-sft-5s/resolve/main/model/kandinsky5lite_t2v_sft_5s.safetensors"]="diffusion_models/kandinsky5lite_t2v_sft_5s.safetensors" ) if [[ ! -d "$COMFY_DIR" ]]; then echo "ERROR: ComfyUI dir not found: $COMFY_DIR" exit 1 fi mkdir -p \ "${MODELS_DIR}/text_encoders" \ "${MODELS_DIR}/vae" \ "${MODELS_DIR}/diffusion_models" # Prefer aria2c for resume/large files if command -v aria2c >/dev/null 2>&1; then DL_ARIA2=1 else apt-get update -y apt-get install -y aria2 ca-certificates DL_ARIA2=1 fi for url in "${!FILES[@]}"; do rel="${FILES[$url]}" out="${MODELS_DIR}/${rel}" dir="$(dirname "$out")" name="$(basename "$out")" echo "==> ${rel}" mkdir -p "$dir" # -c resume, -x/-s connections, -k chunk size aria2c -c -x 8 -s 8 -k 1M --allow-overwrite=true --file-allocation=none \ -d "$dir" -o "$name" "$url" done echo echo "Done. Verify files exist:" echo " ${MODELS_DIR}/text_encoders/qwen_2.5_vl_7b_fp8_scaled.safetensors" echo " ${MODELS_DIR}/text_encoders/clip_l.safetensors" echo " ${MODELS_DIR}/vae/hunyuan_video_vae_bf16.safetensors" echo " ${MODELS_DIR}/diffusion_models/kandinsky5lite_t2v_sft_5s.safetensors"

Здесь у нас получилось разогреть карту почти до 70 градусов и выбрать всю доступную мощность.

242b3fbde028690b850c1bc63d123fc9.png

Итоговый результат:

58a9af7c409627f634c3d50857e7517d.png378926010f620106b50bde573e3b0c8d.png

И время в двадцать четыре с лишним минуты на 5 секунд видео в разрешении 768x512.

Далее возьмем картинку, которую мы сгенерировали ранее, и попробуем ее оживить. Добавляем недостающие части для работы:

#!/usr/bin/env bash set -euo pipefail COMFY_DIR="/root/comfy/ComfyUI" MODELS_DIR="${COMFY_DIR}/models" URL="https://huggingface.co/kandinskylab/Kandinsky-5.0-I2V-Lite-5s/resolve/main/model/kandinsky5lite_i2v_5s.safetensors" OUT="${MODELS_DIR}/diffusion_models/kandinsky5lite_i2v_5s.safetensors" mkdir -p "$(dirname "$OUT")" # aria2c preferred (resume + faster) if command -v aria2c >/dev/null 2>&1; then aria2c -c -x 8 -s 8 -k 1M --allow-overwrite=true --file-allocation=none \ -d "$(dirname "$OUT")" -o "$(basename "$OUT")" "$URL" else apt-get update -y apt-get install -y curl ca-certificates curl -L --fail --retry 5 --retry-delay 2 -C - -o "$OUT" "$URL" fi echo "Installed: $OUT"

Затем оживляем нашу картинку, используя следующий промт:

871728c154bfa4d0c5241f1eb370bb05.png2c378f764a34ac0e37fee0cdd8caeaed.png

Те же двадцать четыре минуты. С одной стороны, результат не сильно впечатляет, с другой стороны, карта работает в данном режиме, хоть и не сверхбыстро. Для моделей, которые помещаются в 16 Гб памяти, карта подходит достаточно хорошо, учитывая, что на A4000 у меня рендер не запустился того же видео — не хватило каких-то архитектурных особенностей.

Рендер в Blender

Для тестирования будем использовать скрипты с https://opendata.blender.org/. Ставим через snap последнюю версию (у нас поставилась уже новая пятерка) и качаем с сайта бенчмарк для Linux, распаковываем и запускаем его.

de3a2fb5fb99a94d37d80dc043387a8f.png

В бенчмарке карта также вышла на полную мощность по потреблению, но температура карты была небольшой, как и утилизация памяти.

4abc0ea189ab092827a6f28b3d30fa1d.png

По итогу мы получили три результата в трех сценах:

  • monster: 1782.994259 samples per minute

  • junkshop: 1010.288134 samples per minute

  • classroom: 1008.595210 samples per minute

Сложив их вместе, получаем Medium score 3801.877603 сэмплов в минуту, и эту цифру уже можно сравнить с другими.

04ff21596263bbe9ec3ac045b5e5af87.png

Эти цифры чуть не дотягивают до NVIDIA RTX A4500, но ниже чем у RTX 4060 Ti.

Опять же, мы тестировали на Blender 5, а здесь цифры для Blender 4.5.0, и если глянуть в таблицу, то результат других пользователей еще меньше.

997e729a4db00adc3fb8406e927eb2e2.png

То есть у нас карта отработала в тестах гораздо лучше. Возможно как раз повлиял новый Blender и оптимизация драйверов и CUDA.

Подведем итоги

Что мы имеем: холодную карту в компактном исполнении с низким энергопотреблением на новейшей архитектуре NVIDIA, которая чуть больше четверти проигрывает своей предшественнице A4000 в инференсе, но при этом стоит дешевле A4000 и потребляет в два раза меньше энергии. Поэтому ее можно рекомендовать как для применения в каких-либо нейросетевых задачах с небольшой нагрузкой и моделями размерностью до 14B/20B (в зависимости от архитектуры), особенно где требуется их часто менять: стартует с новой моделью RTX PRO 2000 Blackwell за 3-4 секунды.

Нам лично карта понравилась, установилась она достаточно беспроблемно, а потери производительности покрываются энергопотреблением, температурой и размерами.

Арендуйте сервер с RTX PRO 2000 Blackwell
Оцените производительность недорогого GPU-сервера для ваших задач.

Выбрать

Источник

Возможности рынка
Логотип Propy
Propy Курс (PRO)
$0.3527
$0.3527$0.3527
-1.75%
USD
График цены Propy (PRO) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу service@support.mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.