GPU-маркетплейсы vs классические облака

Почему GPU агрегаторы в 2026 году - самый оптимальный вариант?

21 мая 2026 г.Автор: qudata8 мин чтения

Если вы запускали обучение модели в 2023-м, помните ощущение: H100 нужны вчера, а в нужном регионе AWS их нет, Azure предлагает квоту через три недели, GCP молчит. С тех пор многое изменилось — и не только из-за роста поставок Nvidia. Изменилась сама структура рынка: между гипероблаками и пользователем встала прослойка агрегаторов, которая заметно поменяла экономику ML-инфраструктуры.

Разберёмся, почему всё больше команд берут GPU не напрямую у AWS, а через маркетплейсы — и где это действительно работает, а где лучше остаться на классическом облаке.

Как устроен рынок аренды GPU сейчас

К 2026 году рынок GPU-as-a-Service окончательно разделился на три модели, и у каждой свой профиль клиента.

Гипероблака — AWS, Google Cloud, Microsoft Azure, Oracle Cloud. Это огромная инфраструктурная экосистема, в которой GPU — лишь один из сотен сервисов. Сильная сторона: полная интеграция с базами данных, IAM, очередями, мониторингом, managed-сервисами вроде SageMaker или Vertex AI. Слабая — цена, ограниченная доступность топовых GPU и высокий порог входа в виде квот.

Специализированные GPU-провайдеры — CoreWeave, Lambda Labs, RunPod, Paperspace, Hyperstack, Nebius и десятки других. Они построены вокруг одной задачи: дать AI-нагрузкам доступ к GPU дешевле и быстрее, чем у гиперскейлеров. Часто у них раньше появляются новые SKU (H200, B200), цены ниже, а биллинг проще. В обмен — урезанная экосистема и меньше enterprise-инструментов.

Маркетплейсы и агрегаторы — Vast.ai, QuData, Spheron и ряд других. Сами они не владеют железом (или владеют лишь его частью). Их продукт — единая витрина, в которой собраны предложения десятков провайдеров: от крупных дата-центров до операторов с одной стойкой H100. Пользователь сравнивает цены, регионы, конфигурации в одном интерфейсе и арендует то, что подходит.

Объёмы рынка показывают, что эта сегментация — не временное явление. По оценкам Mordor Intelligence, мировой рынок GPU-as-a-Service вырастет с $5.7 млрд в 2025 году до $7.4 млрд в 2026-м и достигнет $26 млрд к 2031 году — это CAGR около 28–29%. Похожие цифры дают и другие аналитики: Fortune Business Insights ожидает $8.7 млрд в 2026 году, ResearchAndMarkets — $7.4 млрд. Главный драйвер у всех один — генеративный ИИ и переход на pay-per-use.

Проблемы классических облаков для ML-нагрузок

Гипероблака решают много задач, но не оптимизированы под ML-команды. Это не претензия — это конструктивное ограничение. Когда сервис должен одновременно обслуживать банки, ритейл, госсектор и стартапы, он не может быть самым дешёвым GPU-провайдером.

Цена. Самый показательный пример — H100. По данным CloudZero и Spendark на начало 2026 года, on-demand цена за один H100 80GB выглядит так: AWS — около $3.90/час (после снижения на 44% летом 2025), Google Cloud — около $3.00/час, Azure — $6.98/час. У специализированных провайдеров вроде RunPod тот же H100 стоит $2.49/час on-demand и $1.49/час на спот-ёмкости. Hyperstack и Nebius предлагают около $1.90/час, Vast.ai через маркетплейс — от $1.25/час. Для месячной нагрузки 24/7 разница между AWS и нижней частью рынка превращается в $4 000–5 000 за один GPU. Восемь H100 на год — десятки тысяч долларов разницы.

Важная оговорка: AWS и GCP сильно сократили этот разрыв за последний год. Гипероблака больше не безнадёжно дороги — они дороги осмысленно. Вы платите за то, что P5-инстанс интегрирован с EFA, EBS, S3, IAM и десятком других сервисов из коробки.

Vendor lock-in. Это не страшилка из 2010-х, а вполне ощутимая вещь. Если ваш training pipeline опирается на S3 для датасетов, на SageMaker для оркестрации и на CloudWatch для логов — переезд к другому провайдеру означает не просто смену счёта, а переписывание инфраструктурного кода. Чем глубже вы интегрированы в экосистему, тем выше барьер выхода. И провайдер это знает — отсюда консервативная ценовая политика по premium-сервисам.

Ограниченная доступность. Парадокс гиперскейлеров: имея сотни дата-центров, они часто не могут предложить нужный GPU в нужном регионе. Анализы CloudCombinator показывают, что популярные SKU вроде H100 или P6-B200 регулярно бывают out of stock в загруженных регионах AWS. Решение — Capacity Reservations, UltraClusters, длинные коммиты. Это работает для крупных клиентов, но плохо подходит стартапу, которому нужны 4 GPU на две недели для эксперимента.

Биллинг с сюрпризами. Любой, кто получал счёт от AWS на $8 000 вместо ожидаемых $3 000, знает: GPU-час — это только часть стоимости. К нему добавляются egress-трафик ($0.05–0.09 за гигабайт исходящих данных), межрегиональный трафик, EBS-снапшоты, NAT-Gateway, CloudWatch-логи и десятки других пунктов. Для тренировки 70B-модели CloudZero оценивает дополнительные расходы на трансфер данных в $5 000–15 000, на хранение чекпоинтов — ещё $3 000–8 000. Эти цифры не появляются в калькуляторе, когда вы выбираете инстанс.

Что даёт маркетплейс-модель

Маркетплейс — это не «дешёвая альтернатива», а другой способ организовать рынок. Вместо «вы — клиент одного провайдера» появляется «вы — покупатель на витрине, где провайдеры конкурируют за вас».

Прозрачное сравнение цен. Самое очевидное — но недооценённое преимущество. Когда H100 у одного провайдера стоит $1.90, у другого $2.49, у третьего $3.10, а доступность и регионы разные, разбираться вручную через десять вкладок утомительно. Маркетплейс показывает 50–200 вариантов одной модели GPU отсортированными по цене, региону, типу аренды (on-demand / spot / reserved) и спецификации хоста (CPU, RAM, диск, сеть). Решение принимается за минуты, а не за день.

Глубокий доступ к предложению. Один провайдер — одна-две модели GPU и ограниченное количество регионов. Маркетплейс с сотней провайдеров покрывает десятки SKU и десятки регионов одновременно. Если вам нужен A100 80GB именно во Франкфурте на следующие 72 часа — на маркетплейсе он почти наверняка есть, даже если у вашего «основного» поставщика квота исчерпана.

Конкуренция давит цены. Когда провайдеры стоят рядом на одной витрине, ценовое давление работает само собой. Никто не хочет быть на третьей странице выдачи, отсортированной по цене. Это структурно отличается от ситуации, где провайдер общается с клиентом один на один и может позволить себе наценку «за бренд».

Простота переключения. Маркетплейс снижает стоимость миграции. Если конкретный провайдер начал давать сбои, поднял цену или у него закончились нужные GPU — вы переключаетесь на другого без переписывания кода. Контейнер, образ, ssh-ключи — всё то же самое. Привычка к одному провайдеру не превращается в зависимость.

Аналитики Silicon Data, отслеживающие цены через GPU Rental Index, фиксируют разрыв в 2x между ценами хайперскейлеров и специализированных провайдеров на тот же H100 — и эта разница не размывается, а закрепляется. Маркетплейсы делают этот спред видимым.

Когда классическое облако всё же оправдано

Было бы нечестно представить дело так, будто гипероблака — пережиток прошлого. Есть сценарии, где AWS, GCP или Azure — правильный выбор, и стоит признать это явно.

Compliance и регулирование. Если вы обрабатываете медицинские данные с требованиями HIPAA, финансовые с PCI DSS, или работаете с госсектором, который требует конкретных сертификаций — гипероблака покрывают эти нужды лучше всех. Не потому что они «безопаснее», а потому что у них есть соответствующая документация, аудиты и контракты. Малый GPU-провайдер может технически быть не менее защищённым, но без формальной сертификации это не пройдёт согласование с юридическим отделом крупной компании.

Глубокая интеграция с экосистемой. Если ваш ML-pipeline уже построен поверх BigQuery, Dataflow, Pub/Sub и Vertex AI — выносить GPU-нагрузку отдельно может быть бессмысленно. Стоимость интеграции и переноса данных съест ценовую разницу, а в некоторых случаях даже превзойдёт её. Тут гипероблако не «дороже», а «оптимально для вашей конкретной архитектуры».

Жёсткие SLA. Производственный inference банковской ML-системы, к которому привязан фронтенд для миллионов пользователей, требует SLA 99.95% и выше с финансовыми гарантиями. Большинство специализированных провайдеров и маркетплейсов либо не дают такого SLA, либо дают на ограниченных условиях. Здесь enterprise-контракт с гипероблаком — единственный честный путь.

Но за пределами этих сценариев — а это касается значительной части ML-команд, особенно стартапов и R&D-подразделений — экономика складывается в пользу маркетплейсов. Тренировка LLM на собственном датасете, fine-tuning, эксперименты, batch-inference, исследовательские проекты, где интерактивная работа с моделью важнее, чем 99.99% uptime — все эти задачи закрываются маркетплейсом дешевле в 2–3 раза без потери в качестве компьюта.

Как QuData реализует маркетплейс-модель

QuData агрегирует предложения от 100+ провайдеров и держит активный каталог из 50 000+ конфигураций. Это покрывает практически весь актуальный спектр: от RTX 4090 для локальных экспериментов до кластеров H100 и B200 для production-нагрузок. Поиск идёт по фильтрам, к которым обычно нужно прикоснуться при выборе GPU — модель и количество, объём VRAM, регион, тип аренды (on-demand / hourly / monthly / reserved), пропускная способность сети, тип хранилища.

Чтобы маркетплейс работал, недостаточно просто собрать провайдеров в одну витрину — нужна верификация. Провайдеры проходят проверку перед попаданием в каталог: подтверждение реальной инфраструктуры, корректность спецификаций, прозрачность биллинга. Это снимает главный риск открытого маркетплейса — ситуацию, когда заявленные характеристики не совпадают с фактическими.

Для команд из СНГ важна и операционная сторона: оплата в локальных валютах, поддержка на русском, возможность выбрать провайдеров с дата-центрами в нужной юрисдикции. Это снимает несколько типичных болей работы с глобальными хайперскейлерами — от вопросов с картами до сложностей с заключением договоров.

Если вы оцениваете стоимость GPU-инфраструктуры на следующий квартал — стоит зайти и сравнить актуальные предложения под вашу конфигурацию. Цена видна сразу, без запроса коммерческого предложения.

Куда движется рынок

Несколько трендов 2026 года делают маркетплейс-модель не альтернативой, а основной формой потребления GPU для большинства AI-команд.

Сдвиг от тренировки к inference. Большие LLM уже обучены, и фокус индустрии смещается на их использование. Inference — это не равномерная нагрузка, как тренировка: трафик колеблется по часам, дням, регионам. Под такой профиль гибкая краткосрочная аренда подходит лучше, чем годовой коммит. По данным аналитиков Mordor Intelligence, AI-нагрузки занимают почти 50% выручки рынка GPUaaS, и доля inference в этом сегменте растёт быстрее тренировки. Маркетплейсы со спот-ценами и почасовой тарификацией оказываются в выигрышной позиции.

Новые GPU сначала появляются у нишевых провайдеров. H200 пошёл в продажу у Lambda, RunPod, GMI Cloud и ещё нескольких специализированных игроков значительно раньше, чем у AWS и GCP. Та же история с B200: специализированные клауды и маркетплейсы предлагают его с весны 2026 года, в то время как у гипероблаков доступность остаётся ограниченной квотами. Это не случайность — большие облака должны проходить более длинный цикл интеграции, тестирования и подключения сервисов поверх нового железа. Если вы хотите быть на переднем крае, гипероблако — не лучшая позиция.

Цены на H100 стабилизируются, но между сегментами разрыв сохраняется. Silicon Data отмечает, что after мартовской стабилизации on-demand цены гиперскейлеров на H100 держатся почти неизменными (коэффициент вариации меньше 0.5%), при этом специализированные провайдеры остаются вдвое дешевле. Это означает: рынок осознанно формирует два уровня — премиум за экосистему и compute-as-commodity. Маркетплейсы работают на втором уровне и забирают всё больше клиентов, для которых compute и есть основной продукт.

Multi-cloud перестаёт быть экзотикой. По данным того же Mordor, гибридные и мульти-клауд развёртывания растут с CAGR 29% — быстрее, чем сам рынок. Команды учатся не привязываться к одному провайдеру, и маркетплейс — естественный инструмент такой стратегии.

Вывод

Маркетплейс — не временный обходной путь и не «дешёвый эконом-вариант» для тех, кому не хватает бюджета на AWS. Это взрослая модель потребления GPU, которая структурно решает три проблемы классических облаков: цену, доступность и lock-in. У гипероблаков остаётся своя сильная ниша — compliance, глубокая экосистемная интеграция и enterprise-SLA — но за её пределами экономика складывается не в их пользу.

Если ваша команда тренирует или дообучает модели, занимается исследованиями, гоняет batch-inference или просто хочет снизить долю compute в P&L без потери качества — стоит посмотреть, во сколько обойдётся та же конфигурация через маркетплейс. Часто это оказывается тем самым решением, которое продлевает рантвей стартапа на полгода, или освобождает бюджет на новый эксперимент в R&D-команде.

QuData — это конкретный инструмент, чтобы быстро проверить эту гипотезу для вашей нагрузки. Сравните цены и доступность под вашу конфигурацию — это занимает несколько минут.

Блог и статьи