С чего начать?

Сначала зафиксируйте задачу, итоговую цену, срок, документ-основание, канал поддержки и сценарий отмены или возврата.

Как не ошибиться?

Проверьте чек, договор или оферту, дату условия, гарантию, правила возврата, сроки доставки или оказания услуги, реквизиты продавца и письменную поддержку

Что важнее цены?

Прозрачность условий, надежность, поддержка и соответствие вашей задаче.

Когда нужен эксперт?

Если решение влияет на деньги, безопасность, сроки или долгосрочные обязательства.

Новостьсегодня, 01:24

Почему дефицит чипов Google ограничивает разработку ИИ-проектов Meta

Google, по данным Хабра со ссылкой на Financial Times, примерно в марте отказала Meta* в полном объёме вычислительных мощностей для работы с Gemini. Причина — дефицит чипов и перегрузка спросом на Gemini.

Савелий Попов·обновлено 30 июня 2026 г.

Почему дефицит чипов Google ограничивает разработку ИИ-проектов Meta

Дефицит не в API, а в инференсе

Meta* хотела расширить доступ к Gemini для внутренних ИИ-проектов. По данным источника, отказ Google задержал часть этих проектов. Под ограничения попали и другие клиенты Google Cloud, но Meta* пострадала сильнее из-за высокого спроса на Gemini.

Ключевая деталь для голосовых систем — модель использовалась Meta* в том числе для модерации: удаления вредоносного контента и борьбы со скамом. В этой задаче Gemini, как пишет Хабр, показала себя лучше собственных open-source-моделей Llama.

Это типовой риск для voice-продуктов. Голосовой ассистент, дубляж, клонирование голоса и realtime-коммуникация требуют не только генератора речи. Нужен стек контроля: текстовая нормализация, intent routing, фильтрация скама, детекция вредоносного контента, иногда мультимодальная проверка. Если один из внешних LLM-компонентов нормируется по токенам или квотам, ломается не только чат-слой. Проседает весь контур безопасности.

По данным источника, сотрудникам Meta* после ограничений велели экономнее расходовать токены. Для продакшена это означает простой вывод: токены — не абстрактная метрика биллинга. Это лимит на модерацию, fallback-сценарии, повторные прогоны, eval-пайплайны и ручную разметку через LLM.

Google сама ограничена железом

Ситуация не выглядит локальным отказом одному крупному клиенту. На апрельском отчёте перед инвесторами гендиректор Google Сундар Пичаи признал, что облачное подразделение в ближайшей перспективе ограничено вычислениями. Он также сообщил, что выручка Google Cloud была бы выше, если бы компания могла удовлетворить спрос.

В начале июня Google, по данным Хабра, законтрактовала у SpaceX около 110 000 GPU Nvidia примерно за $920 млн в месяц. Общая сумма за срок контракта указана почти в $30 млрд. Эта мощность названа временной и предназначена под спрос на Gemini Enterprise.

Для команд, строящих voice-инфраструктуру, важен не сам контрагент. Важна архитектурная зависимость. Если даже поставщик модели и облака нормирует доступ к собственному флагманскому стеку, SLA внешней LLM нельзя считать статическим. Особенно в сценариях с пиковым трафиком: голосовые ассистенты, customer support, звонковые боты, moderation-in-the-loop, синхронный дубляж.

Отдельный фон — Gemini активно продвигается и в пользовательских голосовых сценариях. Android Authority писал об обновлении Gemini for Home с улучшениями для голосового ассистента и камеры. ZDNET описывал опыт с Google Home Speaker, где взаимодействие с Gemini остаётся активным, хотя система не идеальна. Эти сообщения не дают технических бенчмарков, но показывают направление нагрузки: Gemini уходит не только в enterprise-API, но и в устройства и домашние ассистенты.

Что проверять в voice-пайплайне

Meta* уже пытается снизить зависимость от внешнего поставщика. В апреле компания запустила Muse Spark — первую модель нового подразделения Meta Superintelligence Labs. По данным Хабра, это заметный отход от прежней ставки на открытые Llama: Muse Spark является проприетарной. Часть нагрузок, включая модерацию, Meta* постепенно переводит на неё. При этом источник указывает на перенос выпуска Muse Spark для широкой публики как признак того, что модель пока не закрывает все требования.

Практический вывод для нишевых команд простой. Не закладывать один LLM-вендор как несменяемый слой. Для voice-AI это особенно критично: голосовой интерфейс плохо переносит деградацию задержки, а модерация не должна отключаться при нехватке квоты.

Минимальный набор проверок: отдельные лимиты токенов для модерации и генерации; fallback на локальные или open-source веса для низкорисковых задач; кэширование повторяемых проверок; независимые eval-наборы для скама, вредоносного контента и голосовых сценариев; тесты деградации при урезанном доступе к внешней модели.

Gemini остаётся сильным компонентом для прикладных пайплайнов. Но текущий эпизод фиксирует другой параметр качества: доступность вычислений. Для TTS, ассистентов и клонирования голоса это уже не закупочная деталь, а часть архитектуры риска.

\*Meta признана экстремистской организацией и запрещена в России.

Почему дефицит чипов Google ограничивает разработку ИИ-проектов Meta

Дефицит не в API, а в инференсе

Google сама ограничена железом

Что проверять в voice-пайплайне

Другие новости

Реорганизация обучения Gemini