LIVE
Новость

Реорганизация обучения Gemini: почему Google отложила релиз версии 3.5 Pro

Google реорганизует пайплайн обучения Gemini: вводит этап midtraining между претрейном и посттрейном. Цель — усилить кодинг-способности модели и перенести их на смежные агентные задачи.

Савелий Попов·обновлено 30 июня 2026 г.

Реорганизация обучения Gemini: почему Google отложила релиз версии 3.5 Pro

Midtraining как новый этап

Google собирает постоянное подразделение midtraining — этап, который встраивается после обучения базовой модели и перед финальной доводкой под задачи. Ранее существовала временная «ударная группа» по кодингу. Теперь её расширяют. Задача новой структуры: закладывать специализированные навыки в модель раньше, а не полировать ответы на посттрейне. Вектор — тот же, что у Anthropic и OpenAI, где кодинг-инструменты давно вышли за рамки собственно программирования. Для голосовых пайплайнов это может означать параллельное усиление способностей Gemini в синтезе речи, диалоговом инференсе и работе с аудио на промежуточном этапе — до того, как модель уходит в продуктовую доводку.

Gemini 3.5 Pro: задержка и причины

Флагманская модель остаётся в ограниченном корпоративном превью. Google собирает обратную связь на площадках Antigravity и LMArena. По данным источников, доучивание идёт под более длинные, агентные задачи. Отдельное направление — оптимизация расхода токенов. Для голосовых сценариев это критично: стоимость инференса напрямую влияет на экономическую целесообразность TTS и ассистентных пайплайнов в реальном времени. Задержка Pro усиливает позиции Claude и GPT-4o в нише, где голосовые модели зависят от качества reasoning и контекстного окна.

Google Home Speaker: платформа для Gemini в железе

На фоне перестройки обучения Google выпускает Google Home Speaker — аппаратную платформу для Gemini на ближайшие годы. Колонка использует визуальные индикаторы состояния модели: пульсацию при обработке запроса, цветовую дифференциацию стадий «слушаю — думаю — отвечаю». Setup через Google Home — менее 10 минут. Питание USB-C, интегрированный кабель 1,5 м. В отличие от Nest Mini, световая индикация перенесена в основание корпуса. Для разработчиков голосовых интерфейсов это сигнал: Google инвестирует в dedicated-железо под Gemini, а значит, SDK и API для голосового инференса будут расширяться.

Что отслеживать

Июльский релиз Gemini 3.5 Pro — первый индикатор, сработала ли перестройка midtraining. Параллельно: публикация бенчмарков модели по latency и throughput в голосовых задачах. Если Google покажет прогресс в кодинге, логично ожидать перенос аналогичного подхода на TTS и диалоговые агенты. Для продакшн-пайплайнов на Gemini Flash — мониторить изменения в pricing и контекстном окне.