· Тренды  · 8 мин. чтения

Frontier ушёл в open source. И не туда, куда ждали.

DeepSeek V4-Pro догнал Opus 4.7 на коде и в семь раз дешевле. Sber выложил GigaChat 3 Ultra под MIT. ~45% мирового OpenRouter-трафика — китайские open-weights. Год назад было меньше двух процентов.

DeepSeek V4-Pro догнал Opus 4.7 на коде и в семь раз дешевле. Sber выложил GigaChat 3 Ultra под MIT. ~45% мирового OpenRouter-трафика — китайские open-weights. Год назад было меньше двух процентов.

Шестнадцатого апреля Anthropic выкатывает Claude Opus 4.7. Двадцатого Moonshot роняет Kimi K2.6. Двадцать второго Alibaba отгружает Qwen3.6-27B весами наружу. Двадцать третьего OpenAI показывает GPT-5.5. Двадцать четвёртого DeepSeek — V4-Pro и V4-Flash в один день. Тридцатого Mistral дозабивает Medium 3.5.

Шесть моделей. Шесть лабораторий. Четырнадцать дней.

К концу апреля по данным OpenRouter около половины всего developer-трафика на агрегаторе уходит в китайские open-weight-модели — Xiaomi, Alibaba, MiniMax, DeepSeek, Moonshot. В мае 2025-го эта цифра была ниже двух процентов. Доля Meta в той же таблице на сегодня — ноль.

Это не история про то, что «Китай обогнал США». Это история про то, что frontier — то есть то, что вообще возможно, — теперь живёт в открытых весах. И открыты они оказались не там, где ждали.

Цифры, после которых спорить тяжело

Самая чистая ось — кодинг.

  • DeepSeek V4-Pro: 80,6% на SWE-bench Verified, цена — $1,74 за миллион входных токенов, $3,48 за миллион выходных.
  • Claude Opus 4.7: 87,6% на том же SWE-bench, $5,00 / $25,00.
  • GPT-5.5 Pro: цифр в формате Anthropic не публикует, цена — $30,00 / $180,00.

Разница на выходе — в семь раз против Opus, в пятьдесят раз против GPT-5.5 Pro. При семипроцентном отставании на бенчмарке. До 31 мая у DeepSeek работает 75%-я скидка на запуск, и эффективные цены сейчас — четверть от прайса.

GLM-5.1 от Zhipu в марте кратко возглавил SWE-Bench Pro с 58,4 — опередив GPT-5.4 и Opus 4.6. Поправка: лидерборд-цифра самозаявленная, без независимой верификации. Но трюк не в самом скоре. GLM-5 целиком тренировался на Huawei Ascend 910B, без единой H100. Zero-Nvidia-модель на вершине публичного бенчмарка по коду — это уже не «догнали», это другая категория.

Kimi K2.6 от Moonshot на HLE-Full с инструментами даёт 54,0 — выше GPT-5.4 (52,1), выше Opus 4.6 (53,0), выше Gemini 3.1 Pro (51,4). HLE — humanity’s last exam, самая жёсткая публичная оценка ризонинга. Open-weights с модифицированным MIT-лицензированием.

Epoch AI измерил отставание frontier-open от closed на конец Q1 2026: в среднем 3,5 месяца, доверительный интервал 1,1–5,3. На отдельных задачах разрыв «иногда смыкается полностью».

Это и есть слово «догнали» — в цифрах.

Архитектура важнее, чем кажется

DeepSeek V4-Pro — это не «V3 с большим числом параметров». 1,6 триллиона общих, 49 миллиардов активных, миллион контекста, 384K максимальный выход, 33T токенов претрейна. Под капотом — mHC, manifold-constrained hyper-connections, соавтор статьи — сам Лян Вэньфэн. Технический эффект — стабильное обучение моделей такого размера на железе, на котором обучаться они «не должны».

В переводе с инженерного: экспортные ограничения США — это налог, а не стена. Большая модель тренируется дольше, дороже и больней, но тренируется. И когда TrendForce фиксирует, что восемь китайских чипмейкеров — Huawei Ascend, Cambricon, Hygon и ещё пять — в день релиза V4 адаптировали свои стеки, это уже не партизанский фронт. Это инфраструктура.

SiliconFlow — единственный провайдер DeepSeek-API на промышленном масштабе, который крутит его на Ascend, а не на Nvidia. Полный стек, сверху донизу, китайский.

В мае Лян Вэньфэн сформулировал стратегию DeepSeek буквально одной фразой: «открытый исходник, эффективность, длинная память — и всё это на собственных чипах». Раунд на $10 миллиардов — первый раз, когда DeepSeek берёт внешние деньги. AGI заявлено как цель.

Год назад эту фразу прочитали бы как PR-плакат. Сегодня — это план продукта, для которого уже есть три квартала исполнения.

Sber выбрал открытость. Yandex — нет.

В ноябре 2025-го Сбер выложил под MIT-лицензией GigaChat 3 Ultra Preview: 712 миллиардов параметров, 36 миллиардов активных, 256 экспертов в 64 слоях, обучен с нуля на 14T токенов (~5,5T синтетических). Плюс GigaChat 3 Lightning (10 млрд, ноутбучный) и Kandinsky 5.0 — целое семейство для картинок и видео под Apache 2.0.

На бенчмарке MERA — российском замере на русскоязычных задачах — Ultra занимает первое место по тексту и коду и второе по медицине, отставая от Gemini 2.5 Pro на 0,001. На общем русскоязычном качестве обходит DeepSeek V3.1.

Параллельно Яндекс выкатил Alice AI — MoE на сотни миллиардов параметров, закрытый, проприетарный. На начало 2026-го у Alice 14,3% рынка ассистентов в России против 9,4% у DeepSeek.

Две российские компании, у которых ресурсов на frontier-обучение хватает, выбрали разные позиции. Сбер — на открытость, MIT-лицензия, никаких non-commercial-оговорок. Яндекс — на закрытость и продукт.

Стратегически можно долго спорить, кто прав. Но впервые с 2022 года у российского разработчика есть полноценный, frontier-уровня инструмент, который никто не выключит по геополитическому щелчку. Сбер для публичных стейтментов выбрал формулу «важнее делиться, чем закрывать». Греф подтвердил это рублём: 350 миллиардов на AI в 2026-м, вдвое больше прошлого года. План на три года — 600 миллиардов.

Сбера легко высмеять — но конкретно в этой истории он сделал то, чего не сделали ни OpenAI, ни Anthropic, ни Meta (которая шумно отступила к Llama community license). А Яндекс остался в категории «вы знаете, что мы хорошие, но веса не дадим».

Anthropic банит Россию. Это перестаёт иметь значение.

Параллельный сюжет, который год назад был катастрофой. Anthropic в 2026-м подтвердил, что блокирует Claude из России, Беларуси, Ирана, Северной Кореи, Сирии, Кубы, Крыма и территорий ДНР/ЛНР. Не по логину — по IP, на каждом запросе. Компании с долей российских бенефициаров больше 50% забанены независимо от страны регистрации. Активная волна банов аккаунтов идёт прямо сейчас.

OpenAI и Gemini — за VPN, оплата через прокси.

Это, по идее, должно было закрыть российскому разработчику доступ к frontier. В 2024-м — закрыло бы. В 2026-м — нет.

DeepSeek работает из России без VPN. Qwen, Kimi, GLM — тоже. Все четыре лидера open-source доступны напрямую и стоят в разы дешевле, чем то, к чему доступ закрыт. GigaChat запущен через официальный API Сбера, OpenAI-совместимый, рубли, договор с российским юр-лицом.

Это и есть «оказались на правильной стороне». Не потому что кто-то старался, не потому что геополитика повернулась. Потому что frontier сместился — а вместе с ним и центр доступности.

Где честная оговорка

Без неё пост превращается в победный реляц, а это не наш стиль.

Бенчмарки — не разработка. Натан Ламберт из Interconnects формулирует жёстко: «бенчмарки больше не настолько надёжный коррелят реальной работы, как раньше». Gemini 3 — «отлично показала себя на тестах, но оказалась неприменимой в деплое агентов». Закрытые лаборатории удерживают моаты, которых не видно в публичных скорах: приватные RL-окружения, специалистами размеченные данные, агентная обвязка.

На FrontierMath Tier 4 — самой жёсткой математической оценке — GPT-5.5 даёт 35,4%. Opus 4.7 — 22,9%. Открытые модели тут не близко. На OSWorld-Verified, агентных задачах в полноценной среде ОС, — у Opus и GPT-5.5 ~78%, у открытых заметно меньше.

Кодинг open-weights выиграл. Жёсткий ризонинг и продакшн-агенты — пока нет.

И Карпатый, главный евангелист openness, на прошлой неделе перешёл в Anthropic на pre-training. Не в Moonshot, не в DeepSeek, не в Zhipu. В Anthropic. Это не статистический сигнал, но это сигнал.

Что меняется на практике

Для российской команды в мае 2026-го реальный выбор инструмента выглядит примерно так:

  • Кодинг и агентные задачи. DeepSeek V4-Pro напрямую, GigaChat 3 для русскоязычных доменов, локальный Qwen3.6-27B на одной H100 при наличии. Семикратная разница в цене с Opus 4.7 — это не «дешевле, чем»: это окупаемость в другом масштабе.
  • Жёсткий ризонинг и научные задачи. GPT-5.5 — если задача стоит того. Доступ дороже, альтернатив пока нет.
  • Продакшн-агенты с долгим горизонтом. Kimi K2.6 — открытый, 4000 шагов в одной непрерывной сессии (текущий публичный рекорд индустрии).
  • Русскоязычные продукты. GigaChat 3 — впервые за всё время первый на MERA, можно ставить в продакшн без оговорок «но он не понимает спряжения».

Заметная деталь: ни одной позиции в списке нет, где правильным ответом было бы «попробуйте подключиться к Anthropic из РФ». Полтора года назад этой строчки нельзя было избежать.

И отдельный приятный сюрприз: GigaChat — это OpenAI-совместимый эндпойнт. Не «почти OpenAI», не «свой формат с конвертером», а буквально тот же chat/completions, тот же tools, тот же streaming. Любой клиент, написанный под openai-python, переключается сменой base_url. То же касается Яндекс.Поиска, который теперь говорит на Brave/Tavily-формате, и Wordstat — он DataForSEO-совместимый. Русский AI-стек перестал быть отдельной экосистемой с собственными SDK; он встал на ту же шину контрактов, на которой уже написано всё остальное.

Что это вообще значит

Цивилизационный сюжет короче пересказа: за пять лет frontier-AI прошёл от полностью закрытого, полностью американского, полностью платного — к наполовину открытому, наполовину китайскому, с резко сжатой ценой инференса. Не потому что кто-то решил «давайте делиться». Потому что в открытой конкуренции архитектура побеждает дисциплину, а Лян Вэньфэн оказался лучшим архитектором последних двух лет.

Янн Лекун сформулировал ещё проще: «Тем, кто говорит, что Китай обходит США в AI, стоит уточнить формулировку — открытые модели обходят закрытые».

Для российского контекста это редкий случай, когда глобальный тренд работает в пользу местной инженерной экономики, а не против. Не благодаря государству, не благодаря «импортозамещению», не благодаря Минцифре с её проектом закона о суверенном ИИ. А потому что центр гравитации индустрии сместился.

Это не значит, что всё хорошо. Стек оказался структурно китайским — и если завтра Пекин решит закрыть доступ к Hugging Face или ограничить экспорт весов «стратегического» уровня (USCC уже прогнозирует такой сценарий), вся текущая конфигурация рассыплется за неделю. Но это другой риск, не тот, к которому мы привыкли с 2022-го.

Frontier перестал быть привилегией. Доступ к нему — тоже. Это редкая хорошая новость, в которую теперь имеет смысл вкладываться.


Полезное:

Назад в блог

Похожие статьи

Все статьи »
Новый джун: код пишет не он

Новый джун: код пишет не он

Постинги джунов на западных площадках просели на 40–50%. Salesforce заморозила найм инженеров, AWS назвал это глупостью, а суд в Ханчжоу запретил увольнять за AI. Что вообще такое «джун» в 2026 году.

MCP и иллюзия открытого доступа

MCP и иллюзия открытого доступа

Новый протокол делает инструменты машиночитаемыми, но не делает цифровую среду открытой. Там, где доступ изначально дозируется государством и платформами, стандартизация лишь делает несвободу аккуратнее.