Почему Grok 4 Fast – такая же мини-революция, как и DeepSeek R1?

Принадлежащий Илону Маску стартап xAI ещё в июле показал ИИ-модель Grok 4, которая в таких тестах, как ARC-AGI и Terminal-Bench, неожиданно превзошла вышедшую месяцем позже GPT-5. Казалось бы, сейчас новостей от xAI ждать не стоит: Grok 4 вышел в июле, а до Grok 5 ещё далеко. Однако команда разработчиков решила удивить и представила модель Grok 4 Fast.

Её сила – неожиданно высокое на текущий момент сочетание «ума» и цены. Нечто подобное в начале года сделал китайский стартап DeepSeek с помощью модели R1. Однако Grok 4 Fast значительно умнее и дешевле даже «китайца».

Цены снизились в десятки раз

Самый главный факт: Grok 4 Fast радикально дешевле обычного Grok 4. Цена на API составляет $0.2/$0.5 за миллион входящих/исходящих токенов против $3/$15 у обычного Grok 4. При этом самих токенов используется на 40% меньше. Напомним, в самом начале года DeepSeek также впечатлили рынок, представив весьма продвинутую на тот момент модель R1 с ценами $0.55/$2.19. Однако команда Илона Маска сумела ощутимо побить этот рекорд.

Порталу Artificial Analysis, который занимается профессиональным тестированием ИИ-моделей, «прогон» Grok 4 Fast через десятку ключевых тестов обошёлся всего в 40 долларов. К сравнению, аналогичный «прогон» других известных моделей стоил:

  • Claude 4.1 Opus – $3124;
  • Grok 4 – $1888;
  • Gemini 2.5 Pro – $1068;
  • GPT-5 (high) – $927;
  • Claude 4 Sonnet – $827;
  • Gemini 2.5 Flash – $248;
  • GPT-5 (low) – $239;
  • DeepSeek R1 0528 – $235;
  • DeepSeek V3.1 – $168;
  • Grok 4 Fast – $40.

Колоссальная разница в цене между Grok 4 и Grok 4 Fast.

Таким образом, Илон Маск в сентябре 2025 года буквально переписал правила игры, переведя свой ИИ Grok из категории «самые дорогие» в категорию «самые доступные». Причём сделал это «тигриным прыжком» и абсолютно внезапно. На примере Artificial Analysis видно, что разница в эксплуатации Grok 4 и Grok 4 Fast составляет примерно 47 раз. Именно во столько новая сентябрьская модель может быть дешевле июльского Grok 4 в реальных задачах.

Более того, модели DeepSeek R1 и V3 на фоне новинки уже не выглядят дешёвыми. Их эксплуатация через API обходится примерно в 4-6 раз дороже.

Как радикальное изменение цен отразилось на интеллекте модели?

Справедливости ради, на рынке уже есть сверхдешёвая модель Gemini 2.5 Flash Lite от Google. У DeepSeek есть дешёвый V3.1 в «не думающей» версии, а у OpenAI есть очень недорогая в эксплуатации GPT OSS 20B. В чём тогда «революция» от Grok 4 Fast? Она в сочетании цены и интеллекта модели.

Насколько хуже Grok 4 Fast базового Grok 4, с учётом снизившегося в десятки раз ценника? И вот тут пользователей ждёт второй большой сюрприз. Разница в тестах на удивление невелика, более того, в отдельных из них Grok 4 Fast умудряется слегка превосходить Grok 4.

Так, из самых ключевых тестов* просели результаты в GPQA, что проверяет рассуждения и научные знания. Если Grok 4 набирал здесь 88%, то Grok 4 Fast набирает 85%. Те же 85% набирает и GPT-5 в своей наиболее сильной версии High. DeepSeek R1 набирает 81%.

Лучшие ИИ-модели по версии теста GPQA.

В MMLU-Pro результат, если верить Artificial Analysis, от Grok 4 к Grok 4 Fast упал с 87 до 85%. В AIME 2025 – с 93 до 90%. Как команде удалось при такой сильнейшей оптимизации модели сохранить почти прежние показатели – загадка.

Наиболее крупная просадка случилась в сложном тесте Terminal-Bench Hard, где модель рухнула с 38 до 18%. В других бенчмарках подобного падения не наблюдается.

При этом в LiveCodeBench Grok 4 Fast, напротив, набирает 83% против 82% у Grok 4 и в целом является лидером теста, оставляя позади всех, включая GPT-5 и DeepSeek.

В этих и других тестах (кроме Terminal-Bench) модель идёт очень близко к двум сильнейшим конкурентам: GPT-5 и Gemini 2.5 Pro. Только вот стоят они радикально дороже, а Grok 4 Fast порой ещё и может их обгонять. DeepSeek R1 и вовсе почти везде остаётся позади. Причём речь именно про актуальную майскую версию R1 0528.

Комплексный результат тестирования ИИ-моделей, основанный на 10 ключевых тестах.

В целом, сам факт того, что модель, чья эксплуатация обошлась в 40 долларов, выдаёт результаты уровня моделей, на которые в тех же задачах ушло около 1000 долларов – главное достижение Grok 4 Fast. И оно окажет сильное давление на конкурентов в будущем.

Заметим, что Grok 4 Fast – это, конечно же, рассуждающая модель (reasoning). Однако у неё есть ещё и не рассуждающий режим, «прогон» которого через тесты обошёлся авторам Artificial Analysis уже не в 40, а всего в 14 долларов. Казалось бы, ещё один успех, но всё же нет.

Не рассуждающий режим у модели, напротив, вышел весьма слабым: показатели в бенчмарках проседают слишком сильно. Grok 4 Fast большинству стоит использовать именно с возможностью «мыслить» перед ответом. В этом он по-настоящему силён и выдаёт результат на уровне SOTA-моделей.

Конкуренция Grok, DeepSeek и Google

Появление Grok 4 Fast с его крайне низкими ценами – такой же огромный толчок для конкуренции в сфере ИИ, как появление DeepSeek R1 в начале года. Модели Grok выпускаются ещё с 2023, однако, как кажется редакции mobilenotes, именно сейчас Илон Маск впервые всерьёз заставил конкурентов нервничать. Ведь у них подобного нет.

Пока что сложно представить компанию, которая могла бы бросить вызов Grok 4 Fast, предложив настолько интеллектуальную систему со схожими ценами. Вероятно, единственным кандидатом здесь является Google с их Gemini Flash и Gemini Flash Lite. К слову, буквально пару недель назад Маск утверждал, что из конкурентов считает сильнейшими именно Google и китайские компании, а не OpenAI (авторы ChatGPT).

Текущие версии Google Gemini 2.5 Flash и Flash Lite сейчас могут сравниться с Grok 4 Fast ценой, но точно не качеством.

Модели Gemini 3.0 в теории могли бы составить конкуренцию новому Grok. Однако про Gemini 3.0 на момент написания этого текста информации нет, да и непонятно, будет ли скачок эффективности достаточно большим.

Что касается китайских моделей, то их лидер – DeepSeek, кажется, испытывает заметные сложности. Вероятно, это связано с переходом от решений Nvidia на китайские ИИ-ускорители, который происходит совсем не гладко. В итоге модели DeepSeek R2 всё ещё нет, когда она появится – неизвестно, да и цены на неё вряд ли будут существенно дешевле нынешних на R1.

Из России Grok 4 и 4 Fast можно опробовать через ресурс LMArena. Это бесплатно и не требует регистрации. Достаточно выбрать в верхнем меню режимы Side by Side или Direct Chat, а следом выбрать нужную модель или модели.

Заключение и немного о будущих планах xAI

В итоге, как нам кажется, Grok 4 Fast – это вторая революция сочетания «цена/возможности», произошедшая в этом году. Первой была модель DeepSeek R1, которая сделала китайский стартап известным на весь мир. Детище Илона Маска, в свою очередь, и так уже обладает определённой долей известности. Но теперь его главный недостаток – цена превратился в сильнейшее достоинство.

Что значит появление Grok 4 Fast для простых пользователей, которым все равно на цены API? Это значит, что весьма скоро на бесплатных тарифах можно будет использовать крайне сильную модель флагманского уровня, а не что-то урезанное по интеллекту. С такими ценами лимиты на Grok 4 Fast будут весьма свободными, либо их не будет вообще. Конкурентам на это придётся как-то реагировать.

Artificial Analysis также отмечают, что слово «Fast» (быстрый) в названии модели отнюдь не случайно. Скорость вывода токенов в ней в полтора раза выше, чем в GPT-5 и примерно в 5 раз выше, чем в изначальном Grok 4.

Новая модель – лидер по скорости среди наиболее сильных LLM.

Задержка с началом ответа у Grok 4 Fast составляет всего 3,4 секунды против 14 секунд у Grok 4 GPT-5. К сравнению, DeepSeek R1, предположительно из-за проблем с оборудованием Huawei, имеет скорость вывода более чем в десять раз медленнее Grok 4 Fast. А задержка с началом ответа может достигать 100 секунд.

Grok 4 Fast «откликается» на запрос пользователя практически мгновенно.

Ещё один впечатляющий апгрейд Grok 4 Fast на фоне обычного Grok 4 и большинства конкурентов – огромное контекстное окно в 2 миллиона токенов. Это в 8 раз больше, чем было в Grok 4, в 5 раз больше, чем в GPT-5 и в 16 раз больше, чем в DeepSeek R1. Иными словами, система сможет держать в «памяти» даже очень длительные диалоги и большие массивы информации.

Grok 4 Fast оказался крайне интересным и внезапным релизом от xAI. Впрочем, у команды есть и другие планы. Так, до конца сентября может быть представлена некая агентская система, которая сможет выполнять часть задач в сети автономно, экономя время пользователя. Это конкурент для ChatGPT agent.

В октябре ожидается выпуск первого генератора видео от команды Илона Маска. Он даст «бой» нынешнему лидеру в лице Veo 3 от Google, а также Sora или будущей Sora 2 от OpenAI.

На более отдалённую перспективу компания хочет прокачать своих виртуальных аватаров. Напомним, аниме-аватар Ani этим летом наделал много шума. Илон Маск первым из крупных игроков решился дать своему ИИ реальный облик, а вдобавок ещё и разрешил с ним флиртовать. Пока ни одна другая большая компания на ИИ-рынке не предлагает чего-то подобного.

Появление Ani, по данным Similarweb, позволило Grok взлететь на четвёртое место среди самых популярных в сети ИИ-сайтов. Выше только ChatGPT, Gemini и DeepSeek. Фото: WIRED.

С тех пор в xAI даже разместили вакансии в социальных сетях на разработчиков, которые будут специализироваться именно на привлекательных ИИ-аватарах и их улучшении.

Наконец, самым любопытным релизом является Grok 5. Маск сообщает, что основной этап работы над системой начнётся уже в этом месяце, а её выпуск ожидается до конца года. По мнению Илона, Grok 5 будет настолько хорош, что может претендовать на научно-фантастический статус AGI.

Скорее всего, это лишь красивая реклама от миллиардера, да и выпуск самой модели запросто может быть перенесён на начало следующего года. Тем не менее, с учётом какими получились Grok 4 и 4 Fast, взглянуть на результат определённо будет интересно.

* – результаты тестов указаны по данным Artificial Analysis, официальные данные могут слегка отличаться, в контексте больших языковых моделей это нормально.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *