Llama 4 (Scout / Maverick)

Llama 4 (Scout / Maverick)
Ссылка на сайт https://llama.meta.com/
Результаты тестирования Llama 4 Maverick на LMArena — 1417 баллов, второе место после Gemini 2.5 Pro
Результаты тестирования Llama 4 Maverick на LMArena — 1417 баллов, второе место после Gemini 2.5 Pro

Семейство Llama 4 — это новое поколение открытых моделей искусственного интеллекта от компании Meta*, представленное в апреле 2025 года. В линейку вошли три модели: Llama 4 Scout, Llama 4 Maverick и флагманский Behemoth, который пока находится в стадии обучения. Главные инновации — нативная мультимодальность (работа с текстом, изображениями и видео) и архитектура Mixture of Experts (MoE), которая обещает высокую эффективность при сохранении качества. В этом обзоре мы разберем ключевые особенности Scout и Maverick, их плюсы и минусы, сравним с конкурентами и ответим на частые вопросы.

Основные характеристики Llama 4 Scout и Maverick

Llama 4 Scout:

  • Архитектура: Mixture of Experts (MoE), 16 экспертов

  • Активные параметры: 17 млрд

  • Общие параметры: 109 млрд

  • Контекстное окно: 10 млн токенов (заявлено)

  • Мультимодальность: текст, изображения, видео

  • Запуск: один GPU NVIDIA H100 (в 4-битной квантизации)

Llama 4 Maverick:

  • Архитектура: Mixture of Experts (MoE), 128 экспертов

  • Активные параметры: 17 млрд

  • Общие параметры: 400 млрд

  • Контекстное окно: 1 млн токенов

  • Мультимодальность: текст, изображения, видео

  • Запуск: от 4 до 8 GPU NVIDIA H100

Обе модели активируют только 17 млрд параметров на один запрос, что позволяет им работать с вычислительной скоростью компактных моделей, сохраняя при этом качество рассуждений, присущее большим моделям. Технология «раннего слияния» (early fusion) объединяет токены текста и изображений в единую структуру, что даёт модели целостное понимание мультимодальных данных.

Сравнительная таблица: Llama 4 Scout / Maverick vs конкуренты

ПараметрLlama 4 ScoutLlama 4 MaverickDeepSeek V3GPT-4oGemini 2.5 Pro
Активные параметры17B17B37B~20B (оценка)н/д
Общие параметры109B400B671Bн/дн/д
АрхитектураMoE (16 экспертов)MoE (128 экспертов)MoEDenseDense
Контекстное окно (заявлено)10M1M1M128K2M
Реальный контекст у провайдеров128K–328K128K–328K1M128K2M
MMLU-Pro74,3%82,1%~80%~83%~85%
HumanEval (кодинг)79,6%91,2%~90%~90%~92%
SWE-bench Verified32,8%48,7%~45%~46%52,1%
Цена API (вход/выход, $/1M)0,15 / 0,400,24 / 0,770,14 / 0,282,50 / 10,00н/д
МультимодальностьТекст, изображения, видеоТекст, изображения, видеоТекстТекст, изображения, аудиоТекст, изображения, видео
Открытый исходный кодДаДаДаНетНет
Минимальное оборудование (INT4)1x H100 (55GB VRAM)4x H100 (200GB VRAM)2x H100APIAPI

Данные собраны из независимых тестов и официальных источников по состоянию на март 2026 года 

Часто задаваемые вопросы (FAQ)

Что такое Llama 4 Scout и Maverick? Это два открытых ИИ-модели от Meta, построенные на архитектуре Mixture of Experts. Scout — более компактная версия с рекордным контекстным окном 10 млн токенов, Maverick — более мощная модель с 400 млрд параметров, ориентированная на сложные рассуждения и программирование. Обе модели являются мультимодальными и могут обрабатывать текст, изображения и видео .

Можно ли использовать Llama 4 бесплатно? Да, модели распространяются под открытой лицензией Meta. Вы можете скачать их с Hugging Face или Llama.com и запускать на своём оборудовании. Однако для работы потребуются мощные GPU — от одного H100 для Scout до четырёх H100 для Maverick в квантизированном виде. Также доступны API через облачных провайдеров по ценам от $0,15 за 1 млн токенов .

Почему Llama 4 критикуют? Основные претензии: заявленное контекстное окно Scout в 10 млн токенов практически недостижимо на практике из-за ограничений оборудования и провайдеров; результаты в программировании оказались слабее конкурентов; Meta использовала специальную версию модели для тестов LMArena, что ввело пользователей в заблуждение .

Какая модель лучше для программирования — Scout или Maverick? Maverick значительно сильнее в задачах кодирования: на HumanEval он показывает 91,2% против 79,6% у Scout. Однако оба уступают специализированным моделям вроде DeepSeek R1 и Gemma 3. Если ваш приоритет — работа с кодом, лучше рассмотреть Maverick или альтернативы .

Поддерживает ли Llama 4 русский язык? Да, модель поддерживает 12 языков, включая русский. Однако основное обучение проводилось на английском, и качество ответов на русском может быть ниже, чем у локальных моделей вроде YandexGPT или GigaChat.

Стоит ли использовать Llama 4 для бизнеса? Это зависит от ваших задач. Для сценариев, требующих обработки очень длинных документов (например, юридический анализ), Scout может быть интересен, несмотря на ограничения. Для общего использования, учитывая аппаратные требования и спорные результаты, возможно, стоит рассмотреть DeepSeek V3 или проприетарные API. Однако если у вас есть собственная GPU-инфраструктура и вы обрабатываете более 50 млн токенов в месяц, Llama 4 может снизить затраты на 60–80%.

Заключение

Llama 4 Scout и Maverick — амбициозный шаг Meta в сторону мультимодальных открытых моделей с архитектурой MoE. Они предлагают впечатляющие технические характеристики, особенно Scout с его рекордным контекстным окном, и открывают возможности для экономичного развертывания на собственном оборудовании. Однако релиз оказался омрачён серьёзной критикой: заявленные возможности контекста оказались труднодостижимыми, результаты в программировании уступают конкурентам, а маркетинговые методы Meta вызвали вопросы о честности бенчмарков. Если вы готовы мириться с этими ограничениями и имеете необходимую GPU-инфраструктуру, Llama 4 может стать полезным инструментом. В противном случае стоит присмотреться к DeepSeek V3 или проверенным проприетарным решениям.

Meta признана экстремистской организацией, её деятельность запрещена на территории РФ

Войти

Зарегистрироваться

Сбросить пароль

Пожалуйста, введите ваше имя пользователя или эл. адрес, вы получите письмо со ссылкой для сброса пароля.