Для программистов и разработчиков Нейросети для текста и копирайтинга

Llama 4 (Scout / Maverick)

Добавлено 27.03.2026

Ссылка на сайт https://llama.meta.com/

Результаты тестирования Llama 4 Maverick на LMArena — 1417 баллов, второе место после Gemini 2.5 Pro

Семейство Llama 4 — это новое поколение открытых моделей искусственного интеллекта от компании Meta*, представленное в апреле 2025 года. В линейку вошли три модели: Llama 4 Scout, Llama 4 Maverick и флагманский Behemoth, который пока находится в стадии обучения. Главные инновации — нативная мультимодальность (работа с текстом, изображениями и видео) и архитектура Mixture of Experts (MoE), которая обещает высокую эффективность при сохранении качества. В этом обзоре мы разберем ключевые особенности Scout и Maverick, их плюсы и минусы, сравним с конкурентами и ответим на частые вопросы.

Основные характеристики Llama 4 Scout и Maverick

Llama 4 Scout:

Архитектура: Mixture of Experts (MoE), 16 экспертов
Активные параметры: 17 млрд
Общие параметры: 109 млрд
Контекстное окно: 10 млн токенов (заявлено)
Мультимодальность: текст, изображения, видео
Запуск: один GPU NVIDIA H100 (в 4-битной квантизации)

Llama 4 Maverick:

Архитектура: Mixture of Experts (MoE), 128 экспертов
Активные параметры: 17 млрд
Общие параметры: 400 млрд
Контекстное окно: 1 млн токенов
Мультимодальность: текст, изображения, видео
Запуск: от 4 до 8 GPU NVIDIA H100

Обе модели активируют только 17 млрд параметров на один запрос, что позволяет им работать с вычислительной скоростью компактных моделей, сохраняя при этом качество рассуждений, присущее большим моделям. Технология «раннего слияния» (early fusion) объединяет токены текста и изображений в единую структуру, что даёт модели целостное понимание мультимодальных данных.

Сравнительная таблица: Llama 4 Scout / Maverick vs конкуренты

Параметр	Llama 4 Scout	Llama 4 Maverick	DeepSeek V3	GPT-4o	Gemini 2.5 Pro
Активные параметры	17B	17B	37B	~20B (оценка)	н/д
Общие параметры	109B	400B	671B	н/д	н/д
Архитектура	MoE (16 экспертов)	MoE (128 экспертов)	MoE	Dense	Dense
Контекстное окно (заявлено)	10M	1M	1M	128K	2M
Реальный контекст у провайдеров	128K–328K	128K–328K	1M	128K	2M
MMLU-Pro	74,3%	82,1%	~80%	~83%	~85%
HumanEval (кодинг)	79,6%	91,2%	~90%	~90%	~92%
SWE-bench Verified	32,8%	48,7%	~45%	~46%	52,1%
Цена API (вход/выход, $/1M)	0,15 / 0,40	0,24 / 0,77	0,14 / 0,28	2,50 / 10,00	н/д
Мультимодальность	Текст, изображения, видео	Текст, изображения, видео	Текст	Текст, изображения, аудио	Текст, изображения, видео
Открытый исходный код	Да	Да	Да	Нет	Нет
Минимальное оборудование (INT4)	1x H100 (55GB VRAM)	4x H100 (200GB VRAM)	2x H100	API	API

Данные собраны из независимых тестов и официальных источников по состоянию на март 2026 года

Часто задаваемые вопросы (FAQ)

Что такое Llama 4 Scout и Maverick? Это два открытых ИИ-модели от Meta, построенные на архитектуре Mixture of Experts. Scout — более компактная версия с рекордным контекстным окном 10 млн токенов, Maverick — более мощная модель с 400 млрд параметров, ориентированная на сложные рассуждения и программирование. Обе модели являются мультимодальными и могут обрабатывать текст, изображения и видео .

Можно ли использовать Llama 4 бесплатно? Да, модели распространяются под открытой лицензией Meta. Вы можете скачать их с Hugging Face или Llama.com и запускать на своём оборудовании. Однако для работы потребуются мощные GPU — от одного H100 для Scout до четырёх H100 для Maverick в квантизированном виде. Также доступны API через облачных провайдеров по ценам от $0,15 за 1 млн токенов .

Почему Llama 4 критикуют? Основные претензии: заявленное контекстное окно Scout в 10 млн токенов практически недостижимо на практике из-за ограничений оборудования и провайдеров; результаты в программировании оказались слабее конкурентов; Meta использовала специальную версию модели для тестов LMArena, что ввело пользователей в заблуждение .

Какая модель лучше для программирования — Scout или Maverick? Maverick значительно сильнее в задачах кодирования: на HumanEval он показывает 91,2% против 79,6% у Scout. Однако оба уступают специализированным моделям вроде DeepSeek R1 и Gemma 3. Если ваш приоритет — работа с кодом, лучше рассмотреть Maverick или альтернативы .

Поддерживает ли Llama 4 русский язык? Да, модель поддерживает 12 языков, включая русский. Однако основное обучение проводилось на английском, и качество ответов на русском может быть ниже, чем у локальных моделей вроде YandexGPT или GigaChat.

Стоит ли использовать Llama 4 для бизнеса? Это зависит от ваших задач. Для сценариев, требующих обработки очень длинных документов (например, юридический анализ), Scout может быть интересен, несмотря на ограничения. Для общего использования, учитывая аппаратные требования и спорные результаты, возможно, стоит рассмотреть DeepSeek V3 или проприетарные API. Однако если у вас есть собственная GPU-инфраструктура и вы обрабатываете более 50 млн токенов в месяц, Llama 4 может снизить затраты на 60–80%.

Заключение

Llama 4 Scout и Maverick — амбициозный шаг Meta в сторону мультимодальных открытых моделей с архитектурой MoE. Они предлагают впечатляющие технические характеристики, особенно Scout с его рекордным контекстным окном, и открывают возможности для экономичного развертывания на собственном оборудовании. Однако релиз оказался омрачён серьёзной критикой: заявленные возможности контекста оказались труднодостижимыми, результаты в программировании уступают конкурентам, а маркетинговые методы Meta вызвали вопросы о честности бенчмарков. Если вы готовы мириться с этими ограничениями и имеете необходимую GPU-инфраструктуру, Llama 4 может стать полезным инструментом. В противном случае стоит присмотреться к DeepSeek V3 или проверенным проприетарным решениям.

Meta признана экстремистской организацией, её деятельность запрещена на территории РФ