Llama 4 (Scout / Maverick)


Семейство Llama 4 — это новое поколение открытых моделей искусственного интеллекта от компании Meta*, представленное в апреле 2025 года. В линейку вошли три модели: Llama 4 Scout, Llama 4 Maverick и флагманский Behemoth, который пока находится в стадии обучения. Главные инновации — нативная мультимодальность (работа с текстом, изображениями и видео) и архитектура Mixture of Experts (MoE), которая обещает высокую эффективность при сохранении качества. В этом обзоре мы разберем ключевые особенности Scout и Maverick, их плюсы и минусы, сравним с конкурентами и ответим на частые вопросы.
Основные характеристики Llama 4 Scout и Maverick
Llama 4 Scout:
Архитектура: Mixture of Experts (MoE), 16 экспертов
Активные параметры: 17 млрд
Общие параметры: 109 млрд
Контекстное окно: 10 млн токенов (заявлено)
Мультимодальность: текст, изображения, видео
Запуск: один GPU NVIDIA H100 (в 4-битной квантизации)
Llama 4 Maverick:
Архитектура: Mixture of Experts (MoE), 128 экспертов
Активные параметры: 17 млрд
Общие параметры: 400 млрд
Контекстное окно: 1 млн токенов
Мультимодальность: текст, изображения, видео
Запуск: от 4 до 8 GPU NVIDIA H100
Обе модели активируют только 17 млрд параметров на один запрос, что позволяет им работать с вычислительной скоростью компактных моделей, сохраняя при этом качество рассуждений, присущее большим моделям. Технология «раннего слияния» (early fusion) объединяет токены текста и изображений в единую структуру, что даёт модели целостное понимание мультимодальных данных.
Сравнительная таблица: Llama 4 Scout / Maverick vs конкуренты
| Параметр | Llama 4 Scout | Llama 4 Maverick | DeepSeek V3 | GPT-4o | Gemini 2.5 Pro |
|---|---|---|---|---|---|
| Активные параметры | 17B | 17B | 37B | ~20B (оценка) | н/д |
| Общие параметры | 109B | 400B | 671B | н/д | н/д |
| Архитектура | MoE (16 экспертов) | MoE (128 экспертов) | MoE | Dense | Dense |
| Контекстное окно (заявлено) | 10M | 1M | 1M | 128K | 2M |
| Реальный контекст у провайдеров | 128K–328K | 128K–328K | 1M | 128K | 2M |
| MMLU-Pro | 74,3% | 82,1% | ~80% | ~83% | ~85% |
| HumanEval (кодинг) | 79,6% | 91,2% | ~90% | ~90% | ~92% |
| SWE-bench Verified | 32,8% | 48,7% | ~45% | ~46% | 52,1% |
| Цена API (вход/выход, $/1M) | 0,15 / 0,40 | 0,24 / 0,77 | 0,14 / 0,28 | 2,50 / 10,00 | н/д |
| Мультимодальность | Текст, изображения, видео | Текст, изображения, видео | Текст | Текст, изображения, аудио | Текст, изображения, видео |
| Открытый исходный код | Да | Да | Да | Нет | Нет |
| Минимальное оборудование (INT4) | 1x H100 (55GB VRAM) | 4x H100 (200GB VRAM) | 2x H100 | API | API |
Данные собраны из независимых тестов и официальных источников по состоянию на март 2026 года
Часто задаваемые вопросы (FAQ)
Что такое Llama 4 Scout и Maverick? Это два открытых ИИ-модели от Meta, построенные на архитектуре Mixture of Experts. Scout — более компактная версия с рекордным контекстным окном 10 млн токенов, Maverick — более мощная модель с 400 млрд параметров, ориентированная на сложные рассуждения и программирование. Обе модели являются мультимодальными и могут обрабатывать текст, изображения и видео .
Можно ли использовать Llama 4 бесплатно? Да, модели распространяются под открытой лицензией Meta. Вы можете скачать их с Hugging Face или Llama.com и запускать на своём оборудовании. Однако для работы потребуются мощные GPU — от одного H100 для Scout до четырёх H100 для Maverick в квантизированном виде. Также доступны API через облачных провайдеров по ценам от $0,15 за 1 млн токенов .
Почему Llama 4 критикуют? Основные претензии: заявленное контекстное окно Scout в 10 млн токенов практически недостижимо на практике из-за ограничений оборудования и провайдеров; результаты в программировании оказались слабее конкурентов; Meta использовала специальную версию модели для тестов LMArena, что ввело пользователей в заблуждение .
Какая модель лучше для программирования — Scout или Maverick? Maverick значительно сильнее в задачах кодирования: на HumanEval он показывает 91,2% против 79,6% у Scout. Однако оба уступают специализированным моделям вроде DeepSeek R1 и Gemma 3. Если ваш приоритет — работа с кодом, лучше рассмотреть Maverick или альтернативы .
Поддерживает ли Llama 4 русский язык? Да, модель поддерживает 12 языков, включая русский. Однако основное обучение проводилось на английском, и качество ответов на русском может быть ниже, чем у локальных моделей вроде YandexGPT или GigaChat.
Стоит ли использовать Llama 4 для бизнеса? Это зависит от ваших задач. Для сценариев, требующих обработки очень длинных документов (например, юридический анализ), Scout может быть интересен, несмотря на ограничения. Для общего использования, учитывая аппаратные требования и спорные результаты, возможно, стоит рассмотреть DeepSeek V3 или проприетарные API. Однако если у вас есть собственная GPU-инфраструктура и вы обрабатываете более 50 млн токенов в месяц, Llama 4 может снизить затраты на 60–80%.
Заключение
Llama 4 Scout и Maverick — амбициозный шаг Meta в сторону мультимодальных открытых моделей с архитектурой MoE. Они предлагают впечатляющие технические характеристики, особенно Scout с его рекордным контекстным окном, и открывают возможности для экономичного развертывания на собственном оборудовании. Однако релиз оказался омрачён серьёзной критикой: заявленные возможности контекста оказались труднодостижимыми, результаты в программировании уступают конкурентам, а маркетинговые методы Meta вызвали вопросы о честности бенчмарков. Если вы готовы мириться с этими ограничениями и имеете необходимую GPU-инфраструктуру, Llama 4 может стать полезным инструментом. В противном случае стоит присмотреться к DeepSeek V3 или проверенным проприетарным решениям.
Meta признана экстремистской организацией, её деятельность запрещена на территории РФ


