В основе нового семейства Llama 4 лежит Llama 4 Behemoth, LLM с двумя триллионами параметров, который все еще находится в процессе обучения, и две его разновидности — Maverick и Scout — доступны уже сейчас разработчикам для разработки и пользователям для пробы через приложения Meta или веб-сайт Meta.ai. Они обещают быть изначально мультимодальными, то есть способными работать с различными медиа помимо текста, и имеют результаты тестов, которые, по словам Meta, ставят их впереди известных конкурентов.
Выпуск Meta (META) произошел в то время, когда американские компании спешат отреагировать на шквал новых моделей и услуг технологического сектора Китая в последние недели. С момента дебюта DeepSeek в январе компании от Alibaba Group Holding Ltd. до Tencent Holdings Ltd. (0700) ускорили темпы анонсов новых ИИ и углубили инвестиции, чтобы обеспечить себе прочную позицию. Baidu Inc. (BIDU) сделала своего Ernie Bot бесплатным, Tencent интегрировала DeepSeek в свое вездесущее приложение WeChat, а Alibaba выпустила несколько моделей, которые, по ее словам, превзошли DeepSeek.
Базирующаяся в Менло-Парке, Калифорния, Meta также сравнивает себя с DeepSeek — наряду с OpenAI и Google Alphabet Inc. (GOOGL) — и также решает вопрос стоимости для пользователей своих новых инструментов Llama. Впервые компания принимает архитектуру Mixture of Experts, которую DeepSeek использовала с большим успехом для снижения стоимости своей модели. Преимущество такого подхода заключается в большей эффективности, поскольку системы MoE сегментируют рабочую нагрузку на более управляемые части.
*организация, признанная экстремистской в РФ