Jamba

Описание Jamba

Jamba – это семейство крупномасштабных моделей от AI21, построенных на гибридной архитектуре Transformer + Mamba с использованием Mixture-of-Experts (MoE). Такая схема объединяет сильные стороны классических трансформеров (точность, качество рассуждений) и Mamba-SSM (линейная работа с длинными последовательностями), обеспечивая высокую скорость и низкое потребление памяти при сохранении качества топовых LLM. В Jamba и Jamba 1.5 окно контекста достигает 256K токенов (сотни страниц текста), а старшие версии имеют до сотен миллиардов параметров и ~94B активных на токен, оставаясь разворачиваемыми на ограниченном парке GPU. Технически Jamba – это decoder-only LLM с чередованием блоков Transformer и Mamba, в части слоёв добавлены MoE-эксперты, что увеличивает ёмкость модели без взрывного роста вычислений. Архитектура рассчитана на обработку 256K-контекста с высокой пропускной способностью, поддерживает instruction tuning и оптимизации вроде ExpertsInt8, позволяющие обслуживать длинные запросы на кластере из нескольких GPU без потери качества. На базе Jamba можно строить системы, которые «читают» огромные массивы текстов: корпоративные RAG-платформы поверх внутренней документации, ассистенты для анализа контрактов, логов и отчётов, мощные чат-боты и исследовательские ассистенты, а также copilot-решения для разработчиков и аналитиков, где важны длинная история диалога и глубокое контекстное понимание. Команда FreeBlock реализует полный цикл проектов на основе Jamba: подберём оптимальную версию модели, настроим её на ваших данных, выстроим RAG-архитектуру и интегрируем решение в существующие продукты и инфраструктуру. Если вы хотите использовать Jamba для создания ассистентов, аналитических систем или долгоконтекстных ИИ-платформ, заказывайте разработку ИИ-проектов с моделью Jamba в компании FreeBlock.

Оформить заявку

!
Поле заполнено некорректно
!
Поле заполнено некорректно
Мы обрабатываются файлы cookie. Оставаясь на сайте, вы даёте своё согласие на использование cookie в соответствии с политикой конфиденциальности