Ling-mini-2.0: компактная MoE-модель от Ant Group

Q: Кто разработал Ling-mini-base-2.0-20T?

Модель Ling-mini-base-2.0-20T разработана компанией Ant Group (China).

Q: Какие задачи решает Ling-mini-base-2.0-20T?

Генерация текста, Ответы на вопросы

// задачи

Генерация текстаОтветы на вопросы

// описание

Ling-mini-2.0 — это компактная, но производительная языковая модель на архитектуре MoE, обученная на колоссальном массиве данных в 20 триллионов токенов. Этот ИИ от Ant Group демонстрирует SOTA-результаты, сохраняя высокую скорость работы при минимальных затратах ресурсов.

// abstract

Today, we are excited to announce the open-sourcing of Ling 2.0 — a family of MoE-based large language models that combine SOTA performance with high efficiency. The first released version, Ling-mini-2.0, is compact yet powerful. It has 16B total parameters, but only 1.4B are activated per input token (non-embedding 789M). Trained on more than 20T tokens of high-quality data and enhanced through multi-stage supervised fine-tuning and reinforcement learning, Ling-mini-2.0 achieves remarkable improvements in complex reasoning and instruction following. With just 1.4B activated parameters, it still reaches the top-tier level of sub-10B dense LLMs and even matches or surpasses much larger MoE models.

// faq

Что такое Ling-mini-base-2.0-20T?+

Кто разработал Ling-mini-base-2.0-20T?+

Какие задачи решает Ling-mini-base-2.0-20T?+

// похожие модели