// задачи
Mathematical reasoningГенерация текстаОтветы на вопросыГенерация кода
// описание
Llemma 34B — это специализированная языковая модель, дообученная для решения сложнейших математических задач и написания научного кода. Этот ИИ демонстрирует лучшие результаты среди открытых моделей в тестах MATH и умеет использовать внешние вычислительные инструменты.
// abstract
We present Llemma, a large language model for mathematics. We continue pretraining Code Llama on the Proof-Pile-2, a mixture of scientific papers, web data containing mathematics, and mathematical code, yielding Llemma. On the MATH benchmark Llemma outperforms all known open base models, as well as the unreleased Minerva model suite on an equi-parameter basis. Moreover, Llemma is capable of tool use and formal theorem proving without any further finetuning. We openly release all artifacts, including 7 billion and 34 billion parameter models, the Proof-Pile-2, and code to replicate our experiments.
// faq
Что такое Llemma 34B?+
Llemma 34B — это специализированная языковая модель, дообученная для решения сложнейших математических задач и написания научного кода. Этот ИИ демонстрирует лучшие результаты среди открытых моделей в тестах MATH и умеет использовать внешние вычислительные инструменты.
Кто разработал Llemma 34B?+
Модель Llemma 34B разработана компанией Princeton University,University of Toronto,Vector Institute,University of Cambridge,Carnegie Mellon University (CMU),University of Washington,EleutherAI (United States of America,Canada,Canada,United Kingdom of Great Britain and Northern Ireland,United States of America,United States of America,United States of America).
Какие задачи решает Llemma 34B?+
Mathematical reasoning, Генерация текста, Ответы на вопросы, Генерация кода