Яндекс Метрика
Математика, Языковая модель

Llemma 7B

Princeton University,EleutherAI,University of Toronto,Vector Institute,University of Cambridge,Carnegie Mellon University (CMU),University of Washington
Mathematical reasoningГенерация текстаОтветы на вопросыГенерация кода

Компактная версия Llemma 7B предлагает впечатляющие математические способности при меньших требованиях к ресурсам. Модель идеально подходит для генерации доказательств и работы с математическим кодом, базируясь на обширном наборе научных данных Proof-Pile-2.

We present Llemma, a large language model for mathematics. We continue pretraining Code Llama on the Proof-Pile-2, a mixture of scientific papers, web data containing mathematics, and mathematical code, yielding Llemma. On the MATH benchmark Llemma outperforms all known open base models, as well as the unreleased Minerva model suite on an equi-parameter basis. Moreover, Llemma is capable of tool use and formal theorem proving without any further finetuning. We openly release all artifacts, including 7 billion and 34 billion parameter models, the Proof-Pile-2, and code to replicate our experiments.

Что такое Llemma 7B?+
Кто разработал Llemma 7B?+
Какие задачи решает Llemma 7B?+