Яндекс Метрика
Генерация текста

gsm8k

openai

Легендарный набор из 8,5 тысяч математических задач уровня начальной школы, на которых проверяется логика современных LLM. Датасет требует от модели не просто угадать ответ, а выстроить цепочку многошаговых рассуждений. Это главный стандарт для оценки навыков Reasoning и способности нейросети к решению базовых арифметических задач.