// описание
Элитная подборка из 500 задач с GitHub, прошедших строгую ручную проверку экспертами для оценки качества ИИ-разработчиков. В отличие от сырых данных, этот бенчмарк гарантирует корректность условий, проверяя реальную способность моделей исправлять баги в коде. Если вы создаете ИИ-агента для программной инженерии, это самый честный и надежный «экзамен» на рынке.