// описание
«Золотая» выборка из 500 задач, проверенная вручную для оценки способности ИИ решать реальные проблемы в программном коде. В отличие от стандартных тестов, здесь исключены ошибки в самих заданиях, что делает его идеальным бенчмарком для автономных ИИ-агентов и кодинг-ассистентов. Если ваш агент прошел этот тест, он действительно готов к работе с GitHub.