// описание

Золотой стандарт для проверки «интеллекта» языковых моделей, охватывающий 57 предметов от элементарной математики до юриспруденции и этики. Этот массив многовариантных вопросов помогает разработчикам понять, насколько нейросеть способна к многозадачности и обладает ли она общими знаниями о мире. Если вы создаете LLM, этот тест станет для неё самым суровым и честным экзаменом.

← все датасеты

mmlu