Яндекс Метрика
Генерация текста

FineWeb-HQ

epfml

Элитная выборка из FineWeb, куда попали только самые информативные и структурированные документы, отобранные с помощью нейросетевого классификатора. Этот датасет нацелен на повышение «интеллекта» моделей, отсекая информационный шум и оставляя только знания с высокой плотностью. Идеальный выбор для тех, кто делает ставку на качество данных, а не на их сырой объем.