Тестирование моделей глубокого обучения осложняется огромным объемом и высокой сложностью необходимых вычислений. В результате выбор тестовых данных часто проводится вручную и бессистемно, что ставит вопрос об автоматизации этого процесса. Современные исследования сосредоточены на адаптации метрик из традиционного тестирования ПО (например, покрытия кода) для нужд глубокого обучения. Однако модели глубокого обучения обладают специфическими характеристиками, которые отличают их от обычного программного кода.
Исследование посвящено автоматизации процесса выбора данных для тестирования нейросетей, который традиционно выполняется вручную. Авторы адаптируют проверенные метрики из классического тестирования ПО для нужд глубокого обучения, чтобы сделать проверку моделей более эффективной. Это позволяет быстрее находить критические ошибки в сложных алгоритмах, снижая вычислительные затраты.