Яндекс Метрика
cs.LG, cs.AI, cs.CV

«Патчинг» моделей: устранение разрыва в производительности на подгруппах с помощью аугментации данных

Karan Goel, Albert Gu, Yixuan Li, Christopher Ré15.08.2020

Классификаторы в машинном обучении часто оказываются нестабильными при практическом применении. Особую проблему представляют модели с неодинаковой точностью на определенных подгруппах внутри класса — например, при диагностике рака кожи наличие или отсутствие случайного пластыря на фото может искажать результат. Для решения этой проблемы авторы представляют «патчинг» моделей — двухэтапную архитектуру для повышения робастности. Метод стимулирует модель игнорировать различия между подгруппами и фокусироваться на общих признаках класса.

Работа представляет фреймворк «патчинга моделей» для устранения разрывов в точности нейросетей на специфических подгруппах данных. Исследователи решают проблему хрупкости классификаторов, которые могут ошибаться из-за побочных признаков — например, путая наличие пластыря на коже с признаком заболевания. Предложенный метод двухэтапного обучения с аугментацией данных значительно повышает устойчивость и справедливость ИИ-моделей.

Karan Goel, Albert Gu, Yixuan Li, Christopher Ré