Яндекс Метрика
V

Vision Transformer (ViT)

// определение

Архитектура нейросети на базе трансформера, адаптированная для задач компьютерного зрения. ViT разбивает изображение на небольшие фрагменты (патчи) и обрабатывает их как последовательность токенов, подобно словам в тексте.

// faq
Что такое Vision Transformer (ViT)?+
Как Vision Transformer (ViT) используется в ИИ?+