// задачи
Языковое моделированиеImage captioningВизуальные ответы на вопросы
// описание
IDEFICS-80B — это мощная мультимодальная нейросеть с открытым доступом, созданная на базе архитектуры Flamingo. Модель мастерски объединяет визуальное восприятие и текст, позволяя анализировать изображения и отвечать на сложные вопросы в стиле GPT-4.
// abstract
We are excited to release IDEFICS (Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS), an open-access visual language model. IDEFICS is based on Flamingo, a state-of-the-art visual language model initially developed by DeepMind, which has not been released publicly. Similarly to GPT-4, the model accepts arbitrary sequences of image and text inputs and produces text outputs.
// faq
Что такое IDEFICS-80B?+
Кто разработал IDEFICS-80B?+
Какие задачи решает IDEFICS-80B?+
// похожие модели