Яндекс Метрика
Компьютерное зрение, Языковая модель, Мультимодальная модель

Yi-VL-34B

01.AI
Визуальные ответы на вопросыГенерация текста

Yi-VL-34B — флагманская мультимодальная нейросеть от 01.AI, которая видит и понимает изображения на уровне эксперта. Модель лидирует в мировых бенчмарках, позволяя вести сложные диалоги о визуальном контенте и распознавать мельчайшие детали на фото.

Yi Vision Language (Yi-VL) model is the open-source, multimodal version of the Yi Large Language Model (LLM) series, enabling content comprehension, recognition, and multi-round conversations about images. Yi-VL demonstrates exceptional performance, ranking first among all existing open-source models in the latest benchmarks including MMMU in English and CMMMU in Chinese (based on data available up to January 2024). Yi-VL-34B is the first open-source 34B vision language model worldwide.

Что такое Yi-VL-34B?+
Кто разработал Yi-VL-34B?+
Какие задачи решает Yi-VL-34B?+