Belle VL: мультимодальная ИИ-модель для текста и зрения

Q: Кто разработал Belle VL?

Модель Belle VL разработана компанией KE Holdings Inc. (“Beike”) (China).

Q: Какие задачи решает Belle VL?

Генерация текста, Визуальные ответы на вопросы

// задачи

Генерация текстаВизуальные ответы на вопросы

// описание

Belle VL — это мультимодальная модель с открытым исходным кодом, объединяющая возможности понимания текста и компьютерного зрения. Этот ИИ демонстрирует впечатляющие результаты в тестах на визуальное восприятие, обходя многих популярных конкурентов вроде Qwen-VL и Llava.

// abstract

Open source BELLE-VL A multi-modular large-language model, based on a more capable language model base to expand the visual capabilities of the model, providing a more flexible choice for the community (currently the latest BELLE-VL model is in MME Perception assessment dimensions are obtained together 1620.10 (Over Qwen-VL, Llava, mplug-owl)

// faq

Что такое Belle VL?+

Кто разработал Belle VL?+

Какие задачи решает Belle VL?+

// похожие модели