// задачи
Генерация текстаВизуальные ответы на вопросы
// описание
Belle VL — это мультимодальная модель с открытым исходным кодом, объединяющая возможности понимания текста и компьютерного зрения. Этот ИИ демонстрирует впечатляющие результаты в тестах на визуальное восприятие, обходя многих популярных конкурентов вроде Qwen-VL и Llava.
// abstract
Open source BELLE-VL A multi-modular large-language model, based on a more capable language model base to expand the visual capabilities of the model, providing a more flexible choice for the community (currently the latest BELLE-VL model is in MME Perception assessment dimensions are obtained together 1620.10 (Over Qwen-VL, Llava, mplug-owl)
// faq
Что такое Belle VL?+
Кто разработал Belle VL?+
Какие задачи решает Belle VL?+
// похожие модели