Яндекс Метрика
Языковая модель, Компьютерное зрение, Мультимодальная модель

Belle VL

KE Holdings Inc. (“Beike”)
Генерация текстаВизуальные ответы на вопросы

Belle VL — это мультимодальная модель с открытым исходным кодом, объединяющая возможности понимания текста и компьютерного зрения. Этот ИИ демонстрирует впечатляющие результаты в тестах на визуальное восприятие, обходя многих популярных конкурентов вроде Qwen-VL и Llava.

Open source BELLE-VL A multi-modular large-language model, based on a more capable language model base to expand the visual capabilities of the model, providing a more flexible choice for the community (currently the latest BELLE-VL model is in MME Perception assessment dimensions are obtained together 1620.10 (Over Qwen-VL, Llava, mplug-owl)

Что такое Belle VL?+
Кто разработал Belle VL?+
Какие задачи решает Belle VL?+