MiniCPM-V 2.6 — это компактный, но мощный мультимодальный ИИ, который обходит GPT-4V в анализе изображений и видео. Модель на 8B параметров отлично справляется с OCR-задачами и пониманием контекста, предлагая возможности флагманских нейросетей.
The latest and most capable model in the MiniCPM-V series. With a total of 8B parameters, the model surpasses GPT-4V in single image, multi-image and video understanding. It outperforms GPT-4o mini, Gemini 1.5 Pro and Claude 3.5 Sonnet in single image understanding, and advances MiniCPM-Llama3-V 2.5's features such as strong OCR capability, trustworthy behavior, multilingual support, and end-side deployment. Due to its superior token density, MiniCPM-V 2.6 can for the first time support real-time video understanding on end-side devices such as iPad.