Данная версия PaliGemma 2 работает с увеличенным разрешением входных данных, что позволяет ИИ замечать даже мельчайшие детали на изображениях. Она идеально подходит для сложной сегментации, детального анализа документов и задач, где важна максимальная точность визуального восприятия.
This past December, we launched PaliGemma 2, an upgraded vision-language model in the Gemma family. The release included pretrained checkpoints of different sizes (3B, 10B, and 28B parameters) that can be easily fine-tuned on a wide range of vision-language tasks and domains, such as image segmentation, short video captioning, scientific question answering and text-related tasks with high performance. Now, we’re thrilled to announce the launch of PaliGemma 2 mix checkpoints. PaliGemma 2 mix are models tuned to a mixture of tasks that allow directly exploring the model capabilities and using it out-of-the-box for common use cases.