PaliGemma 2 3B Mix 448: Точное компьютерное зрение

Q: Кто разработал PaliGemma 2 3B Mix 448?

Модель PaliGemma 2 3B Mix 448 разработана компанией Google (United States of America).

Q: Какие задачи решает PaliGemma 2 3B Mix 448?

Image captioning, Визуальные ответы на вопросы, Детекция объектов, Object recognition, Image segmentation, Character recognition (OCR)

// задачи

Image captioningВизуальные ответы на вопросыДетекция объектовObject recognitionImage segmentationCharacter recognition (OCR)

// описание

Данная версия PaliGemma 2 работает с увеличенным разрешением входных данных, что позволяет ИИ замечать даже мельчайшие детали на изображениях. Она идеально подходит для сложной сегментации, детального анализа документов и задач, где важна максимальная точность визуального восприятия.

// abstract

This past December, we launched PaliGemma 2, an upgraded vision-language model in the Gemma family. The release included pretrained checkpoints of different sizes (3B, 10B, and 28B parameters) that can be easily fine-tuned on a wide range of vision-language tasks and domains, such as image segmentation, short video captioning, scientific question answering and text-related tasks with high performance. Now, we’re thrilled to announce the launch of PaliGemma 2 mix checkpoints. PaliGemma 2 mix are models tuned to a mixture of tasks that allow directly exploring the model capabilities and using it out-of-the-box for common use cases.

// faq

Что такое PaliGemma 2 3B Mix 448?+

Кто разработал PaliGemma 2 3B Mix 448?+

Какие задачи решает PaliGemma 2 3B Mix 448?+

// похожие модели