Яндекс Метрика
Языковая модель, Компьютерное зрение, Видео, Мультимодальная модель, Распознавание речи

Gemini 2.5 Computer Use

Google
Генерация текстаОтветы на вопросыГенерация кодаКоличественные рассужденияВизуальные ответы на вопросыМашинный переводImage captioningОписание видеоРаспознавание речиУправление системамиSearch

Новая специализированная модель от Google превращает ИИ в полноценного агента, способного управлять интерфейсами приложений и сайтов. Благодаря высокой скорости и продвинутому визуальному анализу, Gemini 2.5 Computer Use эффективно автоматизирует действия пользователя на ПК и мобильных устройствах.

Today, we are releasing the Gemini 2.5 Computer Use model, our new specialized model built on Gemini 2.5 Pro’s visual understanding and reasoning capabilities that powers agents capable of interacting with user interfaces (UIs). It outperforms leading alternatives on multiple web and mobile control benchmarks, all with lower latency. Developers can access these capabilities via the Gemini API in Google AI Studio and Vertex AI.

Что такое Gemini 2.5 Computer Use?+
Кто разработал Gemini 2.5 Computer Use?+
Какие задачи решает Gemini 2.5 Computer Use?+