// компьютерное зрение
ИИ-модели в домене: компьютерное зрение.
Мультимодальная модель, Языковая модель, Компьютерное зрение29.12.2025
HyperCLOVA X SEED 32B Think
NAVER
Генерация текста(Visual) Question answering
Языковая модель, Компьютерное зрение, Мультимодальная модель02.12.2025
Nova 2
Amazon Web Services (AWS)
Чат-ботReasoning
Мультимодальная модель, Языковая модель, Компьютерное зрение18.11.2025
Gemini 3 Pro
Google DeepMind
Генерация текста
Мультимодальная модель, Языковая модель, Компьютерное зрение13.11.2025
GPT-5.1 Instant
OpenAI
Генерация текстаОтветы на вопросы
Мультимодальная модель, Языковая модель, Компьютерное зрение13.11.2025
GPT-5.1
OpenAI
Генерация текстаОтветы на вопросы
Видео, Мультимодальная модель, Генерация изображений, Компьютерное зрение, Языковая модель, Распознавание речи30.10.2025
Emu3.5
Beijing Academy of Artificial Intelligence / BAAI
Text-to-videoImage-to-video
Компьютерное зрение, Языковая модель21.10.2025
Deepseek OCR
DeepSeek
Character recognition (OCR)Визуальные ответы на вопросы
Видео, Компьютерное зрение15.10.2025
Veo 3.1
Google DeepMind
Image-to-videoГенерация видео
Языковая модель, Компьютерное зрение, Видео, Мультимодальная модель, Распознавание речи07.10.2025
Gemini 2.5 Computer Use
Google
Генерация текстаОтветы на вопросы
Мультимодальная модель, Языковая модель, Компьютерное зрение07.10.2025
GPT-5 Pro
OpenAI
Языковая модель, Компьютерное зрение, Мультимодальная модель06.10.2025
Tiny Recursive Model (TRM-Att)
Samsung SAIT AI Lab
Генерация текстаОтветы на вопросы
Языковая модель, Компьютерное зрение, Мультимодальная модель29.09.2025
MinerU2.5
Shanghai AI Lab,Peking University,Shanghai Jiao Tong University
Визуальные ответы на вопросыCharacter recognition (OCR)
Робототехника, Компьютерное зрение, Языковая модель29.09.2025
NVIDIA Isaac GR00T N1.6
NVIDIA
Robotic manipulationAnimal (human/non-human) imitation
Языковая модель, Компьютерное зрение, Мультимодальная модель29.09.2025
Claude Sonnet 4.5
Anthropic
Генерация текстаГенерация кода
Видео, Компьютерное зрение29.09.2025
Wan 2.5
Alibaba
Генерация видеоГенерация аудио
Видео, Компьютерное зрение26.09.2025
Kling 2.5 Turbo
Kuaishou Technology
Image-to-videoГенерация видео
Робототехника, Компьютерное зрение, Языковая модель25.09.2025
Gemini Robotics 1.5
Google DeepMind
Robotic manipulationСледование инструкциям
Компьютерное зрение, Языковая модель, Распознавание речи25.09.2025
Gemini Robotics-ER 1.5
Google DeepMind
Следование инструкциямRobotic manipulation
Мультимодальная модель, Языковая модель, Компьютерное зрение, Распознавание речи, Видео22.09.2025
Qwen3-Omni-30B-A3B
Alibaba
Генерация текстаОтветы на вопросы
Мультимодальная модель, Языковая модель, Компьютерное зрение, Распознавание речи, Видео22.09.2025
Qwen3-Omni-Flash
Alibaba
Генерация текстаОтветы на вопросы
Языковая модель, Компьютерное зрение, Мультимодальная модель18.09.2025
Magistral Small 1.2
Mistral AI
Генерация текстаОтветы на вопросы
Компьютерное зрение, Мультимодальная модель, Языковая модель17.09.2025
Granite-Docling
IBM
Визуальные ответы на вопросыCharacter recognition (OCR)
Компьютерное зрение, Биология и ИИ, Медицина31.08.2025
MultiverSeg
Massachusetts Institute of Technology (MIT),Databricks
Image segmentation
Распознавание речи, Компьютерное зрение, Языковая модель28.08.2025
gpt-realtime
OpenAI
Распознавание речиSpeech synthesis
показано 24 из 676