// распознавание речи
ИИ-модели для задачи: распознавание речи.
Видео, Мультимодальная модель, Генерация изображений, Компьютерное зрение, Языковая модель, Распознавание речи30.10.2025
Emu3.5
Beijing Academy of Artificial Intelligence / BAAI
Text-to-videoImage-to-video
Языковая модель, Компьютерное зрение, Видео, Мультимодальная модель, Распознавание речи07.10.2025
Gemini 2.5 Computer Use
Google
Генерация текстаОтветы на вопросы
Компьютерное зрение, Языковая модель, Распознавание речи25.09.2025
Gemini Robotics-ER 1.5
Google DeepMind
Следование инструкциямRobotic manipulation
Мультимодальная модель, Языковая модель, Компьютерное зрение, Распознавание речи, Видео22.09.2025
Qwen3-Omni-30B-A3B
Alibaba
Генерация текстаОтветы на вопросы
Мультимодальная модель, Языковая модель, Компьютерное зрение, Распознавание речи, Видео22.09.2025
Qwen3-Omni-Flash
Alibaba
Генерация текстаОтветы на вопросы
Распознавание речи, Компьютерное зрение, Языковая модель28.08.2025
gpt-realtime
OpenAI
Распознавание речиSpeech synthesis
Видео, Распознавание речи26.08.2025
Wan 2.2 14B S2V
Alibaba
Распознавание речиГенерация видео
Распознавание речи14.08.2025
Parakeet-tdt-0.6b-v3
NVIDIA
Речь в текстРаспознавание речи
Распознавание речи14.08.2025
Canary 1B v2
NVIDIA
Распознавание речиМашинный перевод
Языковая модель, Мультимодальная модель, Компьютерное зрение, Видео, Аудио, Математика01.08.2025
Gemini 2.5 Deep Think
Google,Google DeepMind
Генерация текстаMathematical reasoning
Распознавание речи, Языковая модель15.07.2025
Voxtral Mini
Mistral AI
Audio question answeringРаспознавание речи
Распознавание речи15.07.2025
Voxtral Small
Mistral AI
Audio question answeringРаспознавание речи
Мультимодальная модель, Языковая модель, Компьютерное зрение, Видео29.06.2025
ERNIE-4.5-VL-28B-A3B
Baidu
Генерация текстаВизуальные ответы на вопросы
Мультимодальная модель, Компьютерное зрение, Видео, Распознавание речи, Языковая модель26.06.2025
BlueOcean LLM 2.0 (萤石蓝海)
Hangzhou EZVIZ Software Co., Ltd. (Hikvision)
Детекция объектовObject recognition
Языковая модель, Компьютерное зрение, Видео, Распознавание речи, Мультимодальная модель15.06.2025
Gemini 2.5 Flash-Lite
Google DeepMind
Генерация текстаОтветы на вопросы
Языковая модель, Компьютерное зрение, Видео, Мультимодальная модель, Распознавание речи05.06.2025
Gemini 2.5 Pro (Jun 2025)
Google DeepMind
Генерация текстаОтветы на вопросы
Распознавание речи04.06.2025
Ink Whisper
Cartesia
Речь в текстРаспознавание речи
Распознавание речи29.05.2025
EVI 3
Hume
Речь в текстРаспознавание речи
Мультимодальная модель, Языковая модель, Компьютерное зрение, Распознавание речи24.05.2025
OpenOmni
Chinese Academy of Sciences,Shenzhen Institute of Advanced Technology,University of Chinese Academy of Sciences,National University of Singapore,University of Science and Technology of China (USTC)
Речь в текстРаспознавание речи
Языковая модель, Мультимодальная модель, Распознавание речи, Компьютерное зрение20.05.2025
Gemma 3n
Google
Генерация текстаОтветы на вопросы
Языковая модель, Мультимодальная модель, Распознавание речи, Компьютерное зрение09.05.2025
Tianxi-72B
Lenovo
Генерация текстаОтветы на вопросы
Языковая модель, Компьютерное зрение, Видео, Мультимодальная модель, Распознавание речи06.05.2025
Gemini 2.5 Pro (May 2025)
Google DeepMind
Генерация текстаОтветы на вопросы
Языковая модель, Мультимодальная модель, Компьютерное зрение, Распознавание речи, Видео17.04.2025
Gemini 2.5 Flash
Google DeepMind
Генерация текстаОтветы на вопросы
Распознавание речи15.04.2025
Nova-3
Deepgram
Распознавание речиРечь в текст
показано 24 из 128