Яндекс Метрика

// распознавание речи

ИИ-модели в домене: распознавание речи.

Видео, Мультимодальная модель, Генерация изображений, Компьютерное зрение, Языковая модель, Распознавание речи30.10.2025
Emu3.5
Beijing Academy of Artificial Intelligence / BAAI
Text-to-videoImage-to-video
Языковая модель, Компьютерное зрение, Видео, Мультимодальная модель, Распознавание речи07.10.2025
Gemini 2.5 Computer Use
Google
Генерация текстаОтветы на вопросы
Распознавание речи01.10.2025
EVI 4 mini
Hume
Speech-to-speechAudio question answering
Распознавание речи01.10.2025
Octave 2
Hume
Speech synthesisText-to-speech (TTS)
Компьютерное зрение, Языковая модель, Распознавание речи25.09.2025
Gemini Robotics-ER 1.5
Google DeepMind
Следование инструкциямRobotic manipulation
Мультимодальная модель, Языковая модель, Компьютерное зрение, Распознавание речи, Видео22.09.2025
Qwen3-Omni-30B-A3B
Alibaba
Генерация текстаОтветы на вопросы
Мультимодальная модель, Языковая модель, Компьютерное зрение, Распознавание речи, Видео22.09.2025
Qwen3-Omni-Flash
Alibaba
Генерация текстаОтветы на вопросы
Распознавание речи04.09.2025
Chatterbox Multilingual
Resemble AI
Text-to-speech (TTS)Speech synthesis
Распознавание речи28.08.2025
MAI-Voice-1
Microsoft
Text-to-speech (TTS)Speech synthesis
Распознавание речи, Компьютерное зрение, Языковая модель28.08.2025
gpt-realtime
OpenAI
Распознавание речиSpeech synthesis
Видео, Распознавание речи26.08.2025
Wan 2.2 14B S2V
Alibaba
Распознавание речиГенерация видео
Распознавание речи14.08.2025
Canary 1B v2
NVIDIA
Распознавание речиМашинный перевод
Распознавание речи14.08.2025
Parakeet-tdt-0.6b-v3
NVIDIA
Речь в текстРаспознавание речи
Распознавание речи, Языковая модель15.07.2025
Voxtral Mini
Mistral AI
Audio question answeringРаспознавание речи
Распознавание речи15.07.2025
Voxtral Small
Mistral AI
Audio question answeringРаспознавание речи
Мультимодальная модель, Компьютерное зрение, Видео, Распознавание речи, Языковая модель26.06.2025
BlueOcean LLM 2.0 (萤石蓝海)
Hangzhou EZVIZ Software Co., Ltd. (Hikvision)
Детекция объектовObject recognition
Языковая модель, Компьютерное зрение, Видео, Распознавание речи, Мультимодальная модель15.06.2025
Gemini 2.5 Flash-Lite
Google DeepMind
Генерация текстаОтветы на вопросы
Языковая модель, Компьютерное зрение, Видео, Мультимодальная модель, Распознавание речи05.06.2025
Gemini 2.5 Pro (Jun 2025)
Google DeepMind
Генерация текстаОтветы на вопросы
Распознавание речи04.06.2025
Ink Whisper
Cartesia
Речь в текстРаспознавание речи
Распознавание речи03.06.2025
OpenAudio-S1-mini
Fish Audio
Speech synthesisText-to-speech (TTS)
Распознавание речи03.06.2025
Eleven v3
ElevenLabs
Text-to-speech (TTS)Speech synthesis
Распознавание речи03.06.2025
Gemini 2.5 Flash Native Audio
Google DeepMind
Speech-to-speechAudio question answering
Распознавание речи03.06.2025
OpenAudio-S1
Fish Audio
Speech synthesisText-to-speech (TTS)
Распознавание речи29.05.2025
EVI 3
Hume
Речь в текстРаспознавание речи
показано 24 из 185