// аудио
ИИ-модели в домене: аудио.
Аудио25.09.2025
Suno v5
Suno
Генерация аудио
Языковая модель, Мультимодальная модель, Компьютерное зрение, Видео, Аудио, Математика01.08.2025
Gemini 2.5 Deep Think
Google,Google DeepMind
Генерация текстаMathematical reasoning
Аудио20.05.2025
Lyria RealTime
Google DeepMind
Генерация аудио
Аудио14.04.2025
DolphinGemma
Google DeepMind,Georgia Institute of Technology,Wild Dolphin Project
Генерация аудиоРаспознавание речи
Аудио27.03.2025
CassetteAI
CassetteAI
Генерация аудио
Мультимодальная модель, Языковая модель, Аудио, Распознавание речи, Компьютерное зрение27.03.2025
GPT-4o (Mar 2025)
OpenAI
Чат-ботГенерация изображений
Мультимодальная модель, Языковая модель, Компьютерное зрение, Видео, Аудио, Распознавание речи26.03.2025
Qwen2.5-Omni 3B
Alibaba
Генерация текстаОтветы на вопросы
Мультимодальная модель, Языковая модель, Компьютерное зрение, Видео, Аудио, Распознавание речи26.03.2025
Qwen2.5-Omni 7B
Alibaba
Генерация текстаОтветы на вопросы
Видео, Аудио06.03.2025
Character-3
Hedra AI
Генерация видеоText-to-video
Видео, Компьютерное зрение, Аудио13.02.2025
OmniHuman-1
ByteDance
Генерация видеоImage-to-video
Мультимодальная модель, Языковая модель, Аудио, Распознавание речи, Компьютерное зрение29.01.2025
GPT-4o (Jan 2025)
OpenAI
Чат-ботГенерация изображений
Мультимодальная модель, Языковая модель, Распознавание речи, Компьютерное зрение, Видео, Аудио26.01.2025
Baichuan-Omni-1.5
Baichuan
Генерация текстаОтветы на вопросы
Аудио, Языковая модель, Распознавание речи, Мультимодальная модель19.12.2024
Typhoon2-Audio
Typhoon / SCB 10X
Генерация текстаSpeech synthesis
Языковая модель, Мультимодальная модель, Компьютерное зрение, Видео, Аудио11.12.2024
Gemini 2.0 Pro
Google DeepMind
Генерация кодаГенерация текста
Языковая модель, Компьютерное зрение, Аудио, Распознавание речи, Видео, Мультимодальная модель11.12.2024
Gemini 2.0 Flash
Google DeepMind,Google
Генерация текстаОтветы на вопросы
Мультимодальная модель, Языковая модель, Аудио25.11.2024
Fugatto 1
NVIDIA
Генерация аудио
Мультимодальная модель, Языковая модель, Аудио, Распознавание речи, Компьютерное зрение20.11.2024
GPT-4o (Nov 2024)
OpenAI
Чат-ботГенерация изображений
Аудио19.11.2024
Suno v4
Suno
Генерация аудио
Аудио11.11.2024
NatureLM-audio
Earth Species Project
Audio classification
Видео, Аудио31.10.2024
VASA-1
Microsoft Research Asia
Генерация видео
Языковая модель, Компьютерное зрение, Мультимодальная модель, Аудио, Распознавание речи, Видео11.10.2024
Baichuan-Omni
Baichuan,Westlake University,Zhejiang University (ZJU)
Визуальные ответы на вопросыГенерация текста
Аудио04.10.2024
Movie Gen Audio
Meta AI
Генерация аудио
Аудио18.09.2024
Whale Bioacoustics Model
Google Research,National Oceanic and Atmospheric Administration (NOAA),Oregon State University
Audio classification
Мультимодальная модель, Языковая модель, Аудио, Распознавание речи, Компьютерное зрение06.08.2024
GPT-4o (Aug 2024)
OpenAI
Чат-ботГенерация изображений
показано 24 из 54