t0

// аудио

ИИ-модели в домене: аудио.

Языковая модель, Мультимодальная модель, Аудио03.06.2026

Google DeepMind

Генерация текстаОтветы на вопросы

11.9Bподробнее →

Языковая модель, Мультимодальная модель, Аудио, Видео11.05.2026

TML-Interaction-Small

Thinking Machines

Генерация текстаЧат-бот

276.0Bподробнее →

Аудио23.04.2026

Grok Voice Think Fast 1.0

Speech-to-speech

подробнее →

Аудио15.04.2026

Gemini Flash 3.1 TTS

Генерация аудио

подробнее →

Языковая модель, Мультимодальная модель, Компьютерное зрение, Аудио29.03.2026

Qwen3.5-Omni-Flash

Генерация текста

подробнее →

Языковая модель, Мультимодальная модель, Компьютерное зрение, Аудио29.03.2026

Qwen3.5-Omni-Plus

Генерация текста

подробнее →

Генерация изображений, Видео, Аудио12.02.2026

Генерация видеоГенерация аудио

подробнее →

Аудио25.09.2025

Генерация аудио

подробнее →

Языковая модель, Мультимодальная модель, Компьютерное зрение, Видео, Аудио, Математика01.08.2025

Gemini 2.5 Deep Think

Google,Google DeepMind

Генерация текстаMathematical reasoning

подробнее →

Аудио20.05.2025

Google DeepMind

Генерация аудио

подробнее →

Аудио14.04.2025

Google DeepMind,Georgia Institute of Technology,Wild Dolphin Project

Генерация аудиоРаспознавание речи

400.0Mподробнее →

Аудио27.03.2025

Генерация аудио

подробнее →

Мультимодальная модель, Языковая модель, Аудио, Распознавание речи, Компьютерное зрение27.03.2025

GPT-4o (Mar 2025)

Чат-ботГенерация изображений

подробнее →

Мультимодальная модель, Языковая модель, Компьютерное зрение, Видео, Аудио, Распознавание речи26.03.2025

Qwen2.5-Omni 3B

Генерация текстаОтветы на вопросы

3.0Bподробнее →

Мультимодальная модель, Языковая модель, Компьютерное зрение, Видео, Аудио, Распознавание речи26.03.2025

Qwen2.5-Omni 7B

Генерация текстаОтветы на вопросы

7.0Bподробнее →

Видео, Аудио06.03.2025

Генерация видеоText-to-video

подробнее →

Видео, Компьютерное зрение, Аудио13.02.2025

Генерация видеоImage-to-video

подробнее →

Мультимодальная модель, Языковая модель, Аудио, Распознавание речи, Компьютерное зрение29.01.2025

GPT-4o (Jan 2025)

Чат-ботГенерация изображений

подробнее →

Мультимодальная модель, Языковая модель, Распознавание речи, Компьютерное зрение, Видео, Аудио26.01.2025

Baichuan-Omni-1.5

Генерация текстаОтветы на вопросы

11.0Bподробнее →

Аудио, Языковая модель, Распознавание речи, Мультимодальная модель19.12.2024

Typhoon / SCB 10X

Генерация текстаSpeech synthesis

9.7Bподробнее →

Языковая модель, Мультимодальная модель, Компьютерное зрение, Видео, Аудио11.12.2024

Google DeepMind

Генерация кодаГенерация текста

подробнее →

Языковая модель, Компьютерное зрение, Аудио, Распознавание речи, Видео, Мультимодальная модель11.12.2024

Gemini 2.0 Flash

Google DeepMind,Google

Генерация текстаОтветы на вопросы

подробнее →

Мультимодальная модель, Языковая модель, Аудио25.11.2024

Генерация аудио

2.5Bподробнее →

Мультимодальная модель, Языковая модель, Аудио, Распознавание речи, Компьютерное зрение20.11.2024

GPT-4o (Nov 2024)

Чат-ботГенерация изображений

подробнее →

показано 24 из 61