Яндекс Метрика
Распознавание речи

Voxtral Small

Mistral AI
Audio question answeringРаспознавание речиРечь в текстГенерация текстаОтветы на вопросы

Voxtral Small от Mistral AI — это мультимодальная модель, которая одинаково хорошо понимает как текст, так и живую речь. Этот ИИ превосходит многие закрытые аналоги и при этом достаточно компактен для запуска на локальном оборудовании, предлагая широкое окно контекста в 32K токенов.

We present Voxtral Mini and Voxtral Small, two multimodal audio chat models. Voxtral is trained to comprehend both spoken audio and text documents, achieving state-of-the-art performance across a diverse range of audio benchmarks, while preserving strong text capabilities. Voxtral Small outperforms a number of closed-source models, while being small enough to run locally. A 32K context window enables the model to handle audio files up to 40 minutes in duration and long multi-turn conversations. We also contribute three benchmarks for evaluating speech understanding models on knowledge and trivia. Both Voxtral models are released under Apache 2.0 license.

Что такое Voxtral Small?+
Кто разработал Voxtral Small?+
Какие задачи решает Voxtral Small?+