Яндекс Метрика
Распознавание речи

Parakeet-tdt-0.6b-v3

NVIDIA
Речь в текстРаспознавание речи

Parakeet-tdt-0.6b-v3 — компактная и невероятно быстрая ИИ-модель для массовой транскрибации аудио. Нейросеть автоматически определяет язык общения и мгновенно переводит речь в текст, поддерживая 25 европейских языков.

parakeet-tdt-0.6b-v3 is a 600-million-parameter multilingual automatic speech recognition (ASR) model designed for high-throughput speech-to-text transcription. It extends the parakeet-tdt-0.6b-v2 model by expanding language support from English to 25 European languages. The model automatically detects the language of the audio and transcribes it without requiring additional prompting. It is part of a series of models that leverage the Granary [1, 2] multilingual corpus as their primary training dataset.

Что такое Parakeet-tdt-0.6b-v3?+
Кто разработал Parakeet-tdt-0.6b-v3?+
Какие задачи решает Parakeet-tdt-0.6b-v3?+