4 layer QRNN (h=2500): Языковая модель от Salesforce

Q: Кто разработал 4 layer QRNN (h=2500)?

Модель 4 layer QRNN (h=2500) разработана компанией Salesforce Research (United States of America).

// задачи

Языковое моделирование

// описание

Специалисты из Salesforce Research доказали, что оптимизированные QRNN-сети могут конкурировать с самыми сложными архитектурами. Данный ИИ демонстрирует SOTA-результаты в моделировании языка как на уровне слов, так и на уровне символов, обеспечивая высокую производительность.

// abstract

Many of the leading approaches in language modeling introduce novel, complex and specialized architectures. We take existing state-of-the-art word level language models based on LSTMs and QRNNs and extend them to both larger vocabularies as well as character-level granularity. When properly tuned, LSTMs and QRNNs achieve state-of-the-art results on character-level (Penn Treebank, enwik8) and word-level (WikiText-103) datasets, respectively. Results are obtained in only 12 hours (WikiText-103) to 2 days (enwik8) using a single modern GPU.

// faq

Что такое 4 layer QRNN (h=2500)?+

Кто разработал 4 layer QRNN (h=2500)?+

Какие задачи решает 4 layer QRNN (h=2500)?+

// похожие модели