AWD-LSTM + dynamic eval (PTB): обзор ИИ-модели

Q: Кто разработал AWD-LSTM + dynamic eval (PTB)?

Модель AWD-LSTM + dynamic eval (PTB) разработана компанией University of Edinburgh (United Kingdom of Great Britain and Northern Ireland).

// задачи

Языковое моделирование

// описание

Эта языковая модель использует механизм динамической оценки для адаптации к тексту в реальном времени. Благодаря градиентному спуску на основе недавней истории, ИИ эффективнее распознает повторяющиеся паттерны, что значительно снижает показатель перплексии на датасете PTB.

// abstract

We present methodology for using dynamic evaluation to improve neural sequence models. Models are adapted to recent history via a gradient descent based mechanism, causing them to assign higher probabilities to re-occurring sequential patterns. Dynamic evaluation outperforms existing adaptation approaches in our comparisons. Dynamic evaluation improves the state-of-the-art word-level perplexities on the Penn Treebank and WikiText-2 datasets to 51.1 and 44.3 respectively, and the state-of-the-art character-level cross-entropies on the text8 and Hutter Prize datasets to 1.19 bits/char and 1.08 bits/char respectively.

// faq

Что такое AWD-LSTM + dynamic eval (PTB)?+

Кто разработал AWD-LSTM + dynamic eval (PTB)?+

Какие задачи решает AWD-LSTM + dynamic eval (PTB)?+

// похожие модели