Яндекс Метрика
Языковая модель

LSTM + dynamic eval

University of Edinburgh
Языковое моделирование

Модель LSTM с динамической оценкой умеет адаптироваться к контексту прямо «на лету», используя градиентный спуск для запоминания паттернов в тексте. Такое решение позволяет ИИ значительно точнее предсказывать слова, устанавливая новые стандарты качества в обработке последовательностей.

We present methodology for using dynamic evaluation to improve neural sequence models. Models are adapted to recent history via a gradient descent based mechanism, causing them to assign higher probabilities to re-occurring sequential patterns. Dynamic evaluation outperforms existing adaptation approaches in our comparisons. Dynamic evaluation improves the state-of-the-art word-level perplexities on the Penn Treebank and WikiText-2 datasets to 51.1 and 44.3 respectively, and the state-of-the-art character-level cross-entropies on the text8 and Hutter Prize datasets to 1.19 bits/char and 1.08 bits/char respectively.

Что такое LSTM + dynamic eval?+
Кто разработал LSTM + dynamic eval?+
Какие задачи решает LSTM + dynamic eval?+