Яндекс Метрика
Языковая модель

AWD-FWM (WT2)

IDSIA,Microsoft Research
Языковое моделирование

Модель AWD-FWM (WT2) расширяет возможности классической LSTM-архитектуры за счет ассоциативной памяти Fast Weight Memory. Этот ИИ имитирует способность человека быстро связывать факты в новых контекстах, показывая отличные результаты на датасете WikiText-2. Эффективный подход к долгосрочному языковому моделированию.

Humans can quickly associate stimuli to solve problems in novel contexts. Our novel neural network model learns state representations of facts that can be composed to perform such associative inference. To this end, we augment the LSTM model with an associative memory, dubbed Fast Weight Memory (FWM). Through differentiable operations at every step of a given input sequence, the LSTM updates and maintains compositional associations stored in the rapidly changing FWM weights. Our model is trained end-to-end by gradient descent and yields excellent performance on compositional language reasoning problems, meta-reinforcement-learning for POMDPs, and small-scale word-level language modelling.

Что такое AWD-FWM (WT2)?+
Кто разработал AWD-FWM (WT2)?+
Какие задачи решает AWD-FWM (WT2)?+