AWD-LSTM+WT+Cache+IOG: языковая модель на WikiText-2

Q: Кто разработал AWD-LSTM+WT+Cache+IOG (WT2)?

Модель AWD-LSTM+WT+Cache+IOG (WT2) разработана компанией NTT Communication Science Laboratories (Japan).

// задачи

Языковое моделирование

// описание

Эта языковая модель использует инновационный метод Input-to-Output Gate (IOG) для улучшения работы рекуррентных нейросетей. Благодаря простой, но эффективной структуре, ИИ показывает выдающиеся результаты в прогнозировании текста на популярном наборе данных WikiText-2.

// abstract

This paper proposes a reinforcing method that refines the output layers of existing Recurrent Neural Network (RNN) language models. We refer to our proposed method as Input-to-Output Gate (IOG). IOG has an extremely simple structure, and thus, can be easily combined with any RNN language models. Our experiments on the Penn Treebank and WikiText-2 datasets demonstrate that IOG consistently boosts the performance of several different types of current topline RNN language models.

// faq

Что такое AWD-LSTM+WT+Cache+IOG (WT2)?+

Кто разработал AWD-LSTM+WT+Cache+IOG (WT2)?+

Какие задачи решает AWD-LSTM+WT+Cache+IOG (WT2)?+

// похожие модели