Рекуррентные нейросетевые языковые модели (RNNLM) демонстрируют выдающиеся результаты и активно внедряются в различные области распознавания речи. Однако высокая вычислительная сложность RNNLM препятствует их использованию в системах распознавания непрерывной речи с большим словарем (LVCSR) в режиме реального времени. Для ускорения процесса поиска по сети во время декодирования авторы предлагают использовать графические процессоры общего назначения (GPGPU). В статье представлен новый метод оптимизации, позволяющий значительно повысить производительность системы.
Статья решает проблему высокой вычислительной сложности рекуррентных нейросетей (RNN) при распознавании речи в реальном времени. Авторы предложили использовать мощности графических процессоров (GPGPU) для ускорения поиска по сети во время декодирования, что делает использование тяжелых языковых моделей практически применимым.