Яндекс Метрика
cs.CL, cs.LG

Применение GPGPU для ускорения поиска по сети на базе рекуррентных нейросетевых языковых моделей в системах LVCSR реального времени

Kyungmin Lee, Chiyoun Park, Ilhwan Kim, Namhoon Kim, Jaewon Lee23.07.2020

Рекуррентные нейросетевые языковые модели (RNNLM) демонстрируют выдающиеся результаты и активно внедряются в различные области распознавания речи. Однако высокая вычислительная сложность RNNLM препятствует их использованию в системах распознавания непрерывной речи с большим словарем (LVCSR) в режиме реального времени. Для ускорения процесса поиска по сети во время декодирования авторы предлагают использовать графические процессоры общего назначения (GPGPU). В статье представлен новый метод оптимизации, позволяющий значительно повысить производительность системы.

Статья решает проблему высокой вычислительной сложности рекуррентных нейросетей (RNN) при распознавании речи в реальном времени. Авторы предложили использовать мощности графических процессоров (GPGPU) для ускорения поиска по сети во время декодирования, что делает использование тяжелых языковых моделей практически применимым.

Kyungmin Lee, Chiyoun Park, Ilhwan Kim, Namhoon Kim, Jaewon Lee