Недавно был предложен новый подход к расширению документов на основе нейронной модели Seq2Seq, показавший значительное улучшение результатов в задачах поиска по коротким текстам. Однако данный метод требует большого объема обучающих данных для конкретной предметной области, что не всегда доступно. В этой статье авторы демонстрируют, что нейронное расширение документов можно эффективно адаптировать к стандартным задачам информационного поиска. Предложенное решение сохраняет эффективность даже в условиях дефицита размеченных данных и при работе с документами большой длины.
Исследование предлагает новый подход к нейронному расширению документов для улучшения качества информационного поиска. Разработанный метод на базе Seq2Seq-моделей эффективно работает даже в условиях дефицита обучающих данных и с длинными текстами, предсказывая потенциальные поисковые запросы к документу. Это позволяет значительно повысить точность выдачи в поисковых системах без необходимости в огромных размеченных датасетах.