Яндекс Метрика
cs.IR, cs.AI, cs.CL

Нейронное расширение документов для специализированного информационного поиска

Cheng Tang, Andrew Arnold27.12.2020

Недавно был предложен новый подход к расширению документов на основе нейронной модели Seq2Seq, показавший значительное улучшение результатов в задачах поиска по коротким текстам. Однако данный метод требует большого объема обучающих данных для конкретной предметной области, что не всегда доступно. В этой статье авторы демонстрируют, что нейронное расширение документов можно эффективно адаптировать к стандартным задачам информационного поиска. Предложенное решение сохраняет эффективность даже в условиях дефицита размеченных данных и при работе с документами большой длины.

Исследование предлагает новый подход к нейронному расширению документов для улучшения качества информационного поиска. Разработанный метод на базе Seq2Seq-моделей эффективно работает даже в условиях дефицита обучающих данных и с длинными текстами, предсказывая потенциальные поисковые запросы к документу. Это позволяет значительно повысить точность выдачи в поисковых системах без необходимости в огромных размеченных датасетах.

Cheng Tang, Andrew Arnold