Рост культуры обмена данными и лайфлоггинга привел к беспрецедентному увеличению объема необработанных видеозаписей, снятых от первого лица. В данной работе решается проблема доступа к релевантной информации в таких видео путем создания их ускоренных версий с акцентом на важных для оператора моментах. Предложенный метод основан на модели внимания, использующей анализ направления взгляда и визуальной сцены для присвоения каждому кадру семантической оценки. Авторы провели тестирование системы, подтвердив эффективность выделения значимого контента.
Разработан метод интеллектуальной перемотки видео от первого лица, основанный на отслеживании взгляда пользователя. Алгоритм анализирует внимание оператора и создает ускоренную версию ролика, акцентируя внимание на наиболее важных моментах. Это решение помогает быстро находить релевантную информацию в огромных массивах записей с носимых камер и видеорегистраторов.