Графовые сверточные сети (GCN) — это развивающаяся область, целью которой является обобщение глубокого обучения для работы с нерегулярными структурами данных. Большинство существующих GCN используют схемы агрегации признаков соседних узлов с помощью операций усреднения или сортировки. Однако такие подходы часто оказываются недостаточно информативными или значительно увеличивают вычислительную сложность и количество параметров модели. В данной статье предлагается новый метод распознавания действий, использующий ядерные функции для более эффективной и дискриминативной свертки на графах.
Статья исследует применение графовых сверточных сетей (GCN) для распознавания действий на видео. Автор предлагает использовать ядерные (kernel-based) методы агрегации данных вместо стандартного усреднения, что позволяет лучше обрабатывать сложные нерегулярные структуры. Такой подход повышает точность классификации движений в динамических и зашумленных сценах.