Яндекс Метрика
cs.CL, cs.IR, cs.LG

LTIatCMU на SemEval-2020 (Задача 11): Использование многоуровневых признаков для идентификации фрагментов пропаганды разной степени детализации

Sopan Khosla, Rishabh Joshi, Ritam Dutt, Alan W Black, Yulia Tsvetkov11.08.2020

В статье описывается алгоритм для идентификации фрагментов пропаганды в новостных статьях. Авторы представляют модель на базе архитектур BERT и BiLSTM, которая определяет конкретные последовательности слов, указывающие на манипуляцию мнением. Система использует многоуровневый подход, анализируя текст на уровне слов, предложений и всего документа. Включение синтаксических, семантических и прагматических признаков позволило значительно повысить эффективность модели в обнаружении пропагандистского контента.

Разработана модель на базе архитектур BERT и BiLSTM для точного обнаружения пропаганды в новостных статьях. Система анализирует лингвистические признаки на разных уровнях — от отдельных слов до целых документов, чтобы выявлять конкретные фрагменты текста с манипулятивным контентом. Подход позволяет эффективно бороться с дезинформацией, распознавая скрытые приемы влияния в медиапространстве.

Sopan Khosla, Rishabh Joshi, Ritam Dutt, Alan W Black, Yulia Tsvetkov