Компонент нейронных сетей, позволяющий модели фокусироваться на наиболее релевантных частях входных данных при генерации ответа. Этот механизм является фундаментом архитектуры трансформеров и критически важен для работы современных языковых моделей (LLM).