深度学习中的注意力机制是如何工作的?