7.3.4 自注意力与卷积网络、循环网络的比较