基于梯度爆炸的解决方法:clip gradient