7.3 训练DQN模型——让DQN模型在游戏中不断学习并获得高分