用强化学习玩合成大西瓜
代码地址:https://github.com/Sharpiless/play-daxigua-using-Reinforcement-Learning
用强化学习DQN算法,训练AI模型来玩合成大西瓜游戏,提供Keras版本、PARL(paddle)版本和pytorch版本。
AI Studio:https://aistudio.baidu.com/aistudio/personalcenter/thirdview/67156
1. 打开游戏:
这里使用pygame重写了大西瓜游戏,并封装为适合RL环境的代码。
解压图片素材:
unzip res.zip
运行:
python Main.py
即可开始游戏:
2. 训练RL模型:
RL算法采用DQN算法,其中Keras版本使用了简单的卷积神经网络来计算Q值,PRAL版本使用ResNet。
运行:
python train_keras.py
或者
python train_paddle.py
或者
python train_torch.py
开始训练:
关注我的公众号:
感兴趣的同学关注我的公众号——可达鸭的深度学习教程: