-
公开(公告)号:CN114841311A
公开(公告)日:2022-08-02
申请号:CN202210322815.6
申请日:2022-03-30
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于拆分动作空间的深度强化学习斗地主游戏方法。涉及游戏人工智能技术领域与深度强化学习领域。对斗地主游戏动作空间按照主牌和副牌拆分为主牌动作空间和副牌动作空间;对样本数据进行编码和预处理;再构建主牌DQN网络,预训练主牌奖励函数来更新样本中的奖励值,将新的样本输入主牌DQN网络进行训练;构建副牌DQN网络,设计副牌奖励函数、更新样本中奖励值并放入副牌DQN网络训练;以单一DQN网络的智能体作为比较对象,以游戏胜率作为比较标准,比较主副牌DQN和单一DQN的表现,并进行可视化展示。本发明能够有效解决斗地主游戏中强化学习面临的动作空间巨大和奖励稀疏的问题,提升了智能体在游戏中的表现。