一种基于深度强化学习的斗地主AI改进方法

    公开(公告)号:CN114925810A

    公开(公告)日:2022-08-19

    申请号:CN202210431146.6

    申请日:2022-04-22

    Inventor: 孔燕 吴晓聪

    Abstract: 本发明公开了一种基于深度强化学习的斗地主AI改进方法,涉及智能斗地主与深度强化学习领域,首先对斗地主牌局进行预处理,获得出牌数据集和历史出牌数据集;然后,利用二进制的思想改进牌的编码方式以及在DDQN算法为基准构建深度强化学习框架的深度神经网络中加入GRU,比较普通DDQN和改进的DDQN的实验结果,以此来验证加入GRU和二进制编码的思想是否合理。本发明公开的基于深度强化学习的斗地主AI改进方法能够通过减少编码但保留相同信息的方式来减少训练智能体所需要的时间;通过GRU能使智能体在回顾历史行为的同时做出更加合理的动作,有助于推进斗地主智能体各个领域的研究。

Patent Agency Ranking