一种基于深度强化学习的无人车竞速控制器的设计方法

    公开(公告)号:CN118605267A

    公开(公告)日:2024-09-06

    申请号:CN202410689853.4

    申请日:2024-05-30

    Abstract: 本发明公开了一种基于深度强化学习的无人车竞速控制器的设计方法。该方法包括:通过预训练的离散变分自编码器对环境的状态信息进行特征提取,降低原始RGB相机图像数据的维度;将GRU融入TQC算法策略网络与价值网络的特征层,提取环境状态信息的时域特征,使算法可以处理因系统延迟导致的部分可观测马尔可夫决策问题;使用循环经验回放为经验序列增加额外的烧录过程,解决不良GRU初始隐藏状态对算法收敛稳定性的影响;使用概率组合优先经验回放为新经验提供额外的回放机制,提升新经验的采样概率,加速无人车竞速算法的收敛。将收敛后算法的策略网络做为无人车竞速控制器,实验结果表明,该控制器可以高效控制无人车进行绕圈竞速。

Patent Agency Ranking