基于自我策略恢复的自动驾驶决策模型安全性增强方法和装置

    公开(公告)号:CN118192241A

    公开(公告)日:2024-06-14

    申请号:CN202410384099.3

    申请日:2024-04-01

    Abstract: 本发明公开了一种基于自我策略恢复的自动驾驶决策模型安全性增强方法和装置,利用模拟学习自动驾驶决策模型Mo的目标策略πo,得到优化后的模型学习模型MI′L;利用模型对抗攻击技术对优化后的模型学习模型MI′L进行攻击,生成对抗状态集;对对抗状态集进行游离程度计算,得到对抗性训练样本集;随后利用对抗性训练样本集实现对自动驾驶决策模型Mo的对抗性训练,得到重训练模型MR,实现对自动驾驶决策模型Mo的安全性增强。实现黑盒模型下,模拟学习自动驾驶决策模型Mo的鲁棒性提升。

Patent Agency Ranking