-
公开(公告)号:CN113051667A
公开(公告)日:2021-06-29
申请号:CN202110333743.0
申请日:2021-03-29
Applicant: 东南大学
IPC: G06F30/15 , G06F30/27 , G06N3/04 , G06N3/08 , G06F119/14
Abstract: 本发明涉及一种混合动力汽车能量管理策略的加速学习方法,主要应用于基于深度强化学习的能量管理策略开发。通过不同混合动力汽车的驾驶工况信息,基于深度神经网络结构创建Actor网络和Critic网络,使用DDPG算法对源域的驾驶工况数据进行训练,以获得迁移学习所需要的内部表征;用获得的来自源域的内部表征初始化用来训练目标域的Actor网络和Critic网络,随机初始化训练目标域的Actor、Critic网络中的其他参数,并用少量的驾驶工况数据微调目标域的内部表征;目标域混合动力汽车执行训练完成的能量管理策略。本法发明具有共性的原则利用起来,节省了重新训练参数的时间,缩短了目标域混合动力汽车能量管理策略的训练周期,也有利于提高混合动力汽车的燃油经济性。
-
公开(公告)号:CN113051667B
公开(公告)日:2024-02-02
申请号:CN202110333743.0
申请日:2021-03-29
Applicant: 东南大学
Abstract: 本发明涉及一种混合动力汽车能量管理策略的加速学习方法,主要应用于基于深度强化学习的能量管理策略开发。通过不同混合动力汽车的驾驶工况信息,基于深度神经网络结构创建Actor网络和Critic网络,使用DDPG算法对源域的驾驶工况数据进行训练,以获得迁移学习所需要的内部表征;用获得的来自源域的内部表征初始化用来训练目标域的Actor网络和Critic网络,随机初始化训练目标域的Actor、Critic网络中的其他参数,并用少量的驾驶工况数据微调目标域的内部表征;目标域混合动力汽车执行训练完成的能量管理策略。本法发明具有共性的原则利用起来,节省了重新训练参数的时间,缩短了目标域混合动力汽车能量管理策略的训练周期,也有利于提高混合动力汽车的燃油经济性。
-