一种热管理智能体训练方法、装置、车辆及存储介质
摘要:
本申请涉及一种热管理智能体训练方法、装置、车辆及存储介质,涉及计算机技术领域。该方法包括:构建降阶模型;降阶模型为基于热管理系统的参数之间的映射关系构建的神经网络模型;基于降阶模型对车辆的热管理智能体进行训练;智能体为强化学习系统中,基于观测量进行学习,以输出最优决策的系统;热管理智能体用于基于车辆的状态信息管理车辆的热管理系统。由此,基于降阶模型对热管理智能体进行训练,可以提高热管理智能体的训练效率。
0/0