一种无人车目标搜索方法、装置、介质及产品

    公开(公告)号:CN118410855A

    公开(公告)日:2024-07-30

    申请号:CN202410269618.1

    申请日:2024-03-08

    Applicant: 上海大学

    Abstract: 本发明公开一种无人车目标搜索方法、装置、介质及产品,涉及强化学习和多任务学习技术领域,根据功能将无人车目标搜索任务分解为若干个基础任务;构建交互式仿真环境,获取观测数据并转化为无人车观测特征向量,预测当前正在执行的任务;将观测特征向量输入到门控循环单元网络中,获得观测时序特征向量;将观测时序特征向量输入至每个策略网络中,得到一组动作;将任务预测结果与动作做内积,得到最佳动作并执行,获取观测数据、环境奖励和任务完成状态,计算损失并更新网络参数。本发明使无人车在基础任务中进行联合训练,学习到可重用的策略表示,跳过复杂目标任务的从零开始学习过程,从而提高强化学习算法在复杂控制和决策任务上的性能。

Patent Agency Ranking