一种智能网联汽车感知决策模块功能安全和网络安全内生保障方法

    公开(公告)号:CN112406892B

    公开(公告)日:2022-11-18

    申请号:CN202011208015.9

    申请日:2020-11-03

    Applicant: 上海大学

    Abstract: 本发明公开了一种智能网联汽车感知决策模块功能安全和网络安全内生保障方法,包含以下步骤:设计并实现四个功能相同且具有一定异构度的感知决策单元,并将其部署在车辆上;四个单元分别根据感知到的信息推演出实时的车辆控制决策结果;裁决器根据其中三个感知决策单元的决策结果进行精确裁决和近似裁决;最终根据裁决器的不同裁决结果,车辆执行CAN命令,或者对异常单元进行替换并重新裁决,或者按照故障模式运行直至停车。本发明方法采用内生安全的思路,为智能网联汽车提供一种功能安全和网络安全一体化增强的新方案。

    一种基于动作约束的无人系统安全决策方法、系统及介质

    公开(公告)号:CN118550194A

    公开(公告)日:2024-08-27

    申请号:CN202410620812.X

    申请日:2024-05-17

    Applicant: 上海大学

    Abstract: 本发明公开一种基于动作约束的无人系统安全决策方法、系统及介质,涉及自动驾驶领域,方法包括:基于演员‑评论家算法设计无人系统的策略网络和多维价值网络;多维价值网络包括主干网络和多个辅助价值评估网络;一个辅助价值评估网络对应一个安全动作约束;策略网络用于根据无人系统当前的状态确定无人系统当前的策略动作;辅助价值评估网络用于判断无人系统当前的策略动作是否满足对应的安全动作约束;基于历史训练样本对策略网络和多维价值网络进行训练优化;将训练优化后的策略网络和多维价值网络确定为安全决策模型;获取无人系统当前的状态并输入安全决策模型,得到最优策略。本发明使无人系统在成功完成任务的同时能够做出安全决策。

    一种无人车目标搜索方法、装置、介质及产品

    公开(公告)号:CN118410855A

    公开(公告)日:2024-07-30

    申请号:CN202410269618.1

    申请日:2024-03-08

    Applicant: 上海大学

    Abstract: 本发明公开一种无人车目标搜索方法、装置、介质及产品,涉及强化学习和多任务学习技术领域,根据功能将无人车目标搜索任务分解为若干个基础任务;构建交互式仿真环境,获取观测数据并转化为无人车观测特征向量,预测当前正在执行的任务;将观测特征向量输入到门控循环单元网络中,获得观测时序特征向量;将观测时序特征向量输入至每个策略网络中,得到一组动作;将任务预测结果与动作做内积,得到最佳动作并执行,获取观测数据、环境奖励和任务完成状态,计算损失并更新网络参数。本发明使无人车在基础任务中进行联合训练,学习到可重用的策略表示,跳过复杂目标任务的从零开始学习过程,从而提高强化学习算法在复杂控制和决策任务上的性能。

    一种无人车决策模型虚实迁移方法、控制方法及相关系统

    公开(公告)号:CN118095409A

    公开(公告)日:2024-05-28

    申请号:CN202410264681.6

    申请日:2024-03-08

    Applicant: 上海大学

    Abstract: 本发明公开一种无人车决策模型虚实迁移方法、控制方法及相关系统,涉及深度学习和智能无人系统技术领域,方法包括:根据虚拟物体的位姿数据集,利用神经辐射场网络学习虚拟物体的特征,获得每类虚拟物体对应的神经网络模型;建立真实任务环境中各真实物体与各类虚拟物体的映射关系,并依此确定各真实物体对应的神经网络模型;构建真实任务环境语义图;根据所述真实任务环境语义图,对决策算法模型进行训练;将训练后的决策算法模型部署到无人车的控制器上。本发明通过将任务环境中的真实物体与虚拟物体进行关联,从而构建虚实一致的任务环境语义图,并将其用于训练无人车决策算法模型,以实现决策算法模型的虚实无缝迁移。

    一种面向动态场景的无人系统搜索和规划策略优化方法、装置、介质及产品

    公开(公告)号:CN118036469A

    公开(公告)日:2024-05-14

    申请号:CN202410303221.X

    申请日:2024-03-18

    Applicant: 上海大学

    Abstract: 本发明公开了一种面向动态场景的无人系统搜索和规划策略优化方法、装置、介质及产品,涉及无人系统模仿学习领域。设定无人系统场景,获取无人系统演示数据并构建自主行为决策模型;将演示数据与交互样本数据混合,并计算混合权重衰减因子;根据混合样本数据确定自主行为决策模型的损失;基于自主行为决策模型的损失以及混合权重衰减因子,得到策略模型的目标函数;根据混合样本数据,确定价值网络模型的目标函数;基于策略模型的目标函数和价值网络模型的目标函数更新自主行为决策模型;根据更新后的自主行为决策模型对无人系统的动作作出决策,以实现路径规划和目标搜索。本发明提升了无人系统在动态场景下的目标搜索和路径规划性能。

    协作多无人系统贡献评估与决策方法、产品、介质及设备

    公开(公告)号:CN118551825A

    公开(公告)日:2024-08-27

    申请号:CN202410675450.4

    申请日:2024-05-28

    Applicant: 上海大学

    Abstract: 本发明公开一种协作多无人系统贡献评估与决策方法、产品、介质及设备,涉及协作多智能体强化学习领域,方法包括:基于每个无人系统的状态价值和优势动作价值,计算全局状态价值和优势动作价值,进而计算联合动作价值;利用联合动作价值和每个无人系统的动作价值分布,计算所有无人系统的联合动作价值分布;基于残差映射权重矩阵修正后的所有无人系统的联合动作价值分布以及每个无人系统的动作价值,对无人系统策略网络进行训练和优化;利用优化后的该网络进行决策。本发明能在面对复杂的、非单调的任务时,准确评估不同无人系统在团队奖励中的贡献占比,激励无人系统朝着最优协作策略前进,从而完成团队贡献度的合理分配。

    基于自主规划路径模型的无人车路径规划方法及装置

    公开(公告)号:CN118550290A

    公开(公告)日:2024-08-27

    申请号:CN202410572330.1

    申请日:2024-05-09

    Applicant: 上海大学

    Abstract: 本发明了公开一种基于自主规划路径模型的无人车路径规划方法及装置,涉及无人车规划路径领域,该方法包括在无人车与环境交互时将获取的四元组经验存入经验池;计算经验池中各个四元组经验的复合优先级,标记各个四元组经验的轨迹,利用优先级指数衰减分配方法对复合优先级数组进行更新,将更新后的复合优先级以及对应的四元组经验按照标记的轨迹存入至经验回放数组;根据重要性采样权重对经验回放数组进行采样得到采样四元组经验;利用采样四元组经验对自主规划路径模型进行训练,自主规划路径模型包括策略网络、价值网络和目标价值网络,利用训练后的策略网络,对无人车进行在线路径规划。本发明提高了无人车路径规划的准确率。

    基于状态序列的无人系统自主行为决策方法及相关装置

    公开(公告)号:CN117993299A

    公开(公告)日:2024-05-07

    申请号:CN202410251255.9

    申请日:2024-03-05

    Applicant: 上海大学

    Abstract: 本发明公开一种基于状态序列的无人系统自主行为决策方法及相关装置,涉及深度强化学习技术领域,方法包括以下步骤:获取专家演示数据集和在线动作状态数据集,训练判别器;基于在线动作状态数据集更新逆动力学模型的参数,以此对专家演示数据集的动作进行补全,得到补全专家演示数据集;基于训练好的判别器计算在线动作状态数据的判别奖励值;基于判别奖励值和补全专家演示数据集,对待训练策略网络模型进行训练,得到自主行为决策策略网络模型。本发明基于参数更新后的逆动力学模型对专家演示数据集的动作进行补全,保证学习效果,避免了直接使用逆动力学模型对演示数据集进行补全,导致后续模仿学习过程存在误差,最终策略效果欠佳的问题发生。

    一种自主无人系统中的场景描述方法

    公开(公告)号:CN111243335B

    公开(公告)日:2023-03-24

    申请号:CN202010061799.0

    申请日:2020-01-20

    Abstract: 本发明公开一种自主无人系统中的场景描述方法,步骤为:离线构建自主无人系统外部场景库以及内部场景库。外部场景库包括静态场景要素与动态场景要素库、运行情景库,以及异常事件库。内部场景库包括行为决策信息、运动控制器等设备的执行信息、以及控制系统与执行系统的内部状态信息。在自主无人系统运行时,获取其环境感知数据,提取出外部场景中的关键静态场景要素与动态场景要素,通过预定义的类来进行定义,以结构化语言的方式进行描述,并记录下相应的内部场景状态信息。同时,监测异常事件的发生,在异常事件发生时,对事件发生前后固定时间段内的感知数据进行全信息保存。本发明能够有效提高自主无人系统的鲁棒性与安全性保障。

Patent Agency Ranking