-
公开(公告)号:CN118036469A
公开(公告)日:2024-05-14
申请号:CN202410303221.X
申请日:2024-03-18
Applicant: 上海大学
IPC: G06F30/27 , G06F111/08
Abstract: 本发明公开了一种面向动态场景的无人系统搜索和规划策略优化方法、装置、介质及产品,涉及无人系统模仿学习领域。设定无人系统场景,获取无人系统演示数据并构建自主行为决策模型;将演示数据与交互样本数据混合,并计算混合权重衰减因子;根据混合样本数据确定自主行为决策模型的损失;基于自主行为决策模型的损失以及混合权重衰减因子,得到策略模型的目标函数;根据混合样本数据,确定价值网络模型的目标函数;基于策略模型的目标函数和价值网络模型的目标函数更新自主行为决策模型;根据更新后的自主行为决策模型对无人系统的动作作出决策,以实现路径规划和目标搜索。本发明提升了无人系统在动态场景下的目标搜索和路径规划性能。
-
公开(公告)号:CN118551825A
公开(公告)日:2024-08-27
申请号:CN202410675450.4
申请日:2024-05-28
Applicant: 上海大学
IPC: G06N3/092 , G06N3/0464 , G06N3/08 , G06N3/048
Abstract: 本发明公开一种协作多无人系统贡献评估与决策方法、产品、介质及设备,涉及协作多智能体强化学习领域,方法包括:基于每个无人系统的状态价值和优势动作价值,计算全局状态价值和优势动作价值,进而计算联合动作价值;利用联合动作价值和每个无人系统的动作价值分布,计算所有无人系统的联合动作价值分布;基于残差映射权重矩阵修正后的所有无人系统的联合动作价值分布以及每个无人系统的动作价值,对无人系统策略网络进行训练和优化;利用优化后的该网络进行决策。本发明能在面对复杂的、非单调的任务时,准确评估不同无人系统在团队奖励中的贡献占比,激励无人系统朝着最优协作策略前进,从而完成团队贡献度的合理分配。
-
公开(公告)号:CN118550290A
公开(公告)日:2024-08-27
申请号:CN202410572330.1
申请日:2024-05-09
Applicant: 上海大学
Abstract: 本发明了公开一种基于自主规划路径模型的无人车路径规划方法及装置,涉及无人车规划路径领域,该方法包括在无人车与环境交互时将获取的四元组经验存入经验池;计算经验池中各个四元组经验的复合优先级,标记各个四元组经验的轨迹,利用优先级指数衰减分配方法对复合优先级数组进行更新,将更新后的复合优先级以及对应的四元组经验按照标记的轨迹存入至经验回放数组;根据重要性采样权重对经验回放数组进行采样得到采样四元组经验;利用采样四元组经验对自主规划路径模型进行训练,自主规划路径模型包括策略网络、价值网络和目标价值网络,利用训练后的策略网络,对无人车进行在线路径规划。本发明提高了无人车路径规划的准确率。
-
公开(公告)号:CN117993299A
公开(公告)日:2024-05-07
申请号:CN202410251255.9
申请日:2024-03-05
Applicant: 上海大学
IPC: G06F30/27 , G06F18/15 , G06F18/214 , G06F111/10 , G06F119/14 , G06F123/02
Abstract: 本发明公开一种基于状态序列的无人系统自主行为决策方法及相关装置,涉及深度强化学习技术领域,方法包括以下步骤:获取专家演示数据集和在线动作状态数据集,训练判别器;基于在线动作状态数据集更新逆动力学模型的参数,以此对专家演示数据集的动作进行补全,得到补全专家演示数据集;基于训练好的判别器计算在线动作状态数据的判别奖励值;基于判别奖励值和补全专家演示数据集,对待训练策略网络模型进行训练,得到自主行为决策策略网络模型。本发明基于参数更新后的逆动力学模型对专家演示数据集的动作进行补全,保证学习效果,避免了直接使用逆动力学模型对演示数据集进行补全,导致后续模仿学习过程存在误差,最终策略效果欠佳的问题发生。
-
公开(公告)号:CN114084169B
公开(公告)日:2024-04-30
申请号:CN202111447908.3
申请日:2021-11-29
Applicant: 网络通信与安全紫金山实验室 , 上海大学
IPC: B60W60/00
Abstract: 本发明公开了一种智能网联汽车的内生安全裁决方法、系统和存储介质,裁决方法包含以下步骤:在车辆上部署多个异构感知决策单元以实现动态异构冗余构造,车辆行驶过程中,裁决模块对其中三个感知决策单元功能交集部分的输出结果进行时空同步、感知裁决、决策裁决、迭代裁决;最终根据裁决模块的不同裁决结果,车辆执行CAN命令,或者替换异常感知决策单元,或者按照故障模式运行直至停车。本本发明通过对多个异构感知决策模块功能交集部分的输出结果进行裁决,达到异构感知决策模块之间基本感知功能和基本决策功能相互监督的效果,从而一体化增强智能网联汽车功能安全和网络安全、实现智能网联汽车底线安全。
-
公开(公告)号:CN111243335B
公开(公告)日:2023-03-24
申请号:CN202010061799.0
申请日:2020-01-20
Applicant: 上海大学 , 上海宽带技术及应用工程研究中心
Abstract: 本发明公开一种自主无人系统中的场景描述方法,步骤为:离线构建自主无人系统外部场景库以及内部场景库。外部场景库包括静态场景要素与动态场景要素库、运行情景库,以及异常事件库。内部场景库包括行为决策信息、运动控制器等设备的执行信息、以及控制系统与执行系统的内部状态信息。在自主无人系统运行时,获取其环境感知数据,提取出外部场景中的关键静态场景要素与动态场景要素,通过预定义的类来进行定义,以结构化语言的方式进行描述,并记录下相应的内部场景状态信息。同时,监测异常事件的发生,在异常事件发生时,对事件发生前后固定时间段内的感知数据进行全信息保存。本发明能够有效提高自主无人系统的鲁棒性与安全性保障。
-
公开(公告)号:CN111243335A
公开(公告)日:2020-06-05
申请号:CN202010061799.0
申请日:2020-01-20
Applicant: 上海大学 , 上海宽带技术及应用工程研究中心
Abstract: 本发明公开一种自主无人系统中的场景描述方法,步骤为:离线构建自主无人系统外部场景库以及内部场景库。外部场景库包括静态场景要素与动态场景要素库、运行情景库,以及异常事件库。内部场景库包括行为决策信息、运动控制器等设备的执行信息、以及控制系统与执行系统的内部状态信息。在自主无人系统运行时,获取其环境感知数据,提取出外部场景中的关键静态场景要素与动态场景要素,通过预定义的类来进行定义,以结构化语言的方式进行描述,并记录下相应的内部场景状态信息。同时,监测异常事件的发生,在异常事件发生时,对事件发生前后固定时间段内的感知数据进行全信息保存。本发明能够有效提高自主无人系统的鲁棒性与安全性保障。
-
公开(公告)号:CN111241552A
公开(公告)日:2020-06-05
申请号:CN202010061800.X
申请日:2020-01-20
Applicant: 上海大学 , 上海宽带技术及应用工程研究中心
Abstract: 本发明公开一种自主无人系统安全辅助系统,包括安全boot模块,可重构接口模块,感知决策控制和预警数据解析与融合模块,结构化数据统一描述模块,关键快照数据解析与融合模块,快照数据处理与统一记录模块,存储器控制1模块,存储器控制2模块,异构冗余的存储器模块。安全boot模块负责安全辅助系统的安全启动;可重构接口模块满足多样化接口协议需求;感知、决策和预警数据和关键快照数据分别由相应模块进行流水线处理;异构冗余存储器模块对数据进行安全存储。本系统不仅能够保证自主无人系统的安全启动,还能够实现车辆感知信息、决策信息和控制信息的安全可靠记录和读取,为事故分析还原、事故原因定位、日常驾驶习惯分析等提供决策依据。
-
公开(公告)号:CN106975329B
公开(公告)日:2019-11-15
申请号:CN201710238939.5
申请日:2017-04-13
Applicant: 上海大学
Abstract: 本发明公开了一种真空等离子体叠式管状空气净化装置,包括初级过滤装置、内层陶瓷管、外层陶瓷管、金属芯棒、活性炭纤维疏松材料、固定装置、氮氧化物吸收装置、气体动力装置、电源和控制装置。采用初级过滤装置、真空叠式管状等离子体装置、复合光催化剂模块及氮氧化物吸收剂模块,通过功能模块的复合和集成,能对含有有机污染物的空气实现多级和深度处理,有效减少在降解挥发性有机物过程中产生的无机副产物如臭氧、二氧化氮和有机副产物如氰化物,并吸附副产物使得达标,而且不会引发二次污染。本发明装置充分考虑到等离子体降解挥发性有机物产生的有机、无机副产物,确保排放的副产物浓度达标,氮氧化物吸收剂装置更换简易,应用领域广泛。
-
公开(公告)号:CN119520110A
公开(公告)日:2025-02-25
申请号:CN202411673255.4
申请日:2024-11-21
Applicant: 上海大学
IPC: H04L9/40
Abstract: 本发明涉及一种非完备系统信息下的隐匿数据注入攻击构建及应对方法,包括基于信息物理系统中物理系统特性,建立测量矩阵及系统模型;基于系统模型,建立攻击模型,在单未知参数情形下,构建躲避残差检测的第一隐匿数据注入攻击关系式;基于第一隐匿数据注入攻击关系式,构建多未知参数情形下能躲避残差检测的第二隐匿数据注入攻击关系式;基于最小生成树提出参数信息保护策略,以第一隐匿数据注入攻击关系式和第二隐匿数据注入攻击关系式均失效为目标,得到需要保护的核心参数及最小参数量,应对非完备系统信息下的隐匿数据注入攻击。与现有技术相比,本发明可辅助信息物理系统管理者评估系统安全风险、识别系统关键信息要素、优化参数保护策略。
-
-
-
-
-
-
-
-
-