-
公开(公告)号:CN111780777B
公开(公告)日:2022-10-21
申请号:CN202010670465.3
申请日:2020-07-13
Applicant: 江苏中科智能制造研究院有限公司 , 中国科学院自动化研究所
IPC: G01C21/34
Abstract: 本发明属于无人车导航技术领域,具体涉及一种基于改进A*算法和深度强化学习的无人车路径规划方法,旨在充分发挥全局路径规划全局最优和局部规划实时避障的优势,以及改进A*算法的快速实时性和深度强化学习算法的复杂环境适应性,快速规划出无人车从起始点到目标点的无碰撞最优路径。本发明的规划方法包括:根据环境信息,建立初始化栅格代价地图;利用改进的A*算法规划全局路径;基于全局路径和激光雷达传感器性能,设计滑动窗口,将窗口探测的信息作为网络的状态输入;基于深度强化学习方法,采用Actor‑Critic架构,设计局部规划网络,本发明将知识和数据方法相结合,能够快速规划得到最优路径,使得无人车拥有更高的自主性。
-
公开(公告)号:CN114792133A
公开(公告)日:2022-07-26
申请号:CN202210715660.2
申请日:2022-06-23
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于多智能体协作系统的深度强化学习方法和装置,涉及人工智能技术领域,所述方法包括:在一次深度强化学习中,基于预先构建的深度强化学习网络和当前观测数据获取多智能体协作系统对应协作图的当前分配调整动作,基于当前分配调整动作获取当前奖惩数据,基于当前奖惩数据优化深度强化学习网络,重复执行上述步骤,直至达到预设收敛条件或者达到预设学习次数;通过多次深度强化学习更新协作图的当前分配调整动作,而不更新智能体的实际动作,以简化深度强化学习的步骤,实现在深度强化学习奖励稀疏的情况下,快速地进行多次深度强化学习积累更多的奖励,从而提高深度强化学习网络的训练效率以及收敛速度慢。
-
公开(公告)号:CN114003063A
公开(公告)日:2022-02-01
申请号:CN202111652645.X
申请日:2021-12-31
Applicant: 中国科学院自动化研究所
IPC: G05D1/10
Abstract: 本发明提供一种飞行器的控制方法及装置。所述方法包括:根据高阶奇异值分解法,对连续的飞行器的状态空间方程进行离散化处理,得到离散的飞行器顶点模型;确定飞行器的控制器和飞行器顶点模型构成的闭环控制系统满足性能指标,以及确定飞行器的控制器和飞行器顶点模型构成的闭环控制系统满足性能指标,得到优化后的控制器;根据优化后的控制器对飞行器进行控制。本发明提供的飞行器的控制方法及装置,通过将混合和性能设计的控制应用于飞行器的控制器中,结合了和两种性能的优点,对飞行器的控制器进行优化,使得飞行器不仅能有效的处理飞行器控制系统外部的随机噪声以及干扰,并且使得飞行器控制系统内部具有较好的鲁棒性。
-
公开(公告)号:CN113391556A
公开(公告)日:2021-09-14
申请号:CN202110922017.2
申请日:2021-08-12
Applicant: 中国科学院自动化研究所
IPC: G05B13/04
Abstract: 本发明提供一种基于角色分配的群体分布式控制方法及装置,方法包括:将获取的群体中的智能体的观测状态输入至第一策略网络模型中,得到第一策略网络模型输出的各智能体的角色类型;将智能体的观测状态与各智能体的角色类型输入至第二策略网络模型中,得到第二策略网络模型输出的对应智能体的动作;控制智能体执行动作;其中,第一策略网络模型和第二策略网络模型是利用智能体样本数据进行训练得到的,其中第二策略网络模型的输入为第一策略网络模型的输出。本发明通过构建具有角色分配的第一策略网络模型结构以及构建具有基于角色类型分配相应动作的第二策略网络模型结构,实现动态不确定环境下群体无碰撞的协同控制。
-
公开(公告)号:CN113253610A
公开(公告)日:2021-08-13
申请号:CN202110422539.6
申请日:2021-04-20
Applicant: 中国科学院自动化研究所
IPC: G05B13/04
Abstract: 本发明实施例提供一种飞行器控制方法及装置,该方法综合应用参数估计误差和状态跟踪误差来设计自适应律,并在自适应律中进一步加入鲁棒修正项,不仅实现了对非线性系统的参数不确定性和非参数不确定性的同时处理,而且能够提高对参数化不确定性项的收敛速度,增强对非参数化不确定性项的鲁棒抑制,有利于减小跟踪误差,提高控制精度,进而提高了飞行器的控制效果。
-
公开(公告)号:CN113128657A
公开(公告)日:2021-07-16
申请号:CN202110669818.2
申请日:2021-06-17
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种多智能体行为决策方法、装置、电子设备和存储介质,其中方法包括:基于多智能体行为模型中的图生成模块,将各个智能体及其对应的环境信息构建为图;基于多智能体行为模型中的信息传递模块,对各个智能体及其对应的环境信息进行编码,得到各个智能体对应的联合编码状态;基于多智能体行为模型中的策略优化模块,结合各个智能体对应的联合编码状态,确定各个智能体的初始决策;基于多智能体行为模型中的碰撞避免模块,对各个智能体的初始决策进行变步长控制,并结合各个智能体对应的斥力,确定各个智能体的最终决策。本发明解决了大规模智能体场景下强化学习难以收敛的问题,实现了多智能体系统下高性能的自主决策能力和避碰效果。
-
公开(公告)号:CN111830995B
公开(公告)日:2021-05-11
申请号:CN202010782986.8
申请日:2020-08-06
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于群体智能协同技术领域,具体涉及了一种基于混合式架构的群体智能协同方法和系统,旨在解决现有的群体协同方法缺乏灵活性和自主性并且无人平台之间数据交互和协同不足的问题。本发明包括:先基于预设的群体任务生成个体无碰撞路径,无人平台执行个体无碰撞路径同时获取自身传感器数据,无人平台根据各传感器数据构建局部地图并生成再规划路径,无人平台执行再规划路径并将任务执行状态传输至控制中枢,控制中枢根据任务执行状态调整群体任务,本发明提高了群体智能协同的灵活性和自主性并加强了平台间的数据交互和协同。
-
公开(公告)号:CN112711815A
公开(公告)日:2021-04-27
申请号:CN202110318172.3
申请日:2021-03-25
Applicant: 中国科学院自动化研究所
IPC: G06F30/15 , G06F30/28 , G06F119/14
Abstract: 本发明属于飞行器设计与分析领域,具体涉及一种飞行器建模与模型特性分析系统,旨在解决现有飞行器建模与模型特性分析系统无法高效、准确的进行飞行器建模与模型特性分析的问题。本系统包括:系统管理模块配置为对系统进行初始化设置;空气动力/空气动力矩模块配置为计算作用于飞行器质心的气动力/绕飞行器质心的气动力矩;六自由度运动方程模块配置为构建飞行器全维运动状态方程组;基准运动状态求解模块配置为求解飞行器在基准运动条件下的全维运动状态;运动方程线性化模块配置为生成状态空间形式的飞行器全状态线性化模型;特性分析与显示模块配置为进行飞行器模型特性分析。本发明实现了高效、准确的进行飞行器建模与模型特性分析。
-
公开(公告)号:CN112203291B
公开(公告)日:2021-02-23
申请号:CN202011393769.6
申请日:2020-12-03
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于无人集群系统协同技术领域,具体涉及了一种基于知识嵌入的区域覆盖和连通保持的集群控制方法,旨在解决现有技术无法在实现目标覆盖最大化的同时有效保证集群中智能体之间的连通性,因而智能体控制效果不佳的问题。本发明包括:提取群体中各智能体和目标的状态信息的相对特征;提取邻居各智能体对目标的意图特征和交互信息,并扩展感受野;设计群体奖惩函数,计算智能体选择累计回报最大的动作;删除冗余重要连接边,获得目标覆盖最大化的重要连接图和重要性节点集合;计算保证通信拓扑图实时连通的智能体最大步长,对动作进行约束截断,输出到集群智能体。本发明将知识和数据方法相结合,能够快速实现集群连通保持下的目标覆盖最大化。
-
公开(公告)号:CN111830995A
公开(公告)日:2020-10-27
申请号:CN202010782986.8
申请日:2020-08-06
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于群体智能协同技术领域,具体涉及了一种基于混合式架构的群体智能协同方法和系统,旨在解决现有的群体协同方法缺乏灵活性和自主性并且无人平台之间数据交互和协同不足的问题。本发明包括:先基于预设的群体任务生成个体无碰撞路径,无人平台执行个体无碰撞路径同时获取自身传感器数据,无人平台根据各传感器数据构建局部地图并生成再规划路径,无人平台执行再规划路径并将任务执行状态传输至控制中枢,控制中枢根据任务执行状态调整群体任务,本发明提高了群体智能协同的灵活性和自主性并加强了平台间的数据交互和协同。
-
-
-
-
-
-
-
-
-