一种基于深度安全强化学习的机器人无地图导航方法

    公开(公告)号:CN113093727B

    公开(公告)日:2023-03-28

    申请号:CN202110250387.6

    申请日:2021-03-08

    Abstract: 本发明具体涉及一种基于深度安全强化学习的机器人无地图导航方法,具体包括:初始化训练环境,设计移动机器人奖励函数和安全风险代价函数;利用传感器检测的图像信息和激光雷达信息,结合移动机器人的目标信息和运动信息,将各状态信息进行处理后经Actor网络输出决策动作到机器人,机器人执行Actor网络输出的动作,从环境中得到下一时刻新的状态观测及奖励信息,将机器人与环境交互得到的经验存入经验池,定期更新网络参数;判断是否训练结束,将训练好的模型应用于真实移动机器人进行导航。本发明基于演员‑评论家‑安全(ACS)框架的深度安全强化学习,通过引入约束性策略优化(CPO)算法,提升了强化学习用于无地图导航任务的安全性。

    一种基于深度安全强化学习的机器人无地图导航方法

    公开(公告)号:CN113093727A

    公开(公告)日:2021-07-09

    申请号:CN202110250387.6

    申请日:2021-03-08

    Abstract: 本发明具体涉及一种基于深度安全强化学习的机器人无地图导航方法,具体包括:初始化训练环境,设计移动机器人奖励函数和安全风险代价函数;利用传感器检测的图像信息和激光雷达信息,结合移动机器人的目标信息和运动信息,将各状态信息进行处理后经Actor网络输出决策动作到机器人,机器人执行Actor网络输出的动作,从环境中得到下一时刻新的状态观测及奖励信息,将机器人与环境交互得到的经验存入经验池,定期更新网络参数;判断是否训练结束,将训练好的模型应用于真实移动机器人进行导航。本发明基于演员‑评论家‑安全(ACS)框架的深度安全强化学习,通过引入约束性策略优化(CPO)算法,提升了强化学习用于无地图导航任务的安全性。

    基于生成对抗网络和注意力机制的视频行人重识别方法

    公开(公告)号:CN113221641B

    公开(公告)日:2023-07-07

    申请号:CN202110357679.X

    申请日:2021-04-01

    Abstract: 本发明公开了一种基于生成对抗网络和注意力机制的视频行人重识别方法,包括基于生成对抗网络,利用现有公开的视频行人重识别数据集,实现视频帧预测和行人身份标定,增加有效的训练样本;其次使用预训练的ResNet50模型对每帧图像和对应的光流图进行特征提取,然后通过门控循环单元(GRU)捕捉每个行人图像序列中的特征的依赖关系,引入注意力机制,提取整个图像序列特征表示;最后使用孪生网络构建行人重识别模型,利用模型两个输出特征进行对比学习。本发明技术方案在无重叠监控系统中,能够有效解决行人出现在监控摄像头下时间较短造成模型训练样本不足和光照变化、行人遮挡等问题,可以明显提高行人重识别的精度。

    一种基于深度强化学习的仓储系统多机器人路径规划方法

    公开(公告)号:CN113110509A

    公开(公告)日:2021-07-13

    申请号:CN202110535242.0

    申请日:2021-05-17

    Abstract: 本发明提供了一种基于深度强化学习的仓储系统多机器人路径规划方法,包括如下步骤:步骤S1:定义多机器人路径规划问题中的节点、状态、动作、奖励回报;步骤S2:选择子目标点,中央控制器计算每个机器人的状态;步骤S3:基于深度强化学习方法,设计分布式多机器人路径规划器;步骤S4:计算损失函数,对网络参数进行更新;步骤S5:将训练好的模型应用于多机器人路径规划。本发明的有益效果是:本发明能够解决传统路径规划算法实时性差的问题,并且容易拓展到不同地图规模、不同机器人数量的仓储系统中,具有良好的泛化性能。

    一种基于深度强化学习的仓储系统多机器人路径规划方法

    公开(公告)号:CN113110509B

    公开(公告)日:2023-02-28

    申请号:CN202110535242.0

    申请日:2021-05-17

    Abstract: 本发明提供了一种基于深度强化学习的仓储系统多机器人路径规划方法,包括如下步骤:步骤S1:定义多机器人路径规划问题中的节点、状态、动作、奖励回报;步骤S2:选择子目标点,中央控制器计算每个机器人的状态;步骤S3:基于深度强化学习方法,设计分布式多机器人路径规划器;步骤S4:计算损失函数,对网络参数进行更新;步骤S5:将训练好的模型应用于多机器人路径规划。本发明的有益效果是:本发明能够解决传统路径规划算法实时性差的问题,并且容易拓展到不同地图规模、不同机器人数量的仓储系统中,具有良好的泛化性能。

    基于生成对抗网络和注意力机制的视频行人重识别方法

    公开(公告)号:CN113221641A

    公开(公告)日:2021-08-06

    申请号:CN202110357679.X

    申请日:2021-04-01

    Abstract: 本发明公开了一种基于生成对抗网络和注意力机制的视频行人重识别方法,包括基于生成对抗网络,利用现有公开的视频行人重识别数据集,实现视频帧预测和行人身份标定,增加有效的训练样本;其次使用预训练的RseNet50模型对每帧图像和对应的光流图进行特征提取,然后通过门控循环单元(GRU)捕捉每个行人图像序列中的特征的依赖关系,引入注意力机制,提取整个图像序列特征表示;最后使用孪生网络构建行人重识别模型,利用模型两个输出特征进行对比学习。本发明技术方案在无重叠监控系统中,能够有效解决行人出现在监控摄像头下时间较短造成模型训练样本不足和光照变化、行人遮挡等问题,可以明显提高行人重识别的精度。

Patent Agency Ranking