-
公开(公告)号:CN113534668A
公开(公告)日:2021-10-22
申请号:CN202110930108.0
申请日:2021-08-13
Applicant: 哈尔滨工程大学
IPC: G05B13/04
Abstract: 本发明公开了基于最大熵的演员‑评论家框架的AUV运动规划方法,包括以下步骤:S1:构建AUV操纵性模型;S2:确定AUV的状态空间与动作空间;S3:基于MDP决策过程,提出基于最大熵的强化学习算法,构建神经网络结构,搭建AUV运动规划系统;S4:设置一个综合的奖励函数来评估AUV决策的优劣,指导AUV完成运动规划任务的目标:在躲避障碍物到达目标点的同时,航行路程及所用时间达到最优;S5:通过自交互训练获得最优策略,保存训练好的神经网络参数,将最优策略对应的具体指令传递给下位机,最终实现感知‑规划‑控制的运动规划过程;本发明能够发现到达目标位置的多种策略,在应对各种突发态势时有较好的鲁棒性,且能在多约束的条件下顺利完成指定任务。
-
公开(公告)号:CN112925319A
公开(公告)日:2021-06-08
申请号:CN202110098934.3
申请日:2021-01-25
Applicant: 哈尔滨工程大学
Abstract: 一种基于深度强化学习的水下自主航行器动态避障方法,涉及水下机器人避障技术领域。本发明是为了解决目前缺乏水下自主航行器对动态障碍物的避障研究的问题。本发明建立水下自主航行器模型与运动学模型,获取周围障碍物的信息;采集水下自主航行器周围机动障碍物的运动状态信息,并构造动态障碍物状态方程;根据动态障碍物状态方程预测动态障碍物运动学模型;根据水下自主航行器周围障碍物的信息和动态障碍物运动学模型,融合多动态障碍物避障法生成避障策略并转化为MDP模型;结合确定性深度策略梯度算法对MDP模型进行训练,直至水下自主航行器能够无碰撞的到达目标区域;利用训练好的MDP模型引导水下自主航行器航行。
-
公开(公告)号:CN112925319B
公开(公告)日:2022-06-07
申请号:CN202110098934.3
申请日:2021-01-25
Applicant: 哈尔滨工程大学
Abstract: 一种基于深度强化学习的水下自主航行器动态避障方法,涉及水下机器人避障技术领域。本发明是为了解决目前缺乏水下自主航行器对动态障碍物的避障研究的问题。本发明建立水下自主航行器模型与运动学模型,获取周围障碍物的信息;采集水下自主航行器周围机动障碍物的运动状态信息,并构造动态障碍物状态方程;根据动态障碍物状态方程预测动态障碍物运动学模型;根据水下自主航行器周围障碍物的信息和动态障碍物运动学模型,融合多动态障碍物避障法生成避障策略并转化为MDP模型;结合确定性深度策略梯度算法对MDP模型进行训练,直至水下自主航行器能够无碰撞的到达目标区域;利用训练好的MDP模型引导水下自主航行器航行。
-
公开(公告)号:CN113640780A
公开(公告)日:2021-11-12
申请号:CN202110966327.4
申请日:2021-08-23
Applicant: 哈尔滨工程大学
Abstract: 本发明公开一种基于改进的联邦滤波的水下AUV传感器时间配准方法,包括:S1、构建测距声纳的测距模型,获得声纳数据;S2、获取配准周期内姿态传感器数据,作为第一姿态数据,对所述第一姿态数据进行预处理,获得处理后的配准周期内姿态传感器数据,作为第二姿态数据,对所述第二姿态数据进行滤波处理,同时对所述第二姿态数据和所述声纳数据进行融合修正处理,获得i个子滤波器数据;S3、对所述i个子滤波器数据进行最优融合估计处理获得子滤波的误差协方差矩阵,对所述误差协方差矩阵进行更新,完成水下AUV传感器时间配准。本申请降低了噪声干扰,提高了准确度。
-
公开(公告)号:CN112241176A
公开(公告)日:2021-01-19
申请号:CN202011109095.2
申请日:2020-10-16
Applicant: 哈尔滨工程大学
IPC: G05D1/06
Abstract: 本发明是一种水下自主航行器在大尺度连续性障碍物环境中路径规划避障控制方法。本发明涉及水下机器人路径避障规划技术领域,本发明建立存在大尺度连续性障碍物模拟训练环境,以避障传感器信息为输入,航行速度和偏航角速度为输出搭建深度强化学习神经网络的状态与动作,针对运动规划避障控制过程的多目标结构,对奖赏函数进行了模块化设计,为了避免稀疏奖励引起系统不稳定,结合人工势场法设置连续性奖励。本发明利用基于改进的深度确定性策略梯度算法,对水下自主航行器进行避障训练,将训练所得到的避障策略写入机器人下位机控制系统;水下自主航行器在水下峡谷中行驶时,利用训练学习到的避障策略进行避障,安全的到达目标区域。
-
公开(公告)号:CN112199792A
公开(公告)日:2021-01-08
申请号:CN202011064774.2
申请日:2020-09-30
Applicant: 哈尔滨工程大学
IPC: G06F30/17 , G06F30/20 , G06T17/00 , G06F111/04 , G06F111/06 , G06F111/10 , G06F119/14
Abstract: 本发明的一种微小型水下机器人多学科优化设计方法,所述优化设计方法包括以下步骤:步骤一、分别建立各学科的数学模型和机器人整体的运动学模型;步骤二、完成微小型水下机器人的多学科优化,引入带有可分层的全局变量,在改进的AAO框架下,构建各学科的基于试验设计的近似模型,在isight软件平台下完成优化,并得到微小型水下机器人多学科优化的可行解;步骤三、对多学科优化得到的可行解展开性能评估,在改进的层次分析法下完成机器人的性能评估并从中得到最终方案;步骤四、完成微小型水下机器人的三维建模,进行关于机器人的仿真验证。本发明解决了传统的串行设计模式中整体性较差的问题,同时也解决了现有AAO算法存在的问题。
-
公开(公告)号:CN112199792B
公开(公告)日:2021-07-20
申请号:CN202011064774.2
申请日:2020-09-30
Applicant: 哈尔滨工程大学
IPC: G06F30/17 , G06F30/20 , G06T17/00 , G06F111/04 , G06F111/06 , G06F111/10 , G06F119/14
Abstract: 本发明的一种微小型水下机器人多学科优化设计方法,所述优化设计方法包括以下步骤:步骤一、分别建立各学科的数学模型和机器人整体的运动学模型;步骤二、完成微小型水下机器人的多学科优化,引入带有可分层的全局变量,在改进的AAO框架下,构建各学科的基于试验设计的近似模型,在isight软件平台下完成优化,并得到微小型水下机器人多学科优化的可行解;步骤三、对多学科优化得到的可行解展开性能评估,在改进的层次分析法下完成机器人的性能评估并从中得到最终方案;步骤四、完成微小型水下机器人的三维建模,进行关于机器人的仿真验证。本发明解决了传统的串行设计模式中整体性较差的问题,同时也解决了现有AAO算法存在的问题。
-
公开(公告)号:CN113640780B
公开(公告)日:2023-08-08
申请号:CN202110966327.4
申请日:2021-08-23
Applicant: 哈尔滨工程大学
Abstract: 本发明公开一种基于改进的联邦滤波的水下AUV传感器时间配准方法,包括:S1、构建测距声纳的测距模型,获得声纳数据;S2、获取配准周期内姿态传感器数据,作为第一姿态数据,对所述第一姿态数据进行预处理,获得处理后的配准周期内姿态传感器数据,作为第二姿态数据,对所述第二姿态数据进行滤波处理,同时对所述第二姿态数据和所述声纳数据进行融合修正处理,获得i个子滤波器数据;S3、对所述i个子滤波器数据进行最优融合估计处理获得子滤波的误差协方差矩阵,对所述误差协方差矩阵进行更新,完成水下AUV传感器时间配准。本申请降低了噪声干扰,提高了准确度。
-
公开(公告)号:CN112241176B
公开(公告)日:2022-10-28
申请号:CN202011109095.2
申请日:2020-10-16
Applicant: 哈尔滨工程大学
IPC: G05D1/06
Abstract: 本发明是一种水下自主航行器在大尺度连续性障碍物环境中路径规划避障控制方法。本发明涉及水下机器人路径避障规划技术领域,本发明建立存在大尺度连续性障碍物模拟训练环境,以避障传感器信息为输入,航行速度和偏航角速度为输出搭建深度强化学习神经网络的状态与动作,针对运动规划避障控制过程的多目标结构,对奖赏函数进行了模块化设计,为了避免稀疏奖励引起系统不稳定,结合人工势场法设置连续性奖励。本发明利用基于改进的深度确定性策略梯度算法,对水下自主航行器进行避障训练,将训练所得到的避障策略写入机器人下位机控制系统;水下自主航行器在水下峡谷中行驶时,利用训练学习到的避障策略进行避障,安全的到达目标区域。
-
公开(公告)号:CN113534668B
公开(公告)日:2022-06-10
申请号:CN202110930108.0
申请日:2021-08-13
Applicant: 哈尔滨工程大学
IPC: G05B13/04
Abstract: 本发明公开了基于最大熵的演员‑评论家框架的AUV运动规划方法,包括以下步骤:S1:构建AUV操纵性模型;S2:确定AUV的状态空间与动作空间;S3:基于MDP决策过程,提出基于最大熵的强化学习算法,构建神经网络结构,搭建AUV运动规划系统;S4:设置一个综合的奖励函数来评估AUV决策的优劣,指导AUV完成运动规划任务的目标:在躲避障碍物到达目标点的同时,航行路程及所用时间达到最优;S5:通过自交互训练获得最优策略,保存训练好的神经网络参数,将最优策略对应的具体指令传递给下位机,最终实现感知‑规划‑控制的运动规划过程;本发明能够发现到达目标位置的多种策略,在应对各种突发态势时有较好的鲁棒性,且能在多约束的条件下顺利完成指定任务。
-
-
-
-
-
-
-
-
-