-
公开(公告)号:CN118816883A
公开(公告)日:2024-10-22
申请号:CN202410801746.6
申请日:2024-06-20
Applicant: 大连海事大学
IPC: G01C21/20 , G06Q10/047 , G06F17/10
Abstract: 本发明公开了一种基于改进Q学习算法的无人艇航迹规划方法,通过建立栅格化海图,获取目的地位置坐标、障碍物的位置坐标,栅格单元所处位置的水深;并根据水面自主航行器的运动数学模型获取本船位置坐标,这样能够最大程度的反映出海洋的真实环境,据此建立包括碰撞与抵达奖励函数、深水区浅水区奖励函数、航路转向点奖励函数和最优路线奖励函数的Q学习算法的奖励函数,进而基于Q学习算法获取USV的最优路径,以实现对无人艇的航迹规划。本发明旨在通过Q学习算法综合考虑路径长短、深、浅水区、航路转向点等多因素要求,进行多目标优化,从而为USV进行真实海况下的航迹进行规划。
-
公开(公告)号:CN118672258A
公开(公告)日:2024-09-20
申请号:CN202410690382.9
申请日:2024-05-30
Applicant: 大连海事大学
IPC: G05D1/43 , G05D109/30
Abstract: 本发明公开一种基于深度强化学习的多水面自主航行器编队航行决策方法,分别建立了领航者奖励函数以及基于考虑跟随者与障碍物间的距离的跟随者的奖励函数;进而根据所述领航者的总奖励值、领航者策略网络能够获取领航者的舵角、领航者的速度;同时根据有全球导航卫星系统和所述多水面自主航行器编队模型所获取的领航者的预测位置坐标,结合跟随者的总奖励值和跟随者策略网络,获取跟随者的舵角和跟随者的速度;最后通过跟随者的舵角、跟随者的速度、领航者的舵角和领航者的速度,实现对水面自主航行器编队航行进行控制。本发明根据虚拟领航者预计到达位置的坐标,来约束跟随者需要承担队形保持的任务执行,对领航者决策的依赖性较低,跟随者进行编队时的灵活性和适应性较强。并且基于领航者的控制指令较少,执行器的执行能耗大大降低,避免了出现执行器饱和的现象。
-
公开(公告)号:CN116954232A
公开(公告)日:2023-10-27
申请号:CN202311038110.2
申请日:2023-08-16
Applicant: 大连海事大学
IPC: G05D1/02
Abstract: 本发明公开了一种基于强化学习的无人驾驶船舶多船避碰决策方法及系统,涉及船舶自主避障技术领域,该方法包括:建立船舶运动数学模型,并基于所述船舶运动学模型确定当前船舶自身状态向量;构建针对多船会遇局面下的航行决策判定方式;基于RVO算法和VO算法进行碰撞风险评估,确定碰撞风险区域;通过历史数据训练BiGRU网络模型;将所述当前船舶自身状态向量、碰撞风险评估向量、船舶预计碰撞时间以及进行周围环境状态感知的激光雷达线输入至训练好的BiGRU网络模型中,得到当前船舶的舵角。本发明能够解决不同复杂环境下的行为决策问题,防止船舶碰撞所造成的巨大经济损失,具有很高的工程实用性。
-
公开(公告)号:CN116859954A
公开(公告)日:2023-10-10
申请号:CN202311038127.8
申请日:2023-08-16
Applicant: 大连海事大学
IPC: G05D1/02
Abstract: 本发明公开了一种面向多水面自主航行器会遇局面的航行决策方法及系统,涉及水面自主航行器自主避障技术领域,该方法包括:建立水面自主航行器运动模型和水面自主航行器领域模型;根据所述水面自主航行器运动模型和所述水面自主航行器领域模型确定当前水面自主航行器位置坐标;构建针对多水面自主航行器会遇局面下的航行决策判定方式;通过历史数据训练RG‑ABPPO网络模型;将所述当前水面自主航行器的位置坐标、目标位置坐标以及所述雷达探测矢量线输入至训练好的RG‑ABPPO网络模型中,得到当前水面自主航行器操纵的连续舵角。本发明通过多水面自主航行器对未知环境的感知以及与外界不断交互,可以完成多水面自主航行器航行决策任务以及复杂水域中的避障任务。
-
公开(公告)号:CN118778646A
公开(公告)日:2024-10-15
申请号:CN202410801759.3
申请日:2024-06-20
Applicant: 大连海事大学
Abstract: 本发明公开了一种基于SAC‑PID的无人艇航迹控制方法,通过对SAC算法的状态空间和动作空间进行定义,获取水面自主航行器的PID航迹控制器的参数集合;同时建立了SAC算法的奖励函数,以根据SAC算法的状态空间,基于SAC算法对水面自主航行器的PID航迹控制器的参数进行调整;进而通过PID航迹控制器获取船舶的速度与舵角,实现对无人艇的航迹控制。本发明利用SAC算法实现对PID控制器参数的自适应整定,最终实现USV航迹控制,不容易陷入局部最优,具备较强的自主学习能力。解决了传统的PID参数整定方法依赖人工经验整定,且整定之后很难改变的问题,时间成本与人力成本均显著降低,且实时性强。
-
公开(公告)号:CN118672259A
公开(公告)日:2024-09-20
申请号:CN202410690384.8
申请日:2024-05-30
Applicant: 大连海事大学
IPC: G05D1/43 , G05D109/30
Abstract: 本发明公开了一种基于改进SAC算法的无人船自主避碰决策方法及系统,根据最小雷达线探测长度与船舶安全半径、动界半径、船舶领域半径之间的关系,建立SAC算法的奖励函数,以获取总的奖励函数值,同时建立SAC算法的动作空间;进而根据本船当前时刻的位置坐标、航速及航向角,根据所述船舶运动数学模型、船舶动界模型、船舶领域模型,获取无人船下一时刻的舵角和航速,以对无人船进行控制,实现无人船的自主避碰。本发明将航行阶段划分为导航阶段、避碰阶段和紧迫危险阶段,所建立的基于各阶段的奖励函数,能够基于COLREGs第二章第13至17条实现两船与多船会遇局面下的无人船自主避障决策;而在紧迫危险阶段,基于本发明的动作空间,能够通过减速停船有效地处理真实海域复杂局面,解决复杂海域中的紧迫危险避障问题,提高紧迫危险局面下避碰的灵活性和泛化性。
-
-
-
-
-