Patent search ap:("哈尔滨工程大学") AND inv:"王耀光" Page 1

1.

发明公开
一种基于多智能体分层强化学习的弱观测条件下无人集群协同方法有权

公开(公告)号：CN114355973A

公开(公告)日：2022-04-15

申请号：CN202111623192.8

申请日：2021-12-28

Applicant: 哈尔滨工程大学

Inventor： 刘海波 , 王耀光 , 沈晶 , 史长亭

IPC: G05D1/10

Abstract: 本发明属于无人集群协同技术领域，具体涉及一种基于多智能体分层强化学习的弱观测条件下无人集群协同方法。本发明首先对环境进行状态定义，然后按照POMDP模型对状态空间进行定义，包括观察集合以及观察函数，再随机初始化一个由一系列概率值分布的信念状态，同时根据传统强化学习思想，设置状态转移函数、立即回报函数、折扣率、探索率等；然后采用基于MAXQ算法的分层强化学习框架，将无人集群的任务分层，达到对复杂的任务进行分而治之的目的，降低集群的参数维度，有效缓解计算机存储不足和计算繁琐的压力，提高强化学习效率和精度。本发明能够保证多个智能体参与协同任务时保持更高的效率和更好的协同效果。

2.

发明授权
一种基于多智能体分层强化学习的弱观测条件下无人集群协同方法有权

公开(公告)号：CN114355973B

公开(公告)日：2023-12-08

申请号：CN202111623192.8

申请日：2021-12-28

Applicant: 哈尔滨工程大学

Inventor： 刘海波 , 王耀光 , 沈晶 , 史长亭

IPC: G05D1/10

Abstract: 本发明属于无人集群协同技术领域，具体涉及一种基于多智能体分层强化学习的弱观测条件下无人集群协同方法。本发明首先对环境进行状态定义，然后按照POMDP模型对状态空间进行定义，包括观察集合以及观察函数，再随机初始化一个由一系列概率值分布的信念状态，同时根据传统强化学习思想，设置状态转移函数、立即回报函数、折扣率、探索率等；然后采用基于MAXQ算法的分层强化学习框架，将无人集群的任务分层，达到对复杂的任务进行分而治之的目的，降低集群的参数维度，有效缓解计算机存储不足和计算繁琐的压力，提高强化学习效率和精度。本发明能够保证多个智能体参与协同任务时保持更高的效率和更好的协同效果。

Patent Agency Ranking