Patent search ap:("电子科技大学长三角研究院(衢州)") AND inv:"宋龙杰" Page 1

1.

发明公开
一种基于文本语义的多任务多智能体协同控制方法审中-实审

公开(公告)号：CN118350449A

公开(公告)日：2024-07-16

申请号：CN202410479868.8

申请日：2024-04-22

Applicant: 电子科技大学长三角研究院(衢州)

Inventor： 袁国慧 , 王卓然 , 宋龙杰 , 肖剑 , 郭远波 , 路畅

IPC: G06N3/098 , G06N3/092 , G06N3/045 , G06N5/043 , G06N20/20 , G06N5/025 , G06N5/04 , G06F40/30

Abstract: 本发明涉及信息技术领域，公开了一种基于文本语义的多任务多智能体协同控制方法，解决连续动作空间下多任务多智能体系统中任务间干扰严重和策略共享能力弱的问题，主要方案包括以下步骤：设计适应多任务状态维度变化以及根据文本语义信息区分任务的策略网络模型与评估网络模型；设计用于多任务多智能体协同控制的层级回放池；设计深度强化学习的策略模型更新方法。针对连续动作空间下的多个任务，提出深度强化学习多智能体协同控制方法，并设计了统一不同任务状态输入以及根据任务文本语义信息区分任务模块，提升智能体对任务状态维度变化的适应能力以及对任务的区分能力，设计了用于多任务多智能体的层级回放池，降低任务之间的干扰。

2.

发明公开
一种基于任务分解强化学习的多智能体编队协同控制方法审中-实审

公开(公告)号：CN119847210A

公开(公告)日：2025-04-18

申请号：CN202510024564.7

申请日：2025-01-07

Applicant: 电子科技大学长三角研究院(衢州)

Inventor： 袁国慧 , 王卓然 , 郭远波 , 宋龙杰 , 路畅 , 曾志宏 , 秦帅 , 卢卓凡

IPC: G05D1/695

Abstract: 本发明涉及信息技术领域，公开了一种基于任务分解强化学习的多智能体编队协同控制方法，该方法旨在解决现有多智能体编队协同控制中任务权重分配效率低下和算法泛化能力弱的问题。方案包括建立多智能体运动模型及避障模型；设计状态、动作空间及回报函数；构建策略网络和基于任务分解的评估函数；设计深度强化学习的策略模型更新方法；设计多任务动态权重更新方法。针对复杂环境，通过多智能体编队协同控制方法，借助任务规划将任务分解为多个并行子任务，降低任务间耦合，从而降低任务间的干扰，并利用动态权重实现不同环境下最优的任务权重分配，提升智能体对不同环境的适应能力。适用于如无人机编队控制、机器人协作等。

Patent Agency Ranking