Patent search ap:("杭州海康威视数字技术股份有限公司" OR "南京大学") AND inv:"张福翔" Page 1

1.

发明公开
智能体的控制方法、系统以及自动驾驶设备审中-实审

公开(公告)号：CN116300907A

公开(公告)日：2023-06-23

申请号：CN202310173122.X

申请日：2023-02-14

Applicant: 杭州海康威视数字技术股份有限公司 , 南京大学

Inventor： 王铖鹤 , 陈烽 , 张福翔 , 丁豪 , 钟巧勇 , 谢迪 , 浦世亮 , 章宗长

IPC: G05D1/02

Abstract: 本申请公开了一种智能体的控制方法、系统、自动驾驶设备。具备包括获取智能体在当前时刻采集得到的，智能体所处运行环境的第一视频数据，并基于智能体的第一视频数据，计算得到智能体在运行环境下的未来行进过程中与其它智能体发生碰撞的碰撞概率。以使后续为智能体选取与碰撞概率相匹配的路线规划策略后，根据路线规划策略，得到智能体在当前时刻执行的决策动作，进而控制智能体执行决策动作。其中，路线规划策略包括利用强化学习模型规划智能体在当前行驶路线下执行决策动作的第一路线规划策略，或，利用免碰撞搜索模型规划智能体在其它行驶路线下执行决策动作的第二路线规划策略。

2.

发明公开
基于任务表征和队友感知的多智能体协作方法和装置审中-实审

公开(公告)号：CN114970826A

公开(公告)日：2022-08-30

申请号：CN202210624473.3

申请日：2022-06-02

Applicant: 南京大学

Inventor： 章宗长 , 俞扬 , 周志华 , 王铖鹤 , 袁雷 , 张福翔 , 秦熔均

IPC: G06N3/04 , G06N3/08 , G06N20/00 , B25J9/16

Abstract: 本发明公开一种基于任务表征和队友感知的多智能体协作方法和装置，通过学习任务表征和队友感知，智能体能够在无通信的条件下学得高效协作策略，训练得到的智能体策略部署到多智能体系统中后，能够让智能体在与环境不断交互的过程中，根据自身的观测信息对任务有更好的感知与认识，然后结合观测中的队友的信息，与队友进行高效地配合与合作。

3.

发明公开
基于内部逻辑归纳的机器人决策策略训练方法及系统审中-实审

公开(公告)号：CN117075470A

公开(公告)日：2023-11-17

申请号：CN202310976077.1

申请日：2023-08-04

Applicant: 南京大学

Inventor： 章宗长 , 俞扬 , 周志华 , 徐嘉诚 , 陈超 , 张福翔 , 袁雷

IPC: G05B13/04 , G06N3/092

Abstract: 本发明公开一种基于内部逻辑归纳的机器人决策策略训练方法及系统，在像素‑符号混合形式输入的机器人决策环境下，该方法针对不同输入形式的特点，将深度强化学习算法和规则学习算法整合，分别处理像素输入和符号输入。在机器人决策策略训练过程中，规则学习算法从少量高质量样本中归纳出有价值的命题逻辑知识，然后使用归纳的命题逻辑知识进行奖励工程设计，帮助深度强化学习算法的训练，提高训练方法的样本数据利用效率。

4.

发明公开
基于队友感知的多智能体协作通信策略的训练系统和方法审中-实审

公开(公告)号：CN114757092A

公开(公告)日：2022-07-15

申请号：CN202210297894.X

申请日：2022-03-24

Applicant: 南京大学

Inventor： 章宗长 , 俞扬 , 周志华 , 张福翔 , 袁雷 , 王铖鹤 , 秦熔均

IPC: G06F30/27

Abstract: 本发明公开了提出一种基于队友感知的多智能体协作通信策略的训练系统和方法，借助于队友建模方法，在与队友交互的过程中，为队友生成定制化、稀疏化的消息。通过多智能体强化学习通信方法，使得智能体能够在带宽受限的条件下学得能够抗干扰的高效协作通信策略，训练得到的智能体协作通信策略可以使智能体既能根据自身得到的观测信息选择合理的协作动作，又能够在合适时刻向队友发送信息以促进协作，或根据收到的队友信息进行配合。本发明在带宽受限的实际场景中仅通过少量节点间的通信实现紧密有效的协作，能够保证多智能体协作通信过程中的抗干扰能力。

Patent Agency Ranking