智能体的控制方法、系统以及自动驾驶设备

    公开(公告)号:CN116300907A

    公开(公告)日:2023-06-23

    申请号:CN202310173122.X

    申请日:2023-02-14

    Abstract: 本申请公开了一种智能体的控制方法、系统、自动驾驶设备。具备包括获取智能体在当前时刻采集得到的,智能体所处运行环境的第一视频数据,并基于智能体的第一视频数据,计算得到智能体在运行环境下的未来行进过程中与其它智能体发生碰撞的碰撞概率。以使后续为智能体选取与碰撞概率相匹配的路线规划策略后,根据路线规划策略,得到智能体在当前时刻执行的决策动作,进而控制智能体执行决策动作。其中,路线规划策略包括利用强化学习模型规划智能体在当前行驶路线下执行决策动作的第一路线规划策略,或,利用免碰撞搜索模型规划智能体在其它行驶路线下执行决策动作的第二路线规划策略。

    基于内部逻辑归纳的机器人决策策略训练方法及系统

    公开(公告)号:CN117075470A

    公开(公告)日:2023-11-17

    申请号:CN202310976077.1

    申请日:2023-08-04

    Applicant: 南京大学

    Abstract: 本发明公开一种基于内部逻辑归纳的机器人决策策略训练方法及系统,在像素‑符号混合形式输入的机器人决策环境下,该方法针对不同输入形式的特点,将深度强化学习算法和规则学习算法整合,分别处理像素输入和符号输入。在机器人决策策略训练过程中,规则学习算法从少量高质量样本中归纳出有价值的命题逻辑知识,然后使用归纳的命题逻辑知识进行奖励工程设计,帮助深度强化学习算法的训练,提高训练方法的样本数据利用效率。

    基于队友感知的多智能体协作通信策略的训练系统和方法

    公开(公告)号:CN114757092A

    公开(公告)日:2022-07-15

    申请号:CN202210297894.X

    申请日:2022-03-24

    Applicant: 南京大学

    Abstract: 本发明公开了提出一种基于队友感知的多智能体协作通信策略的训练系统和方法,借助于队友建模方法,在与队友交互的过程中,为队友生成定制化、稀疏化的消息。通过多智能体强化学习通信方法,使得智能体能够在带宽受限的条件下学得能够抗干扰的高效协作通信策略,训练得到的智能体协作通信策略可以使智能体既能根据自身得到的观测信息选择合理的协作动作,又能够在合适时刻向队友发送信息以促进协作,或根据收到的队友信息进行配合。本发明在带宽受限的实际场景中仅通过少量节点间的通信实现紧密有效的协作,能够保证多智能体协作通信过程中的抗干扰能力。

Patent Agency Ranking