-
公开(公告)号:CN116330271A
公开(公告)日:2023-06-27
申请号:CN202211477596.5
申请日:2022-11-23
Applicant: 中国长峰机电技术研究设计院
Abstract: 本发明的目的在于提供一种蛇形机器人的控制方法,通过控制单元控制驱动结构实现功能模块的拼接。并通过多个拼接后的功能模块之间的配合实现蛇形机器人的前进、攀爬、蔽障、缠绕等动作。控制单元获取外部环境信息,根据外部环境信息确定活动计划。此外控制单元还接收其他功能模块的行动信息,根据其他功能模块的行动信息的优先级和本功能模块的活动计划的优先级确定执行计划,执行计划是本功能模块实际执行的计划。将本功能模块的行动信息发送给其他功能模块。本模块的行动信息包括活动计划、执行计划和执行计划对应的动作。按照控制指令的要求,在预设时间内转动预设角度。驱动折叠内管伸缩至指定长度,实现单个功能模块的移动、转向。
-
公开(公告)号:CN116151364A
公开(公告)日:2023-05-23
申请号:CN202211693711.2
申请日:2022-12-28
Applicant: 中国长峰机电技术研究设计院
Abstract: 本发明公开了一种具有显式通信机制的多智能体强化学习方法及装置,所述方法包括:在多智能体之间建立显示的通信‑共享机制;通过所述通信‑共享机制获取同队智能体和异队智能体的感知数据、环境信息;利用基于A3C的深度强化学框架、同队智能体和异队智能体的感知数据、环境信息进行策略训练,确定各个智能体的当前模型参数,各个智能体基于当前模型参数进行动作选择。本发明能够较好地融合无线通信技术与强化学习技术的优点,能够较好地对复杂环境下的敌我双方多智能体及环境信息进行感知,利用基于A3C的深度强化学框架进行强化学习训练,有效地降低多智能体博弈对抗学习的难度,为解决未来无人协同对抗问题提供新的有效途径。
-