-
公开(公告)号:CN111897224A
公开(公告)日:2020-11-06
申请号:CN202010811359.2
申请日:2020-08-13
Applicant: 福州大学
IPC: G05B13/04
Abstract: 本发明提出一种基于演员-评论家强化学习和模糊逻辑的多智能体编队控制方法,将最优控制方法引入多机器人系统领航跟随者编队控制方法中,利用模糊逻辑系统逼近连续函数的能力,解决最优控制中汉密尔顿-雅可比-贝尔曼方程难以求取解析解的问题;同时,结合演员-评论家强化学习算法,形成演员模糊逻辑系统模块和评论家模糊逻辑系统模块,前者执行控制行为,后者对前者所选择的行为进行评价并将评价信息反馈给前者。该方法可以平衡控制性能和资源损耗,并且以在线学习的方式提高多机器人系统对于环境的适应性。
-
公开(公告)号:CN111882184A
公开(公告)日:2020-11-03
申请号:CN202010677791.7
申请日:2020-07-14
Applicant: 福州大学
Abstract: 本发明涉及一种多智能体系统零空间行为控制动态任务优先级规划方法,首先,通过零空间投影的方法,建立复合任务;其次,将动态任务优先级规划问题转化为一个切换模式最优控制问题;最后应用混合整数优化方法,求解该最优控制问题得到最优复合任务轨迹。此方法解决多智能体系统零空间行为控制动态任务优先级规划问题,该方法不需要人为的设定任务优先级的切换条件,从而减少了研究人员的工作量,并具有良好的可扩展性,能被应用于传统逻辑法难以处理的大数量任务优先级动态规划中。此外,该方法在任务优先级切换的过程中考虑了对智能体未来状态的预测信息,使得其相较于传统的逻辑方法具有更加理想的切换效果。
-
公开(公告)号:CN116841297A
公开(公告)日:2023-10-03
申请号:CN202310803274.3
申请日:2023-07-03
Applicant: 福州大学
Abstract: 本发明涉及一种面向仓储机器人系统的行为优先级智能调整方法。首先,为多机器人系统设计一些基本行为,并利用零空间投影方法将基本行为以不同的优先级顺序组合成为复合行为;其次,结合强化学习算法和零空间行为控制方法,将复合行为的速度输出作为强化学习的动作集合,构建强化学习任务监管RLMS;最后,对经验池和神经网络的结构分别进行了优化。本方法不需要人为地设定任务优先级的调整条件,从而减少了研究人员的工作量,并具有良好的可扩展性,能被应用于传统逻辑法难以处理的大数量任务优先级动态调整中。同时,由于本方法是离线学习完成后进行使用,不需要在线地进行计算和存储大量数据,在一定程度上减少了硬件的在线计算及存储的压力。
-
公开(公告)号:CN116245286A
公开(公告)日:2023-06-09
申请号:CN202310255761.0
申请日:2023-03-16
Applicant: 福州大学
IPC: G06Q10/063 , G06Q10/04 , G06F30/27 , G06F111/04
Abstract: 本发明提供了面向多非完整约束移动机器人系统的智能任务监管方法,包括以下步骤:步骤S1,在零空间行为控制方法的行为设计框架内,引入非完整约束,推导具有非完整约束零空间行为控制的行为设计范式NSBC‑NCs,并在该范式的基础上完成多非完整约束移动机器人系统的基本行为设计,同时通过零空间投影技术,将所设计的基本行为以不同的优先级顺序组合成为多非完整约束移动机器人的复合行为;通过学习最优的联合行为优先级策略,从而在实际使用中指导多非完整约束移动机器人系统进行行为优先级的切换,进而提升它们任务执行过程的动态性能。
-
公开(公告)号:CN116068900A
公开(公告)日:2023-05-05
申请号:CN202310255701.9
申请日:2023-03-16
Applicant: 福州大学
IPC: G05B13/04
Abstract: 本发明提供了面向多非完整约束移动机器人的强化学习行为控制方法,基于非完整约束矩阵建立多非完整约束移动机器人的运动学模型,基于欧拉拉格朗日方程建立多非完整约束移动机器人的动力学模型,并根据所建立的运动学模型构建基本行为,同时通过零空间投影技术,将所设计的基本行为以不同的优先级顺序组合成为复合行为;应用本技术方案不仅可避免在任务执行阶段使用集中式单元,而且提升了行为优先级切换的动态性和智能性。
-
公开(公告)号:CN111882184B
公开(公告)日:2022-10-14
申请号:CN202010677791.7
申请日:2020-07-14
Applicant: 福州大学
Abstract: 本发明涉及一种多智能体系统零空间行为控制动态任务优先级规划方法,首先,通过零空间投影的方法,建立复合任务;其次,将动态任务优先级规划问题转化为一个切换模式最优控制问题;最后应用混合整数优化方法,求解该最优控制问题得到最优复合任务轨迹。此方法解决多智能体系统零空间行为控制动态任务优先级规划问题,该方法不需要人为的设定任务优先级的切换条件,从而减少了研究人员的工作量,并具有良好的可扩展性,能被应用于传统逻辑法难以处理的大数量任务优先级动态规划中。此外,该方法在任务优先级切换的过程中考虑了对智能体未来状态的预测信息,使得其相较于传统的逻辑方法具有更加理想的切换效果。
-
公开(公告)号:CN111950525B
公开(公告)日:2022-09-16
申请号:CN202010894444.X
申请日:2020-08-31
Applicant: 福州大学
IPC: G06V40/18 , G06V10/774 , G06V10/82 , G06N3/08 , G06N3/04
Abstract: 本发明涉及一种基于破坏重建学习与GoogLeNet的Inception v4网络结构的细粒度图像分类方法,包括步骤:构建训练集,并对其中的图像进行预处理;对训练集中的每幅原始图像,将其划分为n*n个局部区域,再通过RCM处理得到对应原始图像的重组图像;分别构建由分类网络、判别网络以及区域对齐网络构成的重建破坏学习网络,并分别定义与分类网络、判别网络以及区域对齐网络对应的分类损失、对抗性损失以及区域对齐损失;以三个损失之和最小化为目标训练重建破坏学习网络;利用训练好的重建破坏学习网络中的分类网络对输入的图像进行分类。本发明在对细粒度图像的分类上取得了显著的效果。
-
公开(公告)号:CN111897224B
公开(公告)日:2022-04-01
申请号:CN202010811359.2
申请日:2020-08-13
Applicant: 福州大学
IPC: G05B13/04
Abstract: 本发明提出一种基于演员‑评论家强化学习和模糊逻辑的多智能体编队控制方法,将最优控制方法引入多机器人系统领航跟随者编队控制方法中,利用模糊逻辑系统逼近连续函数的能力,解决最优控制中汉密尔顿‑雅可比‑贝尔曼方程难以求取解析解的问题;同时,结合演员‑评论家强化学习算法,形成演员模糊逻辑系统模块和评论家模糊逻辑系统模块,前者执行控制行为,后者对前者所选择的行为进行评价并将评价信息反馈给前者。该方法可以平衡控制性能和资源损耗,并且以在线学习的方式提高多机器人系统对于环境的适应性。
-
公开(公告)号:CN111950525A
公开(公告)日:2020-11-17
申请号:CN202010894444.X
申请日:2020-08-31
Applicant: 福州大学
Abstract: 本发明涉及一种基于破坏重建学习与GoogLeNet的Inception v4网络结构的细粒度图像分类方法,包括步骤:构建训练集,并对其中的图像进行预处理;对训练集中的每幅原始图像,将其划分为n*n个局部区域,再通过RCM处理得到对应原始图像的重组图像;分别构建由分类网络、判别网络以及区域对齐网络构成的重建破坏学习网络,并分别定义与分类网络、判别网络以及区域对齐网络对应的分类损失、对抗性损失以及区域对齐损失;以三个损失之和最小化为目标训练重建破坏学习网络;利用训练好的重建破坏学习网络中的分类网络对输入的图像进行分类。本发明在对细粒度图像的分类上取得了显著的效果。
-
-
-
-
-
-
-
-