-
公开(公告)号:CN114800530A
公开(公告)日:2022-07-29
申请号:CN202210647458.0
申请日:2022-06-09
Applicant: 中国科学技术大学
IPC: B25J9/16
Abstract: 本发明公开了一种基于视觉的机器人的控制方法、设备及存储介质,该方法包括:步骤1,通过与机器人通信连接的摄像头按预设时间间隔获取多张包含机器人和环境的图像,将获取的多张图像通过强化学习帧栈堆叠得到用于后续控制的输入图像数据;步骤2,使用训练好的卷积特征编码器对步骤1中得到的输入图像数据进行编码,得到一个50维的向量即为T‑级奖励序列表征数据;步骤3,使用训练好的多层感知决策模型将步骤2中得到的T‑级奖励序列表征数据映射为一个最优动作,使机器人执行该最优动作来对该机器人进行最优控制。该发明能够极大地提升强化学习算法的泛化能力以缓解未知视觉干扰的影响,促进强化学习算法更好地落地应用。
-
公开(公告)号:CN119202735A
公开(公告)日:2024-12-27
申请号:CN202311211283.X
申请日:2023-09-19
Applicant: 华为云计算技术有限公司 , 中国科学技术大学
IPC: G06F18/22 , G06N3/042 , G06N3/0464 , G06N3/0455 , G06N3/047 , G06N3/0475 , G06N3/094
Abstract: 一种数学规划实例生成的方法、系统和电子设备,方法包括:获取至少一个数学规划实例;将至少一个数学规划实例中的第一数学规划实例转化为第一二部图,第一数学规划实例包括第一约束向量、第一变量系数向量和第一关系矩阵;使用概率生成模型,根据第一二部图进行生成得到第二二部图;根据第二二部图按照连接关系填充数据,生成第二数学规划实例,数据包括至少一个数学规划实例中的数据。本申请采用概率生成模型对数学规划问题进行自适应生成与增广,为求解器的调优提供满足数量要求和同分布要求的测试实例集。
-
公开(公告)号:CN114800530B
公开(公告)日:2023-11-28
申请号:CN202210647458.0
申请日:2022-06-09
Applicant: 中国科学技术大学
IPC: B25J9/16
Abstract: 本发明公开了一种基于视觉的机器人的控制方法、设备及存储介质,该方法包括:步骤1,通过与机器人通信连接的摄像头按预设时间间隔获取多张包含机器人和环境的图像,将获取的多张图像通过强化学习帧栈堆叠得到用于后续控制的输入图像数据;步骤2,使用训练好的卷积特征编码器对步骤1中得到的输入图像数据进行编码,得到一个50维的向量即为T‑级奖励序列表征数据;步骤3,使用训练好的多层感知决策模型将步骤2中得到的T‑级奖励序列表征数据映射为一个最优动作,使机器人执行该最优动作来对该机器人进行最优控制。该发明能够极大地提升强化学习算法的泛化能力以缓解未知视觉干扰的影响,促进强化学习算法更好地落地应用。
-
-