一种基于视觉的机器人的控制方法、系统、设备及介质

    公开(公告)号:CN119871422A

    公开(公告)日:2025-04-25

    申请号:CN202510173349.3

    申请日:2025-02-17

    Abstract: 本发明公开一种基于视觉的机器人的控制方法、系统、设备及介质,属机器人控制领域,方法包括:步骤1,用与机器人通信的摄像头按预设时间间隔获取包含机器人和环境的三张图像,将三张图像用强化学习帧栈堆叠得到输入图像数据;步骤2,用训练好的卷积特征编码器对输入图像数据编码得出输出表征数据;步骤3,将输出表征数据输入到基于额外奖励训练好的多层感知决策模型映射为一个最优动作,使机器人执行该最优动作来进行最优控制。本发明采用基于外奖励训练好的多层感知决策模型,能从长期累积奖励中编码任务相关信息,使用信息瓶颈约束来去除任务无关的特征,进而增强机器人的视觉泛化能力,提升基于视觉控制的机器人的控制准确性。

    一种基于励磁线圈的粒子束处理装置

    公开(公告)号:CN118765027A

    公开(公告)日:2024-10-11

    申请号:CN202410890637.6

    申请日:2024-07-03

    Abstract: 本公开提供了一种基于励磁线圈的粒子束处理装置,可以应用于粒子加速器领域及带电粒子束流输运领域。该基于励磁线圈的粒子束处理装置,包括:外壳,设置有磁铁容纳腔,磁铁容纳腔中设置有N极磁铁,N极磁铁用于产生基础磁场,其中,N为大于或等于2的偶数;励磁线圈,套设在磁铁容纳腔外侧,用于在励磁线圈所产生的可调磁场发生改变的情况下,通过可调磁场的改变状况,调整由基础磁场和可调磁场形成的叠加磁场的磁场强度;磁铁容纳腔与粒子束处理装置的中心区域之间设置有磁极头,磁极头用于引导叠加磁场的磁场方向,以便对射入粒子束处理装置的粒子束进行调整,得到调整后的粒子束。

    用于降低对抗迁移性的模型训练方法、装置及介质

    公开(公告)号:CN118691889A

    公开(公告)日:2024-09-24

    申请号:CN202410817066.3

    申请日:2024-06-24

    Inventor: 徐孟珺 刘磊 李斌

    Abstract: 本发明公开了一种用于降低对抗迁移性的模型训练方法、装置及介质,包括获取训练集,每张图片的遗忘次数初始化为0;在训练集中的每个样本添加对抗扰动,生成对抗样本集;对训练集中每个样本,分别计算代理模型和第一目标模型的交叉熵损失值,利用梯度下降算法更新代理模型和目标模型的参数;对对抗样本集中每个对抗样本,计算更新后的代理模型和第一目标模型的余弦相似度,利用梯度下降算法更新第一目标模型的参数;重复该过程,在每一次训练周期中,记录曾经被正确分类的样本是否被错误分类,若是,遗忘次数加一,否则遗忘次数不变;删除遗忘次数为零的样本,剩余样本及其对应的对抗样本用于训练第二目标模型。本发明大幅度减少模型训练时间。

    一种提升视觉观测机器人控制稳定性的方法

    公开(公告)号:CN115816466B

    公开(公告)日:2023-06-16

    申请号:CN202310051575.5

    申请日:2023-02-02

    Abstract: 本发明公开一种提升视觉观测机器人控制稳定性的方法,属机器人控制领域。方法包括:步骤1,用基于行为聚类的图像输入强化学习方式对控制视觉观测机器人的深度神经网络模型训练;步骤2,用训练好的深度神经网络模型对视觉观测机器人进行控制。本发明的方法相较于现有控制机器人的视觉强化学习方法,具有以下优点:性能鲁棒,可直接在多种干扰同时存在的环境下实现高效的表征学习,样本效率受到无关干扰的影响小。由于训练深度神经网络模型的基于行为聚类的图像输入强化学习方式引入了行为相似度量进行表征学习,不需要额外先验知识。计算高效,能在批次较小情况下稳定训练,大大减小显存占用和训练时间,提升训练效率和控制机器人稳定性。

    一种提升视觉观测机器人控制稳定性的方法

    公开(公告)号:CN115816466A

    公开(公告)日:2023-03-21

    申请号:CN202310051575.5

    申请日:2023-02-02

    Abstract: 本发明公开一种提升视觉观测机器人控制稳定性的方法,属机器人控制领域。方法包括:步骤1,用基于行为聚类的图像输入强化学习方式对控制视觉观测机器人的深度神经网络模型训练;步骤2,用训练好的深度神经网络模型对视觉观测机器人进行控制。本发明的方法相较于现有控制机器人的视觉强化学习方法,具有以下优点:性能鲁棒,可直接在多种干扰同时存在的环境下实现高效的表征学习,样本效率受到无关干扰的影响小。由于训练深度神经网络模型的基于行为聚类的图像输入强化学习方式引入了行为相似度量进行表征学习,不需要额外先验知识。计算高效,能在批次较小情况下稳定训练,大大减小显存占用和训练时间,提升训练效率和控制机器人稳定性。

    基于最优资源分配算法的蒙特卡罗树搜索方法

    公开(公告)号:CN108809713A

    公开(公告)日:2018-11-13

    申请号:CN201810593129.6

    申请日:2018-06-08

    Abstract: 本发明公开了一种基于最优资源分配算法的蒙特卡罗树搜索方法,仅对蒙特卡罗树中根节点的子节点的选择策略进行了调整,即采用最优资源分配算法对各子节点所对应的蒙特卡罗子树进行仿真计算资源的分配,而各子节点所对应的蒙特卡罗树的搜索方法,比如树策略等等,均保持不变,这使得本发明的方法可以方便与蒙特卡洛树搜索方法结合,同时,还能提高蒙特卡罗树搜索在计算资源有限情况下的决策性能。本发明的方法适用于所有具体形式的蒙特卡罗树搜索方法,具有广泛的应用范围。

    编解码方法和装置
    8.
    发明授权

    公开(公告)号:CN104093024B

    公开(公告)日:2017-08-04

    申请号:CN201410189600.7

    申请日:2012-01-20

    Abstract: 本发明实施例提供了一种编解码方法和装置。方法包括:提取码流中的第一信息;根据第一信息,确定色度分量帧内预测模式;当根据第一信息不能确定色度分量帧内预测模式时,提取码流中的第二信息;根据第二信息确定色度分量帧内预测模式,其中第一信息包括用于指示色度分量帧内预测模式是否为DM模式或LM模式的信息,第二信息用于指示作为色度分量帧内预测模式的剩余模式,剩余模式为除第一信息可能确定的模式外的可用于色度分量帧内预测模式的其中之一。装置包括第一提取单元、第一确定单元、第二提取单元和第二确定单元。上述技术方案可以将色度模式的编码信息缩减且优化排序,从而减少编解码步骤,由此降低编解码的复杂度,提高解码的效率。

Patent Agency Ranking