基于无模型回归强化学习的机器人系统控制方法及装置

    公开(公告)号:CN119225189A

    公开(公告)日:2024-12-31

    申请号:CN202411774178.1

    申请日:2024-12-05

    Abstract: 本发明涉及无模型回归强化学习技术领域,特别涉及基于无模型回归强化学习的机器人系统控制方法及装置。方法包括:对机器人非线性系统进行系统变换,寻找可容许控制作为输入数据,收集系统信息,包括不同时刻的状态信息、执行‑评判网络的基函数值等;利用收集的信息计算关键列向量和性能指标函数。利用迭代回归信息推导出辅助回归常数权值和整合执行‑评判网络的常数权值的迭代规则,基于最优执行‑评判网络值对机器人系统进行最优控制,使机器人系统进行物体抓取。本发明通过对机器人系统信号的采集,不断迭代带折扣参数的神经网络权值,得到最优权值向量,获得最优决策控制方法,获得机器人系统最优控制决策,通过机器人系统对物体进行抓取。

    基于无模型回归强化学习的机器人系统控制方法及装置

    公开(公告)号:CN119225189B

    公开(公告)日:2025-03-07

    申请号:CN202411774178.1

    申请日:2024-12-05

    Abstract: 本发明涉及无模型回归强化学习技术领域,特别涉及基于无模型回归强化学习的机器人系统控制方法及装置。方法包括:对机器人非线性系统进行系统变换,寻找可容许控制作为输入数据,收集系统信息,包括不同时刻的状态信息、执行‑评判网络的基函数值等;利用收集的信息计算关键列向量和性能指标函数。利用迭代回归信息推导出辅助回归常数权值和整合执行‑评判网络的常数权值的迭代规则,基于最优执行‑评判网络值对机器人系统进行最优控制,使机器人系统进行物体抓取。本发明通过对机器人系统信号的采集,不断迭代带折扣参数的神经网络权值,得到最优权值向量,获得最优决策控制方法,获得机器人系统最优控制决策,通过机器人系统对物体进行抓取。

    一种基于触听融合的智能盲人象棋实现方法及装置

    公开(公告)号:CN119455366A

    公开(公告)日:2025-02-18

    申请号:CN202411610771.2

    申请日:2024-11-12

    Abstract: 本发明提供一种基于触听融合的智能盲人象棋实现方法及装置,涉及智能辅助设备技术领域。该方法包括:通过设置于棋盘内部的霍尔效应传感器获取输出电压,根据输出电压得到棋盘上的棋子类型以及棋盘上的棋子位置;通过设置于触摸感知小板内部的电阻式触摸板电路获取手指压力,根据手指压力、棋盘上的棋子类型以及棋盘上的棋子位置得到手指对应的棋子类型以及手指对应的棋子位置;通过设置于棋盘内部的语音提示模块,将输出电压转化为语音信号进行输出;通过设置于棋盘内部的智能裁判功能模块,根据输出电压判断棋子移动的合法性。涉及一种为盲人设计的象棋游戏设备,结合触摸感知、语音提示和智能裁判功能,旨在提升盲人参与象棋活动的体验。

    异构多无人机数据协作近似动态规划最优一致方法及装置

    公开(公告)号:CN119228329B

    公开(公告)日:2025-03-07

    申请号:CN202411727160.6

    申请日:2024-11-28

    Abstract: 本发明提供一种异构多无人机数据协作近似动态规划最优一致方法及装置,涉及多智能体控制技术领域。该方法包括:获取异构多无人机系统的状态数据,构建带有补偿信号的识别器,逼近异构多无人机系统的动态模型信息,构建带有动态信号的补偿器,获得带补偿器识别神经网络的权值更新规则;根据权值更新规则,构建哈密尔顿函数;根据哈密尔顿函数,构建带有协作信号的累积平方误差;采用梯度下降法,获得累积执行‑协作评判神经网络的权值更新规则,计算相邻两次迭代常数权值;根据相邻两次迭代常数权值的误差,判断是否满足预设的阈值条件;若满足,停止迭代,输出异构多无人机系统最优一致的解。采用本发明可提高算法扩展性,降低算法复杂度。

    异构多无人机数据协作近似动态规划最优一致方法及装置

    公开(公告)号:CN119228329A

    公开(公告)日:2024-12-31

    申请号:CN202411727160.6

    申请日:2024-11-28

    Abstract: 本发明提供一种异构多无人机数据协作近似动态规划最优一致方法及装置,涉及多智能体控制技术领域。该方法包括:获取异构多无人机系统的状态数据,构建带有补偿信号的识别器,逼近异构多无人机系统的动态模型信息,构建带有动态信号的补偿器,获得带补偿器识别神经网络的权值更新规则;根据权值更新规则,构建哈密尔顿函数;根据哈密尔顿函数,构建带有协作信号的累积平方误差;采用梯度下降法,获得累积执行‑协作评判神经网络的权值更新规则,计算相邻两次迭代常数权值;根据相邻两次迭代常数权值的误差,判断是否满足预设的阈值条件;若满足,停止迭代,输出异构多无人机系统最优一致的解。采用本发明可提高算法扩展性,降低算法复杂度。

    一种融合激光雷达与深度相机的桥梁模型生成方法及装置

    公开(公告)号:CN115984486B

    公开(公告)日:2023-05-26

    申请号:CN202310194356.2

    申请日:2023-03-03

    Abstract: 本发明涉及土木工程计算机视觉技术领域,特别是指一种融合激光雷达与深度相机的桥梁模型生成方法及装置,一种融合激光雷达与深度相机的桥梁模型生成方法包括:激光雷达和深度相机进行联合标定,获得联合标定参数;将合成点云数据和真实点云数据输入预设的半自动标注算法,获得桥梁语义数据集;根据预设的桥梁数据集、桥梁语义数据集和预设的二维深度学习算法,获得桥梁三维语义模型;根据联合标定参数和所述桥梁三维语义模型,获得重建后桥梁三维语义模型;根据重建后桥梁三维语义模型,通过预设的二次开发程序进行编译,获得桥梁信息模型。本发明是一种精度高、语义信息丰富的桥梁三维信息模型的构建方法。

    一种计算食物营养成分的方法、装置、设备以及存储介质

    公开(公告)号:CN115273073A

    公开(公告)日:2022-11-01

    申请号:CN202210711426.2

    申请日:2022-06-22

    Inventor: 宋睿卓 陈文泽

    Abstract: 本发明提供了一种计算食物营养成分的方法,该方法包括:基于食物特征,从获取到的目标图片中,确定出目标食物所属的食物种类以及个数;基于用于表征数字的数字信息,从所述目标图片中确定出食物的总重量;根据所述食物种类、所述个数以及所述总重量,确定每种食物的分重量;根据所述分重量以及与食物重量与营养成分的对应关系表,确定所述目标图片中每种食物的营养成分。可见通过该方法可以识别出图片中食物的营养含量。

    一种分布式综合能源数据管理及应用方法与系统

    公开(公告)号:CN119940688A

    公开(公告)日:2025-05-06

    申请号:CN202411762976.2

    申请日:2024-12-03

    Abstract: 本发明公开了一种分布式综合能源数据管理及应用方法与系统,属于数据及能源管理技术领域,所述方法包括:获取分布式综合能源数据;基于计算节点的计算性能参数和通讯性能参数,将综合能源数据分配至合适的计算节点,并将经计算节点计算处理后的数据存储至分布式数据库;制定针对分布式数据库的搜索最优计划,利用该计划从分布式数据库中获取所需数据;基于获取的所需数据,构建成本最小化的负荷控制模型,并基于该模型,获取目标区域内成本最小的综合能源管理方案。本发明可降低电力系统的运行成本,并提高数据的利用效率。

Patent Agency Ranking