一种导航模型的训练方法及导航方法

    公开(公告)号:CN119692423A

    公开(公告)日:2025-03-25

    申请号:CN202411812191.1

    申请日:2024-12-10

    Abstract: 本申请提出一种导航模型的训练方法及导航方法。一种导航模型的训练方法包括:获取第一高精度全局地图、初始深度学习模型;获取第一机器人当前时刻的状态数据和雷达数据;根据状态数据以及第一高精度全局地图,计算目标奖励值;根据状态数据、雷达数据以及第一高精度全局地图,确定第一输入数据集以及第二输入数据集;利用初始深度学习模型处理第一输入数据集以及第二输入数据集,得到目标损失函数;利用目标损失函数、目标奖励值调整初始深度学习模型的权重,得到第一深度学习模型;第一深度学习模型包括第一Actor网络、第一Critic网络;更新当前训练次数;检测当前训练次数是否大于训练次数阈值;在确定大于的情况下,将第一Actor网络作为导航模型。

    机器人转身及下蹲稳定站立控制方法、装置及相关设备

    公开(公告)号:CN117301061A

    公开(公告)日:2023-12-29

    申请号:CN202311357479.X

    申请日:2023-10-19

    Inventor: 倪婧菲 刘迪源

    Abstract: 本申请公开了一种机器人转身及下蹲稳定站立控制方法、装置、设备及存储介质,获取目标人形机器人的本体感知信息,包括执行转身任务时的目标转动角度,执行下蹲任务时的目标骨盆高度;将本体感知信息输入给策略网络得到输出的动作,策略网络在仿真器中采用强化学习训练,奖励函数包括鼓励机器人下蹲到指定骨盆高度的第一函数、鼓励机器人下蹲过程骨盆在z轴方向的运动速度贴近期望下蹲速度的第二函数、鼓励机器人转身到指定角度的第三函数;通过控制器将输出动作转换为关节扭矩以控制机器人动作。通过仿真训练避免了对机器人硬件设备的损耗。采用强化学习训练,能够得到性能更优的策略网络,实现机器人转身及下蹲过程的稳定站立控制。

    任务执行方法、装置及机器人
    3.
    发明公开

    公开(公告)号:CN119589677A

    公开(公告)日:2025-03-11

    申请号:CN202411852011.2

    申请日:2024-12-16

    Inventor: 袁恒 刘迪源 潘嘉

    Abstract: 本发明提供一种任务执行方法、装置及机器人,所述方法包括:基于待执行任务对应的环境图像,识别环境中的物品信息;基于用于描述待执行任务的执行指令以及物品信息,将待执行任务分解为多个子任务,各子任务包括执行对象以及执行对象的执行动作;识别各执行对象的位姿,并基于各执行对象的位姿以及执行动作,执行对应子任务。本发明提供的任务执行方法、装置及机器人,不依赖于预定义指令集,从而能够处理更复杂、更灵活的执行指令,适应复杂多变的应用场景。此外,本发明在面对长文本执行指令时,也能够准确理解任务需求。

    一种双足机器人步态控制方法、装置、存储介质及设备

    公开(公告)号:CN117572877B

    公开(公告)日:2024-05-31

    申请号:CN202410061297.6

    申请日:2024-01-16

    Abstract: 本申请公开了一种双足机器人步态控制方法、装置、存储介质及设备,该方法包括:首先获取目标双足机器人的本体信息;并响应于目标用户对目标双足机器人的触发操作,生成用户输入的任务标签和速度指令,然后将本体信息、任务标签和速度指令输入至预先构建的步态控制模型,预测得到目标双足机器人的步态动作轨迹;接着利用该步态动作轨迹,对目标双足机器人进行步态运动控制,以实现其各种步态间的平稳切换。由于本申请是先利用双足机器人的仿真本体信息,通过深度强化学习和模仿学习联合训练的方式训练得到了步态控制模型,从而保证了该步态控制模型能够实现对多样步态动作轨迹的控制生成,进而能够用以控制目标双足机器人各种步态间的平稳切换。

    策略网络训练方法及人形双足机器人步态控制方法

    公开(公告)号:CN117555339B

    公开(公告)日:2024-04-26

    申请号:CN202410040335.X

    申请日:2024-01-11

    Abstract: 本发明涉及机器人自动化技术领域,提供一种策略网络训练方法及人形双足机器人步态控制方法,该训练方法采用深度强化学习方法得到目标策略网络,无需构建复杂的步态库,不需要增加额外的数据收集成本和计算代价,在不借助任何步态先验知识引导的情况下,通过引入包含有周期步态奖励、膝关节位置跟踪奖励和上肢关节位置跟踪奖励中的至少一个的步态奖励,可以使目标策略网络具有控制人形双足机器人实现自然、平稳、对称、协调的行走步态的功能,提升了目标策略网络的鲁棒性和抗干扰性。

    策略网络训练方法及人形双足机器人步态控制方法

    公开(公告)号:CN117555339A

    公开(公告)日:2024-02-13

    申请号:CN202410040335.X

    申请日:2024-01-11

    Abstract: 本发明涉及机器人自动化技术领域,提供一种策略网络训练方法及人形双足机器人步态控制方法,该训练方法采用深度强化学习方法得到目标策略网络,无需构建复杂的步态库,不需要增加额外的数据收集成本和计算代价,在不借助任何步态先验知识引导的情况下,通过引入包含有周期步态奖励、膝关节位置跟踪奖励和上肢关节位置跟踪奖励中的至少一个的步态奖励,可以使目标策略网络具有控制人形双足机器人实现自然、平稳、对称、协调的行走步态的功能,提升了目标策略网络的鲁棒性和抗干扰性。

    语音处理方法、装置、设备及存储介质

    公开(公告)号:CN111326143B

    公开(公告)日:2022-09-06

    申请号:CN202010129113.7

    申请日:2020-02-28

    Abstract: 本申请实施例公开了一种语音处理方法、装置、设备及存储介质,在获取目标语音信号和与目标语音信号同步采集的至少一个目标图像序列后,基于目标语音信号的频谱图,目标语音信号的声学特征,以及至少一个目标图像序列获得目标语音信号与至少一个目标唇部图像序列的第一融合特征,利用该第一融合特征从目标语音信号的频谱图中分离出与各个目标图像序列对应的子语音信号的频谱图,实现了语音分离。其中,唇动相关区域的图像序列的数量明确了语音分离的目标数量,声学特征和唇动相关区域的图像序列中携带的唇动信息保证分离出的频谱图不会失真,从而提高多人场景下语音分离的准确性,基于分离出的语音信号的语音识别效果也就相应的提高。

    命令识别方法、装置、电子设备及存储介质

    公开(公告)号:CN114267344A

    公开(公告)日:2022-04-01

    申请号:CN202111656064.3

    申请日:2021-12-30

    Abstract: 本发明提供一种命令识别方法、装置、电子设备及存储介质,其中方法包括:确定待识别语音;基于命令识别模型,对待识别语音进行命令识别,得到命令识别结果;命令识别模型包括语音解码分支和意图识别分支,语音解码分支用于对待识别语音的语音特征进行语音解码,意图识别分支用于对语音特征进行意图识别,命令识别结果基于语音解码分支所得的语音解码结果和/或意图识别分支得到的意图识别结果确定。本发明提供的方法和装置,能够通过包含有语音解码分支和意图识别分支的命令识别模型对待识别语音进行命令识别,实现了固定命令词和控制意图自由说两种命令识别方式进行语音控制,在不降低固定命令识别率的情况下,提高了用户的体验度。

    语音处理方法、装置、设备及存储介质

    公开(公告)号:CN111326143A

    公开(公告)日:2020-06-23

    申请号:CN202010129113.7

    申请日:2020-02-28

    Abstract: 本申请实施例公开了一种语音处理方法、装置、设备及存储介质,在获取目标语音信号和与目标语音信号同步采集的至少一个目标图像序列后,基于目标语音信号的频谱图,目标语音信号的声学特征,以及至少一个目标图像序列获得目标语音信号与至少一个目标唇部图像序列的第一融合特征,利用该第一融合特征从目标语音信号的频谱图中分离出与各个目标图像序列对应的子语音信号的频谱图,实现了语音分离。其中,唇动相关区域的图像序列的数量明确了语音分离的目标数量,声学特征和唇动相关区域的图像序列中携带的唇动信息保证分离出的频谱图不会失真,从而提高多人场景下语音分离的准确性,基于分离出的语音信号的语音识别效果也就相应的提高。

Patent Agency Ranking