-
公开(公告)号:CN118596127A
公开(公告)日:2024-09-06
申请号:CN202410803715.4
申请日:2024-06-20
Applicant: 清华大学
Abstract: 本发明公开了一种绳驱机械臂肘部关节串联结构,包括:多个肘部关节,每个肘部关节包括主动端面板、从动端面板、主动端中心轴、从动端中心轴、主动端驱动轮轴、主动端导向轮轴、从动端驱动轮轴、从动端导向轮轴、多个绕绳轮和驱动绳;连接臂,通过连接臂相连的两个肘部关节的安装方向相反;串联过绳,串联过绳依次经过相邻肘部关节的主动端导向轮轴的绕绳轮、主动端中心轴的绕绳轮、从动端中心轴的绕绳轮和从动端导向轮轴的绕绳轮,串联过绳经过每相邻的两个绕绳轮时分别以不同侧经过这两个绕绳轮。根据本发明实施例的绳驱机械臂肘部关节串联结构具有灵活性好、可控性强、便于实现运动解耦、折展比大等优点。
-
公开(公告)号:CN114489043B
公开(公告)日:2024-02-09
申请号:CN202111602040.X
申请日:2021-12-24
Applicant: 清华大学
Abstract: 本申请涉及多智能体协同规划技术领域,特别涉及一种多智能体路径规划方法、装置、电子设备及存储介质,其中,方法包括:采集多智能体中每个智能体在感知范围内的感知信息;对每个智能体在感知范围内的感知信息进行图像化处理,生成感知图像;基于复合神经网络对感知图像进行特征提取和信息聚合,将感知信息映射为目标动作策略,基于目标动作策略生成每个智能体在多个时刻的预测动作,并根据多个时刻的预测动作生成最优规划路径,控制每个智能体按照最优规划路径进行动作。由此,解决了如何在信息部分可知情况下对多智能体进行协同规划等问题。
-
公开(公告)号:CN113778080B
公开(公告)日:2023-12-01
申请号:CN202110909026.8
申请日:2021-08-09
Applicant: 清华大学
IPC: G05D1/02
Abstract: 本申请属于机器人控制技术领域,具体而言,涉及一种单轨双轮机器人的控制方法、装置、电子设备及存储介质。包括:构建一个用于控制器的控制器神经网络和一个用于训练的评论家网络;采集单轨双轮机器人真实数据信息;所述评论家网络利用所述单轨双轮机器人真实数据信息指导所述控制器神经网络在仿真环境中进行训练,得到训练后的控制器神经网络;将训练后的控制器神经网络写入单轨双轮机器人的视觉导航系统和底层控制系统中,实现对单轨双轮机器人的控制。本申请考使用强化学习的控制方法既可以完成复杂任务的控制,又无需对机器人进行动力学建模。
-
公开(公告)号:CN114690639A
公开(公告)日:2022-07-01
申请号:CN202210338183.2
申请日:2022-04-01
Applicant: 清华大学
IPC: G05B13/04
Abstract: 本申请涉及一种单轨双轮机器人的控制方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取单轨双轮机器人拍摄的目标图像数据和单轨双轮机器人的目标位姿信息;将目标图像数据和目标位姿信息输入预先训练的控制器模型;控制器模型包括视觉子网络和控制子网络;通过视觉子网络,识别目标图像数据,得到导航信息;视觉子网络包括初步特征提取模块、深度特征提取模块和导航模块;根据控制子网络、目标位姿信息和导航信息,得到控制信息;控制信息用于控制单轨双轮机器人的行驶。采用本方法能够满足单轨双轮机器人的在执行复杂任务时的控制需求,使得单轨双轮机器人完成复杂任务。
-
公开(公告)号:CN114629798A
公开(公告)日:2022-06-14
申请号:CN202210102211.0
申请日:2022-01-27
Applicant: 清华大学
Abstract: 本申请涉及多智能体协同规划技术领域,特别涉及一种多智能体协同规划方法、装置、电子设备及存储介质,其中,方法包括:采集中心智能体和对应目标点之间的相对位置;基于相对位置,利用预设的图神经网络对至少一个近邻智能体或中心智能体进行定向采样,获取定向采样结果,其中,图神经网络由CNN、TOKF‑GraphSAGE和MLP复合构建;利用预设的图神经网络由定向采样结果采样聚合为面向任务的多智能体的最佳协同动作。由此,解决了信息部分可知情况下对近邻智能体进行定向采样信息的问题,根据中心智能体和目标点的相对位置,对朝向目标点区域的近邻智能体进行定向采样,提高训练的效率和稳定性。
-
公开(公告)号:CN110917622B
公开(公告)日:2021-11-30
申请号:CN201911142525.8
申请日:2019-11-20
Applicant: 清华大学
Abstract: 本发明公开了一种基于近似动态规划算法的博弈决策方法及系统,其中,该方法包括以下步骤:根据空中格斗游戏的特点,确定多维度特征向量来描述空中格斗过程,并作为近似动态规划算法的特征输入;根据预设的基于空中格斗游戏经验规则的自适应奖励机制,分阶段从进攻能力以及防守和躲避能力两个方面提升博弈算法的性能;利用近似动态规划算法学习出空中格斗游戏的价值函数,在此价值函数下指导我方做出格斗动作。该博弈决策方法将传统的表格形式使用函数来近似,增强了增强学习中的泛化和推广能力,从而在决策策略接近最优的前提下,保证决策的快速性。
-
公开(公告)号:CN111469927B
公开(公告)日:2021-08-17
申请号:CN202010356414.3
申请日:2020-04-29
Applicant: 清华大学
IPC: B62D21/18
Abstract: 本发明公开了一种大载荷可变前倾角单轨双轮机器人分体式结构框架;包括主框架,第一梁体,第二梁体,转向架,驱动件,锁止套,锁紧件,检测件等。第一梁体与主框架通过高强度螺栓刚性连接,第二梁体与主框架通过高强度螺栓刚性连接;转向架与驱动件的输出轴由花键连接,通过驱动件固定于第一梁体,转向架可绕驱动件的轴旋转调整其转向轴心与水平面角度;锁止套与驱动件的输入轴连接,可沿驱动件轴心滑动,锁紧件装入驱动件后可锁止驱动件的输入轴和输出轴的转动;检测件安装于第一梁体,通过驱动件的输出轴转动读取数据;实现单轨双轮机器人前倾角精确调整,通过分体式结构可实现不同功能下快速换装部件使用。
-
公开(公告)号:CN112052947B
公开(公告)日:2021-06-25
申请号:CN202010824196.1
申请日:2020-08-17
Applicant: 清华大学
Abstract: 本发明公开了一种基于策略选项的分层强化学习方法和装置,所述方法包括:构建高层策略网络、低层策略网络和评价网络;从仿真环境,获取状态轨迹;基于状态轨迹和策略在线算法的学习过程,对高层策略网络、低层策略网络和评价网络的参数进行更新;根据更新参数后的高层策略网络、低层策略网络和评价网络,生成更新后的策略模型,并对更新后的策略模型进行测试。本发明实施例的基于策略选项的分层强化学习方法,能够在仿真环境中从零开始学习动作和高层策略,且性能稳定、数据使用效率高。
-
公开(公告)号:CN112101564A
公开(公告)日:2020-12-18
申请号:CN202010824845.8
申请日:2020-08-17
Applicant: 清华大学
Abstract: 本发明公开了一种连续动作控制下基于注意力机制的多智能体值函数分解方法及装置,该方法包括:获取多个智能体决策下的状态轨迹;构建注意力机制网络、各个智能体的主值网络、各个智能体的主策略网络、QMIX主值网络、各个智能体的副值网络、各个智能体的副策略网络、QMIX副值网络;基于状态轨迹和离轨策略算法的多智能体值函数分解学习过程,对Attention注意力机制网络、各个智能体的主值网络、各个智能体的主策略网络、QMIX主值网络、各个智能体的副值网络、各个智能体的副策略网络、QMIX副值网络进行更新;根据更新的多个网络生成更新后的策略模型,对策略模型进行测试。该方法设计出一种在连续控制量的仿真环境中基于注意力机制学习值函数分解的多智能体算法。
-
公开(公告)号:CN112070832A
公开(公告)日:2020-12-11
申请号:CN202010790024.7
申请日:2020-08-07
Applicant: 清华大学
Abstract: 本申请公开了一种基于点云DCA特征的非合作目标位姿跟踪方法及装置,其中,该方法包括:对三维目标点云模型和三维场景点云模型进行特征点检测;提取三维目标点云模型和三维场景点云模型中的点云局部特征描述子;根据FLANN算法对三维目标点云模型的点云局部特征描述子和三维场景点云模型中的点云局部特征描述子进行特征匹配;通过RANSAC算法去除特征匹配结果中的错误匹配,得到三维目标点云模型的初步位姿估计;将初步位姿估计作为迭代最近点算法的初始值,通过迭代最近点算法对位姿估计进行精调。该方法提出一种简洁高效的非合作目标位姿测量方法,可以更好的实现目标航天器相对位姿的测量。
-
-
-
-
-
-
-
-
-