-
公开(公告)号:CN119847199A
公开(公告)日:2025-04-18
申请号:CN202411957434.0
申请日:2024-12-30
Applicant: 哈尔滨工业大学
Abstract: 本发明一种基于混合学习方法的再入飞行器编队控制方法、系统及存储介,涉及再入飞行器控制技术领域,为解决现有的基于强化学习的控制方法难以探索性能边界、控制方法不能确保安全的问题。包括:步骤一:获取单个飞行器的飞行轨迹数据;步骤二:以飞行器作为智能体,建立智能体决策网络,通过监督学习的方式进行训练得到智能体自主控制模型;步骤三:基于深度强化学习理论建立多智能体协同控制网络,将智能体自主控制模型应用到多智能体协同控制网络中,采用包括飞行器单体奖励与群体奖励的耦合奖励机制,对智能体自主控制模型进行协同控制训练,得到多智能体协同控制模型;步骤四:通过多智能体协同控制模型对再入飞行器编队进行协同控制。
-
公开(公告)号:CN113442170B
公开(公告)日:2023-12-01
申请号:CN202110733121.7
申请日:2021-06-28
Applicant: 国网上海市电力公司 , 国网上海能源互联网研究院有限公司 , 哈尔滨工业大学
Abstract: 本发明公开了一种对机械臂路径冗余节点的反向拆分计算的方法及系统,属于机器人运动规划技术领域。本发明方法包括:对机械臂R进行运动规划,确定运动路径,作为动态障碍物,并确定无碰撞运动路径;对机械臂R去除冗余节点,记录运动轨迹中对应的时间,对机无碰撞运动路径去除冗余节点,记录对应的时间;对运动路径做反向拆分操作,确定无碰撞路径;做碰撞检测,确定首次碰撞时间,并确定发生碰撞时刻的关节构型;根据关节构型,确定最优节点轨迹;重复机械臂R及机械臂L运动路径的反向拆分操作,获取机械臂R及机械臂L最优节点轨迹的路径,直到机械臂R及机械臂L优化后的路径不再发生碰撞,确定反向拆分路径。
-
公开(公告)号:CN113276109A
公开(公告)日:2021-08-20
申请号:CN202110430722.0
申请日:2021-04-21
Applicant: 国网上海市电力公司 , 国网上海能源互联网研究院有限公司 , 哈尔滨工业大学
Abstract: 本发明公开了一种基于RRT算法的双机械臂解耦运动规划方法及系统,包括:利用双向RRT算法分别对每个机械臂进行针对环境静态障碍物的无碰撞路径规划,以确定每个机械臂的第一运行路径节点序列和每个节点对应的时间信息;将每个机械臂的第一运行路径节点序列根据每个节点对应的时间信息进行一一对应,并行碰撞检测,获取碰撞检测结果;当所述碰撞检测结果指示发生碰撞时,将作为主臂的第一机械臂的第一运行路径节点序列作为动态障碍物,重新对作为从臂的第二机械臂进行无碰撞路径规划,以确定最终运行路径节点序列;根据第一机械臂的第一运行路径节点序列、第二机械臂的最终运行路径节点序列和每个节点对应的时间信息确定双机械臂解耦运动规划方案。
-
公开(公告)号:CN119835769A
公开(公告)日:2025-04-15
申请号:CN202411957388.4
申请日:2024-12-30
Applicant: 哈尔滨工业大学
IPC: H04W72/0453 , H04W72/0457 , H04W84/06 , H04B7/185
Abstract: 本发明一种基于数据驱动的无人系统集群通信频率自适应调整方法、系统及存储介质,涉及无人系统集群领域,为解决现有方法将通信频率的选择作为默认的固定值或将通信频率的限制作为前提,不能自适应地对通信频率进行调节的问题。包括:步骤一、获取无人机集群在不同飞行速度与通信频率下飞行状态数据;步骤二、基于无人机集群中各无人机在转弯段飞行状态数据的偏差定义集群飞行状态的评价指标;步骤三、计算集群飞行指标并进行降维处理;步骤四、将不同频率与集群飞行指标进行典型函数拟合,确定二者的定量关系;步骤五、确定不同飞行速度下的通信频率与集群飞行指标之间的定量函数关系,反解函数关系得到特定要求与条件下的最佳通信频率。
-
公开(公告)号:CN119610122A
公开(公告)日:2025-03-14
申请号:CN202411968570.X
申请日:2024-12-30
Applicant: 哈尔滨工业大学
IPC: B25J9/16
Abstract: 一种基于零反作用空间和强化学习的空间漂浮机械臂运动规划方法及系统,涉及机械臂运动规划领域。本发明为是为了克服现有空间漂浮机械臂运动导致的基座姿态扰动的问题而提出来的。技术要点:本发明通过将空间机械臂的运动空间设计为零反作用空间,确保机械臂的运动不会对基座产生不希望的扰动,从而提高系统的稳定性和任务执行精度。此外,本文结合了强化学习算法,将其动作空间设定为零反作用运动空间。强化学习的高效搜索和优化能力使得机械臂能够在复杂任务空间中找到最优运动策略,同时有效避免了对基座的扰动。通过多轮训练,强化学习能够不断调整策略,以适应不同的任务需求,保证机械臂在执行空间抓取、维修等任务时,既能保持高精度操作,又能确保基座稳定。实验结果表明,该方法能够显著减少基座姿态的偏移,提高了任务执行的稳定性和效率,为未来空间机械臂在轨服务任务提供了一种可行的解决方案。
-
公开(公告)号:CN113894787A
公开(公告)日:2022-01-07
申请号:CN202111278998.8
申请日:2021-10-31
Applicant: 哈尔滨工业大学
Abstract: 一种用于机械臂强化学习运动规划中启发式奖励函数的设计方法,本发明涉及机器人运动规划与智能控制技术领域。本发明为了解决基于强化学习的机械臂运动规划算法的奖励函数设计无统一的指导方法通常依靠经验进行设计的问题。本发明包括:建立机械臂运动规划问题的启发式函数;根据启发式函数,构建机械臂运动规划的启发式奖励函数;确定启发式奖励函数中的参数取值;利用构建的启发式奖励函数训练机械臂运动规划的神经网络运动规划器。启发式奖励函数明显提升了运动规划的成功率并加快了收敛速度。本发明用于机械臂的运动规划与智能控制领域。
-
公开(公告)号:CN119885869A
公开(公告)日:2025-04-25
申请号:CN202411951287.6
申请日:2024-12-27
Applicant: 哈尔滨工业大学
IPC: G06F30/27 , G06N3/006 , G06Q10/0637 , G06Q50/26 , G06F111/06
Abstract: 本发明提供了一种基于改进DPSO算法的动态目标分配方法及系统,属于动态目标分配领域。为了解决现有多弹协同作战目标分配过程中,群智能优化算法收敛性和求解精度较差的问题。本发明基于十进制编码和速度整数化的方式,将传统PSO算法离散化,通过模块化初始化和边界值处理的方式确保种群更新过程中始终满足资源约束和整数约束;通过在目标函数中引入惩罚函数,将违背打击效能约束的解不断淘汰。为了进一步改善算法的性能,在求解过程中引入领域专家知识,实现了多弹协同作战目标分配问题的快速高质量求解。
-
公开(公告)号:CN113276109B
公开(公告)日:2024-04-26
申请号:CN202110430722.0
申请日:2021-04-21
Applicant: 国网上海市电力公司 , 国网上海能源互联网研究院有限公司 , 哈尔滨工业大学
Abstract: 本发明公开了一种基于RRT算法的双机械臂解耦运动规划方法及系统,包括:利用双向RRT算法分别对每个机械臂进行针对环境静态障碍物的无碰撞路径规划,以确定每个机械臂的第一运行路径节点序列和每个节点对应的时间信息;将每个机械臂的第一运行路径节点序列根据每个节点对应的时间信息进行一一对应,并行碰撞检测,获取碰撞检测结果;当所述碰撞检测结果指示发生碰撞时,将作为主臂的第一机械臂的第一运行路径节点序列作为动态障碍物,重新对作为从臂的第二机械臂进行无碰撞路径规划,以确定最终运行路径节点序列;根据第一机械臂的第一运行路径节点序列、第二机械臂的最终运行路径节点序列和每个节点对应的时间信息确定双机械臂解耦运动规划方案。
-
公开(公告)号:CN114083539A
公开(公告)日:2022-02-25
申请号:CN202111448606.8
申请日:2021-11-30
Applicant: 哈尔滨工业大学
Abstract: 一种基于多智能体强化学习的机械臂抗干扰运动规划方法,属于机器人运动规划与智能控制的技术领域。本发明为了解决基于强化学习的机械臂神经运动规划器抗干扰能力弱的问题而提出。本发明包括:通过对机械臂关节图的建立和关联关系分析,提出了对单一机械臂的多智能体分解方法;基于集中式学习架构的多智能体SAC强化学习算法实现了机械臂多智能体强化学习的训练。通过在运动规划过程中分别施加动作扰动、关节锁定和观测扰动,验证了所提出的离散化后的多智能体机械臂强化学习运动规划方法相比于传统单智能体具备更强的抗干扰能力。本发明用于机械臂的运动规划与智能控制领域。
-
公开(公告)号:CN119902432A
公开(公告)日:2025-04-29
申请号:CN202411951191.X
申请日:2024-12-27
Applicant: 哈尔滨工业大学
IPC: G05B13/04
Abstract: 本发明提供一种基于改进A‑star算法与强化学习的集群路径规划方法及系统,属于无人机集群控制领域。为解决现有传统路径规划中未考虑集群体积导致其碰撞和在高动态环境下失效问题。本发明基于改进的A*路径规划算法进行路径规划,考虑约束条件生成最优路径;通过局部目标点的设定,引导高速飞行器沿最短路径飞行;结合SAC强化学习算法,构建奖励函数以引导高速飞行器向目标飞行;根据高速飞行器的约束条件设计目标飞行奖励;采用基于改进A‑star与深度强化学习的分层控制框架,进一步优化集群飞行路径和避障能力。本发明在复杂障碍环境中确保集群的精确路径规划与稳定编队控制,有效提升了无人机集群在复杂环境中的避障能力和协同控制。
-
-
-
-
-
-
-
-
-