依托强化学习的多风格车辆轨迹跟踪避撞控制方法及装置

    公开(公告)号:CN117302204A

    公开(公告)日:2023-12-29

    申请号:CN202311625357.4

    申请日:2023-11-30

    Abstract: 本发明公开了一种依托强化学习的多风格车辆轨迹跟踪避撞控制方法及装置,涉及自动驾驶车辆控制及智能算法技术领域。包括:获取待控制车辆的信息;将信息输入到构建好的基于强化学习框架的车辆轨迹跟踪避撞最优控制模型,输出多风格参数化策略网络;将信息中的自车状态、车辆观测信息以及风格指标系数输入到多风格参数化策略网络,输出动作量;根据动作量,实现多风格车辆轨迹跟踪避撞控制。本发明能够实现车辆轨迹跟踪避撞控制高精度、高实时性、高安全性且控制风格多样性的在线计算。

    自动驾驶车辆前向避撞场景下干预型共享控制方法及装置

    公开(公告)号:CN115923845B

    公开(公告)日:2023-05-23

    申请号:CN202310029817.0

    申请日:2023-01-09

    Abstract: 本发明公开了一种自动驾驶车辆前向避撞场景下干预型共享控制方法及装置,涉及自动驾驶车辆的控制技术领域。包括:获取车辆状态数据输入到前向避撞控制模型,得到自动驾驶车辆的最优名义避撞轨迹;获取驾驶员转向输入数据,得到自动驾驶车辆前向避撞场景下的共享控制方法。本发明提出了在高速前向避撞场景下控制求解与风险预测的车辆模型解耦方法,兼顾了线性模型的求解效率与非线性模型的预测准确性,完成了前向避撞场景中的风险提前预估,解决了临界避撞干预时机的判定问题,并同时考虑驾驶人的实时输入,将驾驶人的方向盘转角输入信息纳入前向避撞共享控制中,实现了人机共驾在高速前向避撞场景下“碰撞‑失稳”双重安全保障。

    依托强化学习的多风格车辆轨迹跟踪避撞控制方法及装置

    公开(公告)号:CN117302204B

    公开(公告)日:2024-02-20

    申请号:CN202311625357.4

    申请日:2023-11-30

    Abstract: 本发明公开了一种依托强化学习的多风格车辆轨迹跟踪避撞控制方法及装置,涉及自动驾驶车辆控制及智能算法技术领域。包括:获取待控制车辆的信息;将信息输入到构建好的基于强化学习框架的车辆轨迹跟踪避撞最优控制模型,输出多风格参数化策略网络;将信息中的自车状态、车辆观测信息以及风格指标系数输入到多风格参数化策略网络,输出动作量;根据动作量,实现多风格车辆轨迹跟踪避撞控制。本发明能够实现车辆轨迹跟踪避撞控制高精度、高实时性、高安全性且控制风格多样性的在线计算。

    一种依托强化学习的铰接车轨迹跟踪控制方法及装置

    公开(公告)号:CN116300977A

    公开(公告)日:2023-06-23

    申请号:CN202310572466.8

    申请日:2023-05-22

    Abstract: 本发明公开了一种依托强化学习的铰接车轨迹跟踪控制方法及装置,涉及自动驾驶技术领域。包括:获取待控制铰接车的车辆状态以及环境观测量;将车辆状态以及环境观测量输入到构建好的铰接车轨迹跟踪最优控制模型;根据车辆状态、环境观测量以及铰接车轨迹跟踪最优控制模型,得到每个时间步的车辆状态,实现铰接车轨迹跟踪控制。本发明提供了一种依托强化学习的铰接车轨迹跟踪控制方法的构建及求解方法,以实现铰接车轨迹跟踪控制高实时、高精度的在线计算。

    一种强化学习型液压机械臂集成控制方法及装置

    公开(公告)号:CN115781696B

    公开(公告)日:2023-04-25

    申请号:CN202310063392.5

    申请日:2023-01-18

    Abstract: 本发明公开了一种强化学习型液压机械臂集成控制方法及装置,涉及工业机械臂控制技术领域。包括:获取待控制的液压机械臂的当前位姿与目标位姿;根据当前位姿与目标位姿,计算得到位姿差距;将位姿差距输入到构建好的基于强化学习的控制策略模型;根据位姿差距以及基于强化学习的控制策略模型,完成液压机械臂的控制任务。本发明基于约束型强化学习,在液压机械臂与环境交互的过程中,通过探索试错的方式实现机械臂控制策略的自学习。本发明适用于液压机械臂智能作业过程,通过控制各个关节同时执行动作,实现了一种集成式控制的功能,在保证作业安全性的前提下有效提升了液压机械臂的工作效率。

    自动驾驶车辆的权重系数和控制策略自学习方法及装置

    公开(公告)号:CN115626184A

    公开(公告)日:2023-01-20

    申请号:CN202211629437.2

    申请日:2022-12-19

    Abstract: 本发明公开了一种自动驾驶车辆的权重系数和控制策略自学习方法及装置,涉及车辆自动驾驶控制技术领域。包括:获取待优化的控制策略;将待优化的控制策略输入到构建好的控制策略双层优化模型;其中,控制策略双层优化模型包括权重系数优化层以及控制策略优化层;根据待优化的控制策略、权重系数优化层以及控制策略优化层,得到优化后的控制策略,基于优化后的控制策略对自动驾驶车辆进行控制。本发明基于给定的专家驾驶策略,通过模仿该目标控制策略实现控制代价函数权重系数和控制策略的自学习。本发明能够解决在控制自动驾驶车辆时,为了实现良好的控制性能而面临的不断调整代价函数的权重系数,且该方法能够实现控制策略的自提升。

    一种依托强化学习的铰接车轨迹跟踪控制方法及装置

    公开(公告)号:CN116300977B

    公开(公告)日:2023-07-21

    申请号:CN202310572466.8

    申请日:2023-05-22

    Abstract: 本发明公开了一种依托强化学习的铰接车轨迹跟踪控制方法及装置,涉及自动驾驶技术领域。包括:获取待控制铰接车的车辆状态以及环境观测量;将车辆状态以及环境观测量输入到构建好的铰接车轨迹跟踪最优控制模型;根据车辆状态、环境观测量以及铰接车轨迹跟踪最优控制模型,得到每个时间步的车辆状态,实现铰接车轨迹跟踪控制。本发明提供了一种依托强化学习的铰接车轨迹跟踪控制方法的构建及求解方法,以实现铰接车轨迹跟踪控制高实时、高精度的在线计算。

    自动驾驶车辆的权重系数和控制策略自学习方法及装置

    公开(公告)号:CN115626184B

    公开(公告)日:2023-07-21

    申请号:CN202211629437.2

    申请日:2022-12-19

    Abstract: 本发明公开了一种自动驾驶车辆的权重系数和控制策略自学习方法及装置,涉及车辆自动驾驶控制技术领域。包括:获取待优化的控制策略;将待优化的控制策略输入到构建好的控制策略双层优化模型;其中,控制策略双层优化模型包括权重系数优化层以及控制策略优化层;根据待优化的控制策略、权重系数优化层以及控制策略优化层,得到优化后的控制策略,基于优化后的控制策略对自动驾驶车辆进行控制。本发明基于给定的专家驾驶策略,通过模仿该目标控制策略实现控制代价函数权重系数和控制策略的自学习。本发明能够解决在控制自动驾驶车辆时,为了实现良好的控制性能而面临的不断调整代价函数的权重系数,且该方法能够实现控制策略的自提升。

    自动驾驶车辆前向避撞场景下干预型共享控制方法及装置

    公开(公告)号:CN115923845A

    公开(公告)日:2023-04-07

    申请号:CN202310029817.0

    申请日:2023-01-09

    Abstract: 本发明公开了一种自动驾驶车辆前向避撞场景下干预型共享控制方法及装置,涉及自动驾驶车辆的控制技术领域。包括:获取车辆状态数据输入到前向避撞控制模型,得到自动驾驶车辆的最优名义避撞轨迹;获取驾驶员转向输入数据,得到自动驾驶车辆前向避撞场景下的共享控制方法。本发明提出了在高速前向避撞场景下控制求解与风险预测的车辆模型解耦方法,兼顾了线性模型的求解效率与非线性模型的预测准确性,完成了前向避撞场景中的风险提前预估,解决了临界避撞干预时机的判定问题,并同时考虑驾驶人的实时输入,将驾驶人的方向盘转角输入信息纳入前向避撞共享控制中,实现了人机共驾在高速前向避撞场景下“碰撞‑失稳”双重安全保障。

    一种强化学习型液压机械臂集成控制方法及装置

    公开(公告)号:CN115781696A

    公开(公告)日:2023-03-14

    申请号:CN202310063392.5

    申请日:2023-01-18

    Abstract: 本发明公开了一种强化学习型液压机械臂集成控制方法及装置,涉及工业机械臂控制技术领域。包括:获取待控制的液压机械臂的当前位姿与目标位姿;根据当前位姿与目标位姿,计算得到位姿差距;将位姿差距输入到构建好的基于强化学习的控制策略模型;根据位姿差距以及基于强化学习的控制策略模型,完成液压机械臂的控制任务。本发明基于约束型强化学习,在液压机械臂与环境交互的过程中,通过探索试错的方式实现机械臂控制策略的自学习。本发明适用于液压机械臂智能作业过程,通过控制各个关节同时执行动作,实现了一种集成式控制的功能,在保证作业安全性的前提下有效提升了液压机械臂的工作效率。

Patent Agency Ranking