一种基于深度强化学习的虚拟人未知环境导航算法

    公开(公告)号:CN108803615A

    公开(公告)日:2018-11-13

    申请号:CN201810727033.4

    申请日:2018-07-03

    Applicant: 东南大学

    CPC classification number: G05D1/0221 G05D1/0276

    Abstract: 本发明公开了基于深度强化学习的虚拟人未知环境导航算法。所述算法通过以下方式实现:首先对虚拟人可感知区域的环境状态、虚拟人状态、起始点信息、目标点信息和行为进行表达,然后构建基于Actor‑Critic框架的深度强化学习结构,最后Actor根据当前环境状态选择合适动作,并通过Critic给出的评价不断进行训练学习,从而获取最优控制策略,使得虚拟人能够成功躲避障碍物,顺利到达目标点。本发明提出的基于深度强化学习的虚拟人未知环境导航算法不仅具有较好的逼真性和较强的通用性,还体现了人类对未知环境的自学习能力。

    基于Myo臂带及视线追踪的虚拟假手训练平台及其训练方法

    公开(公告)号:CN106530926A

    公开(公告)日:2017-03-22

    申请号:CN201611073067.3

    申请日:2016-11-29

    Applicant: 东南大学

    CPC classification number: G09B23/28 A61F2/68 A61F2/72 A61F2002/6827

    Abstract: 本发明公开了一种基于Myo臂带及视线追踪的虚拟假手训练平台及其训练方法,包括Myo臂带、Unity虚拟环境、视线追踪单元和震动臂带;Unity虚拟环境包括虚拟假手以及可抓物体的适配场景;Myo臂带上包括若干干电极和九轴惯性模块,干电极采集人体手臂微电流,并解算出当前手势信息,九轴惯性模块采集并解算出当前手臂姿态信息;当前手势信息和手臂姿态信息传输至Unity虚拟环境并控制虚拟假手做出对应的动作;视线追踪单元,分析瞳孔相对眼睛的位置,并映射到虚拟适配场景中,实现通过人眼选择物体;震动臂带将Unity虚拟环境的物体被抓取信息反馈至手臂肌肉。本发明可以减轻患者心理压力和经济压力,同时该平台也能够评估新的假手控制算法效果,促进肌电假手的开发。

    一种基于深度强化学习的多agent避碰方法

    公开(公告)号:CN110968102B

    公开(公告)日:2022-08-26

    申请号:CN201911375159.0

    申请日:2019-12-27

    Applicant: 东南大学

    Abstract: 本发明公开一种基于深度强化学习的多agent避碰方法,首先,对agent可感知区域的环境状态、agent状态、起始点信息、目标点信息、动作和奖励进行表达;然后,确定深度强化学习架构;最后采用基于近端策略优化的深度强化学习方法同时对多个场景进行训练,从而获取最优控制策略,使得agent能够成功躲避静态和动态障碍物,顺利到达目标点。本发明提不仅具有较好的逼真性和较强的通用性,还具有良好的扩展性,更大大提高了训练效率,缩短了训练时间;解决了传统的强化学习方法应用于避碰中状态和动作空间必须离散的问题,提高了传统深度学习方法的训练效率。

    一种用于无人车训练模拟的突发性事件仿真方法

    公开(公告)号:CN108595811B

    公开(公告)日:2022-03-11

    申请号:CN201810339856.X

    申请日:2018-04-16

    Applicant: 东南大学

    Abstract: 本发明公开一种用于无人车训练模拟的突发性事件仿真方法,所述方法通过以下方式实现:首先对典型的突发性事件进行分析归类,然后对突发性事件进行文本描述,指定突发性事件的主体、行为以及对象;接着对突发性事件可能涉及的行为关系进行逻辑表示;最后采用行为树方法仿真突发性事件,从而提高无人车智能行为的训练效率。本发明提出的突发性事件仿真方法不仅具有较好的逼真性和较强的通用性,还能够为快速训练和评测无人车智能行为的危险感知能力提供技术方案。

    一种用于无人车训练模拟的突发性事件仿真方法

    公开(公告)号:CN108595811A

    公开(公告)日:2018-09-28

    申请号:CN201810339856.X

    申请日:2018-04-16

    Applicant: 东南大学

    Abstract: 本发明公开一种用于无人车训练模拟的突发性事件仿真方法,所述方法通过以下方式实现:首先对典型的突发性事件进行分析归类,然后对突发性事件进行文本描述,指定突发性事件的主体、行为以及对象;接着对突发性事件可能涉及的行为关系进行逻辑表示;最后采用行为树方法仿真突发性事件,从而提高无人车智能行为的训练效率。本发明提出的突发性事件仿真方法不仅具有较好的逼真性和较强的通用性,还能够为快速训练和评测无人车智能行为的危险感知能力提供技术方案。

    基于抽样和两级CBF的长流识别方法

    公开(公告)号:CN107948007B

    公开(公告)日:2021-09-10

    申请号:CN201710934979.3

    申请日:2017-10-10

    Abstract: 本发明提供了基于抽样和两级CBF的长流识别算法,包括:对报文进行周期抽样;设定长流阈值,配置两级CBF结构参数;对于被抽样报文,通过第二级CBF判断其是否属于已识别出的长流,若属于,则将其插入,若不属于,再通过第一级CBF判断其所属流是否为长流,若为长流,则记录其流标识,并更新其在两级CBF中的记录,若不为长流,则将其插入第一级CBF;重复上述过程直至处理完所有被抽样报文后,通过第二级CBF对所有未被抽样的报文进行查询,若属于已识别出的长流,则将其插入,否则不做处理。本发明能在有效节省空间和时间资源的基础上,既实现对长流的准确识别,又实现对流长度的高精度测量。

    一种基于深度强化学习的车辆低速跟驰决策方法

    公开(公告)号:CN109213148B

    公开(公告)日:2021-05-28

    申请号:CN201810875924.4

    申请日:2018-08-03

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于深度强化学习的车辆低速跟驰决策方法,所述方法通过以下方式实现:首先通过车联网实时接收前方车辆和后方车辆的位置、速度、加速度信息,作为环境状态,对无人车的当前状态和行为进行表达,然后构建基于Actor‑Critic框架的深度强化学习结构,最后Actor根据当前环境状态选择合适动作,并通过Critic给出的评价不断进行训练学习,从而获取最优控制策略,使得无人车能够与前方车辆以及后方车辆保持一定的安全距离,在城市拥堵工况下实现车辆低速自动跟踪前车行驶。本发明提出的基于深度强化学习的车辆低速跟驰决策方法不仅提高了驾驶的舒适性,而且保证了交通的安全性,更提高了拥堵车道的畅通率。

    基于Myo臂带及视线追踪的虚拟假手训练平台及其训练方法

    公开(公告)号:CN106530926B

    公开(公告)日:2019-03-05

    申请号:CN201611073067.3

    申请日:2016-11-29

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于Myo臂带及视线追踪的虚拟假手训练平台及其训练方法,包括Myo臂带、Unity虚拟环境、视线追踪单元和震动臂带;Unity虚拟环境包括虚拟假手以及可抓物体的适配场景;Myo臂带上包括若干干电极和九轴惯性模块,干电极采集人体手臂微电流,并解算出当前手势信息,九轴惯性模块采集并解算出当前手臂姿态信息;当前手势信息和手臂姿态信息传输至Unity虚拟环境并控制虚拟假手做出对应的动作;视线追踪单元,分析瞳孔相对眼睛的位置,并映射到虚拟适配场景中,实现通过人眼选择物体;震动臂带将Unity虚拟环境的物体被抓取信息反馈至手臂肌肉。本发明可以减轻患者心理压力和经济压力,同时该平台也能够评估新的假手控制算法效果,促进肌电假手的开发。

    一种基于深度强化学习的多agent协作框架

    公开(公告)号:CN110084375B

    公开(公告)日:2021-09-17

    申请号:CN201910347694.9

    申请日:2019-04-26

    Applicant: 东南大学

    Abstract: 本发明公开一种基于深度强化学习的多agent协作框架,其包括agent,billboard,基于actor‑critic的深度强化学习模块以及下一时刻状态计算模块。agent由当前状态、速度和期望目标定义;billboard负责信息的存储、更新和传递;基于Actor‑Critic的深度强化学习模块中actor根据当前环境状态和agent自身状态选择合适动作,并通过Critic结合各agent的状态序列给出的评价不断进行训练学习,从而获取最优控制策略;下一时刻状态计算模块根据各agent的当前状态和采取的动作分别计算各agent下一时刻的状态,并与billboard进行交互。本发明提出的基于深度强化学习的多agent协作框架具有较好的可扩展性和较强的通用性,可以为实现多样的多agent协作提供技术方案。

    一种基于深度强化学习的虚拟人未知环境导航算法

    公开(公告)号:CN108803615B

    公开(公告)日:2021-03-23

    申请号:CN201810727033.4

    申请日:2018-07-03

    Applicant: 东南大学

    Abstract: 本发明公开了基于深度强化学习的虚拟人未知环境导航算法。所述算法通过以下方式实现:首先对虚拟人可感知区域的环境状态、虚拟人状态、起始点信息、目标点信息和行为进行表达,然后构建基于Actor‑Critic框架的深度强化学习结构,最后Actor根据当前环境状态选择合适动作,并通过Critic给出的评价不断进行训练学习,从而获取最优控制策略,使得虚拟人能够成功躲避障碍物,顺利到达目标点。本发明提出的基于深度强化学习的虚拟人未知环境导航算法不仅具有较好的逼真性和较强的通用性,还体现了人类对未知环境的自学习能力。

Patent Agency Ranking