一种用于无人车训练模拟的突发性事件触发机制

    公开(公告)号:CN108665069A

    公开(公告)日:2018-10-16

    申请号:CN201810370269.7

    申请日:2018-04-24

    Applicant: 东南大学

    Abstract: 本发明公开了一种用于无人车训练模拟的突发性事件触发机制,包括建立隐马尔可夫模型;确定特定突发性事件所涉及的所有虚拟角色在事件发生时间段的观察状态序列;确定突发性事件库中各种典型的突发性事件的观察状态序列;根据当前环境,分别计算各种典型的突发性事件的发生概率,并根据发生概率从高到低的顺序确定各种典型的突发性事件触发的优先级;按照各种典型的突发性事件触发的优先级的顺序判断当前环境是否包含该典型的突发性事件触发所需的虚拟角色,若包含,则触发该典型的突发性事件。本发明提出的突发性事件触发机制不仅能够根据当前环境触发合适的突发性事件,而且能够为仿真突发性事件从而训练无人车的智能行为提供技术手段。

    基于抽样和两级CBF的长流识别方法

    公开(公告)号:CN107948007A

    公开(公告)日:2018-04-20

    申请号:CN201710934979.3

    申请日:2017-10-10

    CPC classification number: H04L43/022 H04L43/0894 H04L43/16

    Abstract: 本发明提供了基于抽样和两级CBF的长流识别算法,包括:对报文进行周期抽样;设定长流阈值,配置两级CBF结构参数;对于被抽样报文,通过第二级CBF判断其是否属于已识别出的长流,若属于,则将其插入,若不属于,再通过第一级CBF判断其所属流是否为长流,若为长流,则记录其流标识,并更新其在两级CBF中的记录,若不为长流,则将其插入第一级CBF;重复上述过程直至处理完所有被抽样报文后,通过第二级CBF对所有未被抽样的报文进行查询,若属于已识别出的长流,则将其插入,否则不做处理。本发明能在有效节省空间和时间资源的基础上,既实现对长流的准确识别,又实现对流长度的高精度测量。

    一种基于抽样的网络流量测量算法

    公开(公告)号:CN107196826A

    公开(公告)日:2017-09-22

    申请号:CN201710564141.X

    申请日:2017-07-12

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于抽样的网络流量测量算法,包括如下步骤:(1)对Counting Bloom Filter结构的参数进行合理配置;(2)利用Counting Bloom Filter结构判定到来的数据分组所述网络流是否为新流;(3)如果到来的数据分组被判定为新流,将该新流插入到Counting Bloom Filter中,流计数器加1,根据已插入的流个数计算误差概率P,同时调整抽样频率为f为整个算法的抽样频率,以调整后的频率对新流进行随机抽样,并继续处理下一分组,重复步骤(2)继续循环;(4)如果判定为没有新流到达,则继续处理下一分组,重复步骤(2)继续循环。本发明实现对网络流的等概率抽样,做到既能对网络流量数据进行缩减,又能保留网络流量数据的特征信息,节省系统的存储资源。

    一种用于无人车训练模拟的突发性事件触发机制

    公开(公告)号:CN108665069B

    公开(公告)日:2022-04-15

    申请号:CN201810370269.7

    申请日:2018-04-24

    Applicant: 东南大学

    Abstract: 本发明公开了一种用于无人车训练模拟的突发性事件触发机制,包括建立隐马尔可夫模型;确定特定突发性事件所涉及的所有虚拟角色在事件发生时间段的观察状态序列;确定突发性事件库中各种典型的突发性事件的观察状态序列;根据当前环境,分别计算各种典型的突发性事件的发生概率,并根据发生概率从高到低的顺序确定各种典型的突发性事件触发的优先级;按照各种典型的突发性事件触发的优先级的顺序判断当前环境是否包含该典型的突发性事件触发所需的虚拟角色,若包含,则触发该典型的突发性事件。本发明提出的突发性事件触发机制不仅能够根据当前环境触发合适的突发性事件,而且能够为仿真突发性事件从而训练无人车的智能行为提供技术手段。

    一种基于深度强化学习的多agent避碰方法

    公开(公告)号:CN110968102A

    公开(公告)日:2020-04-07

    申请号:CN201911375159.0

    申请日:2019-12-27

    Applicant: 东南大学

    Abstract: 本发明公开一种基于深度强化学习的多agent避碰方法,首先,对agent可感知区域的环境状态、agent状态、起始点信息、目标点信息、动作和奖励进行表达;然后,确定深度强化学习架构;最后采用基于近端策略优化的深度强化学习方法同时对多个场景进行训练,从而获取最优控制策略,使得agent能够成功躲避静态和动态障碍物,顺利到达目标点。本发明提不仅具有较好的逼真性和较强的通用性,还具有良好的扩展性,更大大提高了训练效率,缩短了训练时间;解决了传统的强化学习方法应用于避碰中状态和动作空间必须离散的问题,提高了传统深度学习方法的训练效率。

    一种基于深度强化学习的多agent协作框架

    公开(公告)号:CN110084375A

    公开(公告)日:2019-08-02

    申请号:CN201910347694.9

    申请日:2019-04-26

    Applicant: 东南大学

    Abstract: 本发明公开一种基于深度强化学习的多agent协作框架,其包括agent,billboard,基于actor-critic的深度强化学习模块以及下一时刻状态计算模块。agent由当前状态、速度和期望目标定义;billboard负责信息的存储、更新和传递;基于Actor-Critic的深度强化学习模块中actor根据当前环境状态和agent自身状态选择合适动作,并通过Critic结合各agent的状态序列给出的评价不断进行训练学习,从而获取最优控制策略;下一时刻状态计算模块根据各agent的当前状态和采取的动作分别计算各agent下一时刻的状态,并与billboard进行交互。本发明提出的基于深度强化学习的多agent协作框架具有较好的可扩展性和较强的通用性,可以为实现多样的多agent协作提供技术方案。

    一种基于深度强化学习的车辆低速跟驰决策方法

    公开(公告)号:CN109213148A

    公开(公告)日:2019-01-15

    申请号:CN201810875924.4

    申请日:2018-08-03

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于深度强化学习的车辆低速跟驰决策方法,所述方法通过以下方式实现:首先通过车联网实时接收前方车辆和后方车辆的位置、速度、加速度信息,作为环境状态,对无人车的当前状态和行为进行表达,然后构建基于Actor-Critic框架的深度强化学习结构,最后Actor根据当前环境状态选择合适动作,并通过Critic给出的评价不断进行训练学习,从而获取最优控制策略,使得无人车能够与前方车辆以及后方车辆保持一定的安全距离,在城市拥堵工况下实现车辆低速自动跟踪前车行驶。本发明提出的基于深度强化学习的车辆低速跟驰决策方法不仅提高了驾驶的舒适性,而且保证了交通的安全性,更提高了拥堵车道的畅通率。

Patent Agency Ranking