-
公开(公告)号:CN110968102A
公开(公告)日:2020-04-07
申请号:CN201911375159.0
申请日:2019-12-27
Applicant: 东南大学
IPC: G05D1/02
Abstract: 本发明公开一种基于深度强化学习的多agent避碰方法,首先,对agent可感知区域的环境状态、agent状态、起始点信息、目标点信息、动作和奖励进行表达;然后,确定深度强化学习架构;最后采用基于近端策略优化的深度强化学习方法同时对多个场景进行训练,从而获取最优控制策略,使得agent能够成功躲避静态和动态障碍物,顺利到达目标点。本发明提不仅具有较好的逼真性和较强的通用性,还具有良好的扩展性,更大大提高了训练效率,缩短了训练时间;解决了传统的强化学习方法应用于避碰中状态和动作空间必须离散的问题,提高了传统深度学习方法的训练效率。
-
公开(公告)号:CN110430061A
公开(公告)日:2019-11-08
申请号:CN201910653978.0
申请日:2019-07-19
Applicant: 东南大学
Abstract: 本发明公开了一种基于区块链技术的车联网设备身份认证方法,该方法基于区块链思想构建分布式区块链CA系统,通过双链、双区块类型混合结构的CA区块链设计完成车联网通信节点的身份认证:双区块为权威节点更新区块和新增证书区块,权威节点更新区块用于更新目前合法有效的权威节点,证书新增区块用于记录新入网的合法车载通信设备、路边基础设施和远程服务器等通信节点;双链为权威节点更新链和普通链,权威节点更新链连接相邻的权威节点,普通链不区分区块类型直接连接相邻的区块。本发明的方法可在不安全网络环境下不依赖第三方完成身份的安全认证。相较于传统的分布式CA系统在时间性能、空间性能和安全性能均具有优势。
-
公开(公告)号:CN110427633A
公开(公告)日:2019-11-08
申请号:CN201910368131.8
申请日:2019-05-05
Applicant: 东南大学
Abstract: 本发明提供了一种基于深度强化学习的水泥搅拌桩质量评估方法,包括以下步骤:步骤1:构建基于DQN的水泥搅拌桩质量评估深度强化学习模型;步骤2:采用深度强化学习方法训练质量评估深度网络;步骤3:定期进行验证测试,计算正负召回率;步骤4:当正负召回率趋于平衡时,模型训练结束,否则转至步骤2。步骤5:用训练好的深度强化学习模型对各种水泥搅拌桩进行质量评估。本发明考虑到水泥搅拌桩质量影响因素的多样性,将软土特性、固化剂和施工工艺都纳入模型进行训练,提高了评估结果的真实性和可靠性。
-
公开(公告)号:CN110096973A
公开(公告)日:2019-08-06
申请号:CN201910304333.6
申请日:2019-04-16
Applicant: 东南大学
Abstract: 本发明提出了一种基于ORB算法和深度级可分离卷积网络的交警手势识别方法,步骤如下:S1、采用摄像机拍摄含有交警的图像;S2、预处理图像,利用ORB算法检测预处理后的图像中的关键点;S3、利用BRIED特征描述子描述S2中的关键点特征;S4、通过随机一致性采样算法和关键点匹配图像中交警制服所在区域;S5、计算交警制服中心点,结合交警制服与交警身体的比例关系膨胀出交警所在区域;S6、将交警区域图像输入手势识别网络,手势识别网络利用深度级可分离卷积结构精简模型,并通过支持向量机或者一层全连接层得到手势分类结果,完成交警手势识别。本发明方法模型规模小,运算量少,运算速度快,识别精度高,可以部署在手机等低功耗设备上,方便推广。
-
公开(公告)号:CN110084375A
公开(公告)日:2019-08-02
申请号:CN201910347694.9
申请日:2019-04-26
Applicant: 东南大学
Abstract: 本发明公开一种基于深度强化学习的多agent协作框架,其包括agent,billboard,基于actor-critic的深度强化学习模块以及下一时刻状态计算模块。agent由当前状态、速度和期望目标定义;billboard负责信息的存储、更新和传递;基于Actor-Critic的深度强化学习模块中actor根据当前环境状态和agent自身状态选择合适动作,并通过Critic结合各agent的状态序列给出的评价不断进行训练学习,从而获取最优控制策略;下一时刻状态计算模块根据各agent的当前状态和采取的动作分别计算各agent下一时刻的状态,并与billboard进行交互。本发明提出的基于深度强化学习的多agent协作框架具有较好的可扩展性和较强的通用性,可以为实现多样的多agent协作提供技术方案。
-
公开(公告)号:CN109213148A
公开(公告)日:2019-01-15
申请号:CN201810875924.4
申请日:2018-08-03
Applicant: 东南大学
IPC: G05D1/02
Abstract: 本发明公开了一种基于深度强化学习的车辆低速跟驰决策方法,所述方法通过以下方式实现:首先通过车联网实时接收前方车辆和后方车辆的位置、速度、加速度信息,作为环境状态,对无人车的当前状态和行为进行表达,然后构建基于Actor-Critic框架的深度强化学习结构,最后Actor根据当前环境状态选择合适动作,并通过Critic给出的评价不断进行训练学习,从而获取最优控制策略,使得无人车能够与前方车辆以及后方车辆保持一定的安全距离,在城市拥堵工况下实现车辆低速自动跟踪前车行驶。本发明提出的基于深度强化学习的车辆低速跟驰决策方法不仅提高了驾驶的舒适性,而且保证了交通的安全性,更提高了拥堵车道的畅通率。
-
公开(公告)号:CN102841369B
公开(公告)日:2015-04-15
申请号:CN201210327013.0
申请日:2012-09-06
Applicant: 东南大学
Abstract: 本发明公布了一种用于原位检测土体放射性强度的环境孔压静力触探探头,在该探头的顶端采用同轴电缆(1)与模数转换器(2)连接传递信号和数据,在该探头内的上半部自上往下顺序连接有模数转换器(2)、二维测斜仪(3)和前置放大器(4);在探头的下半部设有侧壁摩擦筒(5),侧壁摩擦筒(5)内部设有一对铅遮板(6)、光电倍增管(7)、NaI(TI)闪烁晶体(8)和孔隙水压力传感器(10),在NaI(TI)闪烁晶体(8)所对应的探头侧壁上设有不锈钢薄壁(9),在侧壁摩擦筒(5)的下方连接有孔压过滤环(11)和圆锥探头(12)。采用该探头,具有安全、原位、方便、快速、准确、经济等特点,为岩土体放射性污染评价提供快捷有力的检测工具。
-
公开(公告)号:CN104037898A
公开(公告)日:2014-09-10
申请号:CN201410313184.7
申请日:2014-07-02
Applicant: 东南大学
Abstract: 本发明公布了一种车载动力电池自适应充电方法。当电池充电时,主控制模块根据电池传感器模块采集的电池电流、电压、温度信息,计算电池的荷电状态SOC,将温度变化量ΔH和荷电状态SOC送入主控器模块内部的模糊控制器通过模糊控制算法,输出当前状态下的最佳充电电流,通过比例积分微分控制器PID控制脉宽调制驱动器PWM产生合适占空比的控制信号,电流调节模块根据控制信号动态调整充电电流,达到了自适应充电的目的。为了使充电电流能快速准确地达到最佳值,采用果蝇优化算法FOA,动态调整比例积分微分控制器PID参数。本发明能自适应调整充电电流,能有效缩短电池充电时间,提高电池充电效率,延长电池使用寿命。
-
公开(公告)号:CN104008562A
公开(公告)日:2014-08-27
申请号:CN201410249703.8
申请日:2014-06-06
Applicant: 东南大学
IPC: G06T13/20
Abstract: 本发明公开一种面向用户规划的虚拟人群仿真框架,其包括组、触发器、运动范围限制器和云控制端。组由人员构成、活动范围、目标以及个体行为和群体行为四个组件定义和描述,提供对群体行为的模拟,从而实现对各种复杂群体行为的仿真;触发器包括路径点、流量、时间、速度等触发器,提供用于规划人群路径、决策人群行为的路径拓扑信息和感知信息;运动范围限制器提供环境中静态障碍物的位置信息;云控制端根据用户指定的路径拓扑信息和组的目标,为群体规划出无拥堵的最优路径。本发明提出的面向用户规划的虚拟人群仿真框架具有较好的逼真性和实时性,较强的灵活性以及较便捷的操作性,可以根据用户意愿模拟各种场景下逼真的虚拟人群行为。
-
公开(公告)号:CN102841369A
公开(公告)日:2012-12-26
申请号:CN201210327013.0
申请日:2012-09-06
Applicant: 东南大学
Abstract: 本发明公布了一种用于原位检测土体放射性强度的环境孔压静力触探探头,在该探头的顶端采用同轴电缆(1)与模数转换器(2)连接传递信号和数据,在该探头内的上半部自上往下顺序连接有模数转换器(2)、二维测斜仪(3)和前置放大器(4);在探头的下半部设有侧壁摩擦筒(5),侧壁摩擦筒(5)内部设有一对铅遮板(6)、光电倍增管(7)、NaI(TI)闪烁晶体(8)和孔隙水压力传感器(10),在NaI(TI)闪烁晶体(8)所对应的探头侧壁上设有不锈钢薄壁(9),在侧壁摩擦筒(5)的下方连接有孔压过滤环(11)和圆锥探头(12)。采用该探头,具有安全、原位、方便、快速、准确、经济等特点,为岩土体放射性污染评价提供快捷有力的检测工具。
-
-
-
-
-
-
-
-
-