-
公开(公告)号:CN119568156A
公开(公告)日:2025-03-07
申请号:CN202411790405.X
申请日:2024-12-06
Applicant: 东南大学
Abstract: 本发明涉及一种个性化的自动变道和速度控制驾驶协同决策方法,包括:步骤S1:构建个性化决策分层框架;步骤S2:搭建换道决策训练网络,确定换道决策的优化目标,同时引入动作屏蔽机制消除危险动作的安全隐患,设定训练所需的上层状态空间、动作空间和换道奖励函数,并赋予换道奖励函数个性化权重;步骤S3:搭建跟驰决策训练网络,确定跟驰决策的优化目标,同时将优化目标定量化为奖励系数,并设定训练所需的下层状态空间、动作空间和跟驰奖励函数,并赋予跟驰奖励函数个性化权重;步骤S4:采用协同决策方法并进行换道决策训练网络和跟驰决策训练网络的耦合训练,并搭建风格奖励优先体验回放来丰富经验回放优先级度量。与现有技术相比,本发明具有提高车辆的安全性和行驶效率等优点。
-
公开(公告)号:CN115320640B
公开(公告)日:2024-12-03
申请号:CN202211077434.2
申请日:2022-09-05
Applicant: 东南大学
IPC: B60W60/00 , B60W50/00 , B60W30/18 , G06N3/0464 , G06N3/092
Abstract: 本发明公开了一种基于深度强化学习的自动驾驶行为一体化决策方法,从两种基本驾驶行为,即换道和跟驰行为的优先级和逻辑出发,首先采用上下两层深度强化学习模型处理大规模混合状态空间并保证换道决策和跟驰决策的复合动作输出,在上层模型中使用D3QN算法来区分环境的潜在价值和换道决策的价值,在下层模型采用DDPG算法处理跟驰决策从而输出连续的车速控制。选取混合标准驾驶工况对两种算法进行耦合训练之后,在利用NGSIM数据重建的高度复杂的驾驶场景中对模型进行测试。本发明提出的集成驾驶决策模型提高了跟驰与换道决策的协同性,并将车道优势函数与危险动作屏蔽机制整合到决策模型中,显著提升了行驶速度,优于其他的智能驾驶决策模型。
-
公开(公告)号:CN115320640A
公开(公告)日:2022-11-11
申请号:CN202211077434.2
申请日:2022-09-05
Applicant: 东南大学
Abstract: 本发明公开了一种基于深度强化学习的自动驾驶行为一体化决策方法,从两种基本驾驶行为,即换道和跟驰行为的优先级和逻辑出发,首先采用上下两层深度强化学习模型处理大规模混合状态空间并保证换道决策和跟驰决策的复合动作输出,在上层模型中使用D3QN算法来区分环境的潜在价值和换道决策的价值,在下层模型采用DDPG算法处理跟驰决策从而输出连续的车速控制。选取混合标准驾驶工况对两种算法进行耦合训练之后,在利用NGSIM数据重建的高度复杂的驾驶场景中对模型进行测试。本发明提出的集成驾驶决策模型提高了跟驰与换道决策的协同性,并将车道优势函数与危险动作屏蔽机制整合到决策模型中,显著提升了行驶速度,优于其他的智能驾驶决策模型。
-
公开(公告)号:CN113051667A
公开(公告)日:2021-06-29
申请号:CN202110333743.0
申请日:2021-03-29
Applicant: 东南大学
IPC: G06F30/15 , G06F30/27 , G06N3/04 , G06N3/08 , G06F119/14
Abstract: 本发明涉及一种混合动力汽车能量管理策略的加速学习方法,主要应用于基于深度强化学习的能量管理策略开发。通过不同混合动力汽车的驾驶工况信息,基于深度神经网络结构创建Actor网络和Critic网络,使用DDPG算法对源域的驾驶工况数据进行训练,以获得迁移学习所需要的内部表征;用获得的来自源域的内部表征初始化用来训练目标域的Actor网络和Critic网络,随机初始化训练目标域的Actor、Critic网络中的其他参数,并用少量的驾驶工况数据微调目标域的内部表征;目标域混合动力汽车执行训练完成的能量管理策略。本法发明具有共性的原则利用起来,节省了重新训练参数的时间,缩短了目标域混合动力汽车能量管理策略的训练周期,也有利于提高混合动力汽车的燃油经济性。
-
公开(公告)号:CN113670101A
公开(公告)日:2021-11-19
申请号:CN202111001349.3
申请日:2021-08-30
Applicant: 东南大学
IPC: F28D15/04 , G21C15/257
Abstract: 本发明公开了一种反应堆用镓热管及换热装置,镓热管包括管体;所述管体的一端为冷凝段,管体的另一端为蒸发段,在冷凝段与蒸发段之间的绝热段;其特征在于:在所述管体内设置有吸液芯以及填充在管体内、并在管体内循环流动的镓及其相关工质。本发明镓热管以液态金属镓为基础工作介质,镓在29.76℃时为液态,液态镓具有宽温度范围、良好的热稳定性。本发明既可以适用于中低温系统,可以用于高温系统。本发明实施范围广泛,简单方便和高效。镓热管特别适合移动式小型反应堆,可以应用于综合能源系统、空间核反应堆,冷却、深海、军民融合等广泛领域。
-
公开(公告)号:CN117787848A
公开(公告)日:2024-03-29
申请号:CN202311816373.1
申请日:2023-12-27
Applicant: 东南大学
IPC: G06Q10/0835 , G06N3/126
Abstract: 本发明公开了一种基于改进遗传算法的考虑不确定行驶时间的车辆路径规划方法。具体包括:(1)提出了车辆在两客户间的行驶时间服从对数正态分布来刻画行驶时间的不确定性,并利用折线型软时间窗来反映顾客对服务时间的要求。(2)构建了考虑不确定行驶时间和折线型软时间窗的车辆路径优化模型。(3)对遗传算法在种群初始化、选择操作、交叉操作及插入邻域搜索几方面进行融合改进,以避免遗传算法的局限性。(4)将要解决的路径规划问题的相关数据代入到所建立的数学模型中,并用改进的遗传算法进行求解,输出最优车辆路径方案。本发明提出的方法能反映车辆在实际配送中的运行情况,提高配送时效性,具有满足更多客户的时间窗要求,提高顾客满意度的效果。
-
公开(公告)号:CN116294240A
公开(公告)日:2023-06-23
申请号:CN202310153760.5
申请日:2023-02-23
Applicant: 东南大学 , 邢台卓华新能源科技有限公司 , 澳大利亚塔斯马尼亚大学
Abstract: 本发明公开了一种基于建筑光伏光热的跨季节地埋管群分级储热系统,涉及储热供暖技术领域,解决了北方地区全年负荷与供应时空不匹配、建筑光伏光热系统非采暖季冗余产热未被充分利用、能源利用效率低等技术问题,其技术方案要点是光伏光热单元作为热源并利用自身产电驱动系统;供水单元为用户提供生活热水;储热供热单元进行热量的跨季节分级存储同时在采暖季供热;智能监测单元用于对跨季节埋管分级储热系统全周期蓄热、取热过程进行实时监测评估。该系统将建筑光伏光热与跨季节埋管储热相结合,解决全年负荷与供应时空不匹配问题,基于埋管内流体温度与土壤平均温度的关系对储热位置进行灵活调控,有效减少系统能量损失,提升储热及取热效率。
-
公开(公告)号:CN113051667B
公开(公告)日:2024-02-02
申请号:CN202110333743.0
申请日:2021-03-29
Applicant: 东南大学
Abstract: 本发明涉及一种混合动力汽车能量管理策略的加速学习方法,主要应用于基于深度强化学习的能量管理策略开发。通过不同混合动力汽车的驾驶工况信息,基于深度神经网络结构创建Actor网络和Critic网络,使用DDPG算法对源域的驾驶工况数据进行训练,以获得迁移学习所需要的内部表征;用获得的来自源域的内部表征初始化用来训练目标域的Actor网络和Critic网络,随机初始化训练目标域的Actor、Critic网络中的其他参数,并用少量的驾驶工况数据微调目标域的内部表征;目标域混合动力汽车执行训练完成的能量管理策略。本法发明具有共性的原则利用起来,节省了重新训练参数的时间,缩短了目标域混合动力汽车能量管理策略的训练周期,也有利于提高混合动力汽车的燃油经济性。
-
公开(公告)号:CN117351719A
公开(公告)日:2024-01-05
申请号:CN202311390028.6
申请日:2023-10-25
Applicant: 东南大学
Abstract: 本发明公开了一种识别城市道路静态交通瓶颈的方法,该方法包括:(1)根据城市路网构建虚拟路网,虚拟路网由若干个识别单元组成;(2)采集原城市路网中的交通数据和道路数据;(3)计算识别单元的静态瓶颈判别指数,包括道路通行能力匹配度、交通设施影响系数和综合饱和度;(4)根据识别单元的判别指数,结合静态瓶颈判别规则,判断该识别单元是否为静态交通瓶颈。本发明在设计城市道路交通静态瓶颈的判别指标时,不仅考虑了常用的饱和度指标,还分析了道路通行能力匹配和交通设施的特征,最终设计了通行能力匹配度、交通设施影响系数、综合饱和度这三个指标,能更全面地真实地反映道路的实际情况。
-
公开(公告)号:CN116639124A
公开(公告)日:2023-08-25
申请号:CN202310347395.1
申请日:2023-04-03
Applicant: 东南大学
Abstract: 本发明提出了一种基于双层深度强化学习的自动驾驶车辆换道方法,所述方法包括:结合人类驾驶行为,将自动驾驶车辆换道行为分为换道决策阶段和换道运动阶段,分别使用深度强化学习DQN网络与DDPG网络进行换到决策和运动轨迹的训练,最终可在预测过程中将对当前行车状态进行智能决策,一体化的完成自动驾驶车辆在换道行为中决策和运动功能。本发明实现了采用双层深度强化学习方法模拟人类实际驾驶行为,最终实现自动驾驶车辆智能换道行为的目标。
-
-
-
-
-
-
-
-
-