一种基于拓扑图的强化学习室内导航方法

    公开(公告)号:CN112484733A

    公开(公告)日:2021-03-12

    申请号:CN202011402063.1

    申请日:2020-12-04

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于拓扑图的强化学习室内导航方法,针对强化学习在导航任务中数据效率低,算法泛化性能差等问题,本发明结合了传统路径规划方法以及强化学习算法。通过对智能体的相对位置进行估计,进而依据关键位置对场景建立抽象的稀疏拓扑图,根据结点之间实际的物理距离定义连接关系,通过将传统路径规划算法与强化学习相结合的方式,形成了一种分层的导航策略,将长距离的导航问题分解为短期目标的导航问题,提升了在室内场景下的导航算法的学习效率以及泛化性能。

    一种用于自主目标跟踪的无人机控制方法

    公开(公告)号:CN112506210B

    公开(公告)日:2022-12-27

    申请号:CN202011402067.X

    申请日:2020-12-04

    Applicant: 东南大学

    Abstract: 本发明涉及一种用于自主目标跟踪的无人机控制方法,经过神经网络输出四维的动作后经过PID控制器转化成低级电机的动作,让无人机更稳定的飞行,后期改进可以将PID控制器改成其他更优化的控制方法。分层控制系统更容易将模拟环境中的训练策略轻松的转移到现实环境中运行。具有很好的泛化能力。在模拟环境中对采集上来的图像先进行CNN预训练,得到无人机和目标对象的相对距离,包括x,y,h三个维度的,本发明先保证无人机的飞行高度不变,后期可以增加空间障碍物,再考虑h。再将无人机的姿态考虑进来,选择策略,输出四维动作,通过PID输出给无人机的低级电机,通过DDPG的强化学习方法,获得Reward,更新策略,进行学习并训练。

    一种基于拓扑图的强化学习室内导航方法

    公开(公告)号:CN112484733B

    公开(公告)日:2022-10-25

    申请号:CN202011402063.1

    申请日:2020-12-04

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于拓扑图的强化学习室内导航方法,针对强化学习在导航任务中数据效率低,算法泛化性能差等问题,本发明结合了传统路径规划方法以及强化学习算法。通过对智能体的相对位置进行估计,进而依据关键位置对场景建立抽象的稀疏拓扑图,根据结点之间实际的物理距离定义连接关系,通过将传统路径规划算法与强化学习相结合的方式,形成了一种分层的导航策略,将长距离的导航问题分解为短期目标的导航问题,提升了在室内场景下的导航算法的学习效率以及泛化性能。

    一种基于深度强化学习的智能电热水器保温档负荷控制方法

    公开(公告)号:CN112510719B

    公开(公告)日:2022-06-21

    申请号:CN202011408553.2

    申请日:2020-12-05

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于深度强化学习的智能电热水器保温档负荷控制方法,包括以下步骤:采用LSTM网络利用过去48小时电价预测未来24小时电价;采用基于DQN的深度强化学习算法,将电力消耗和用户满意度同时作为好策略的衡量标准,并根据用户自身的需求调节二者所占比重。根据所预测的电价训练电热水器保温档负荷控制智能体学习得到使得奖励值最高的策略,使其在高电价时选择较低功率,低电价时选择较高功率,在尽可能保证用户满意度的同时节省更多电力消耗,以获得一个性能优良且适用性较高的电热水器负荷控制智能体。

    一种基于高斯过程回归的飞行器导引头天线罩误差斜率估计与补偿方法

    公开(公告)号:CN113536707A

    公开(公告)日:2021-10-22

    申请号:CN202110828849.8

    申请日:2021-07-22

    Applicant: 东南大学

    Inventor: 陆科林 符启恩

    Abstract: 本发明公开了一种基于高斯过程回归的飞行器导引头天线罩误差斜率估计与补偿方法,针对仅有视线角测量的受天线罩误差影响的飞行器制导系统,建立了飞行器动力学模型,使用交互式多模型滤波方法对制导过程中各状态进行估计,基于高斯过程回归模型建立飞行器视角和天线罩误差角之间的映射关系,并基于高斯过程模型的导数得到天线罩误差斜率的解析表达形式,最后用于飞行器导引头天线罩误差的补偿,从而有效提高了制导性能。

    一种基于信息融合的天线罩误差斜率估计方法

    公开(公告)号:CN113468750A

    公开(公告)日:2021-10-01

    申请号:CN202110764000.9

    申请日:2021-07-06

    Applicant: 东南大学

    Abstract: 本发明针对雷达制导过程中导引头天线罩斜率的在线估计问题,提出一种基于信息融合的天线罩误差斜率估计方法。该方法通过设计局部滤波和全局融合算法,构造一种具有“融合‑重置”结构的在线估计框架,有效提高了估计精度和容错能力。首先基于现有在线估计算法,构造具有多个并行运行子滤波器的局部滤波框架;然后根据各子滤波器的估计均值和协方差,构造全局融合性能指标,基于多种信息融合算法对天线罩斜率进行全局估计;最后利用全局滤波结果对局部滤波器进行反馈重置。本发明信息融合方法可以有效提高天线罩斜率的估计精度,降低天线罩误差对制导回路的影响,提高导弹的制导精度。

    一种基于信息融合的天线罩误差斜率估计方法

    公开(公告)号:CN113468750B

    公开(公告)日:2022-11-18

    申请号:CN202110764000.9

    申请日:2021-07-06

    Applicant: 东南大学

    Abstract: 本发明针对雷达制导过程中导引头天线罩斜率的在线估计问题,提出一种基于信息融合的天线罩误差斜率估计方法。该方法通过设计局部滤波和全局融合算法,构造一种具有“融合‑重置”结构的在线估计框架,有效提高了估计精度和容错能力。首先基于现有在线估计算法,构造具有多个并行运行子滤波器的局部滤波框架;然后根据各子滤波器的估计均值和协方差,构造全局融合性能指标,基于多种信息融合算法对天线罩斜率进行全局估计;最后利用全局滤波结果对局部滤波器进行反馈重置。本发明信息融合方法可以有效提高天线罩斜率的估计精度,降低天线罩误差对制导回路的影响,提高导弹的制导精度。

    一种提高台风轨迹预测的方法

    公开(公告)号:CN112527860B

    公开(公告)日:2022-11-18

    申请号:CN202011406564.7

    申请日:2020-12-05

    Applicant: 东南大学

    Abstract: 本发明公开了一种提高台风轨迹预测的方法,针对台风本身运动的复杂和多变性,单个预测模型对未来的多个时刻的台风轨迹预测整体精度不高等问题,本发明采用了输入数据为过去连续多个时刻的卫星同步台风数据,通过调节不同参数和网络参数等,训练出多个评价指标相似且收敛最好的时空序列预测模型,用这些模型做多次未来每个时刻的预测,并采用更改网络结构之后的时空序列分类模型进行决策这些模型在未来每个时刻的预测作为最优值,最终将每个最优预测值整合成最后的预测数据值,最终得到未来多时刻的时空序列预测数据,得到了一个总体时序精度更高的未来多时刻台风轨迹预测数据。

    一种基于条件生成对抗网络的动态到静态场景转换方法

    公开(公告)号:CN112507849A

    公开(公告)日:2021-03-16

    申请号:CN202011396405.3

    申请日:2020-12-04

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于条件生成对抗网络的动态到静态场景转换方法,该方法生成器为由粗到细的串级两阶段网络,判别器为PatchGAN与SN‑PatchGAN。本发明根据粗网络输出结果与动态场景的像素值差异推断动态区域二值掩膜,随后由细网络对动态区域进行静态恢复。本发明提取细网络编码区的深层与浅层特征后,分别采用上下文注意力机制来优化动态区域场景生成。本发明采用的判别器相较于传统判别器更能关注到图像细节且训练过程更为稳定。本发明相比于传统动态到静态场景转换方法,提取的动态目标区域更为准确,生成的动态场景图像纹理丰富、更接近真实情况。

    一种用于自主目标跟踪的无人机控制方法

    公开(公告)号:CN112506210A

    公开(公告)日:2021-03-16

    申请号:CN202011402067.X

    申请日:2020-12-04

    Applicant: 东南大学

    Abstract: 本发明涉及一种用于自主目标跟踪的无人机控制方法,经过神经网络输出四维的动作后经过PID控制器转化成低级电机的动作,让无人机更稳定的飞行,后期改进可以将PID控制器改成其他更优化的控制方法。分层控制系统更容易将模拟环境中的训练策略轻松的转移到现实环境中运行。具有很好的泛化能力。在模拟环境中对采集上来的图像先进行CNN预训练,得到无人机和目标对象的相对距离,包括x,y,h三个维度的,本发明先保证无人机的飞行高度不变,后期可以增加空间障碍物,再考虑h。再将无人机的姿态考虑进来,选择策略,输出四维动作,通过PID输出给无人机的低级电机,通过DDPG的强化学习方法,获得Reward,更新策略,进行学习并训练。

Patent Agency Ranking