一种非线性网络控制系统多目标协同最优控制方法

    公开(公告)号:CN117590744A

    公开(公告)日:2024-02-23

    申请号:CN202311488926.5

    申请日:2023-11-09

    Applicant: 安徽大学

    Abstract: 本发明提出了一种非线性网络控制系统多目标协同最优控制方法,竞争神经网络将被控系统状态、控制器接收到的传感器数据和目标构成的增广状态作为输入,经过特征表征网络,分别输入状态值函数网络、连续控制策略网络和优势值函数网络。状态值函数网络输出不同通讯网络模式下的状态值函数。连续控制策略网络输出不同通讯网络模式下的连续控制信号。优势值函数采用标准正态分布形式,输出不同通讯网络模式下的优势值函数。通过更新竞争网络同时对离散网络调度策略和连续控制策略协同优化。本发明协同优化非线性系统的网络调度策略和被控对象的控制策略,实现全局最优,本发明可以有效处理多目标学习任务,提高策略对不同任务的泛化能力。

    一种基于深度强化学习和PID控制器的无人机导航方法

    公开(公告)号:CN117387635B

    公开(公告)日:2024-02-23

    申请号:CN202311707956.0

    申请日:2023-12-13

    Applicant: 安徽大学

    Abstract: 本发明涉及一种基于深度强化学习和PID控制器的无人机导航方法,包括:获取无人机执行导航任务时的无人机状态向量;构建深度强化学习网络,将无人机状态向量输入深度强化学习网络中获取原始经验并将原始经验存储进原始经验存储池中;将原始经验存储池中的原始经验输入经验扩展模块得到扩展经验,利用扩展经验更新深度强化学习网络得到训练后的深度强化学习模型;重新获取无人机状态向量,输入到训练后的深度强化学习网络中,输出控制命令指引无人机完成导航。本发明在包含真实动力学的无人机导航任务中高效规划无人机路径,并使用PID控制器控制高仿真无人机飞行,最终使无人机沿着高效路径安全、平稳、无碰撞地到达目标区域,实现避障导航全过程。

    基于近端策略优化的多无人艇深度强化学习协同导航方法

    公开(公告)号:CN117168468B

    公开(公告)日:2024-02-06

    申请号:CN202311452155.4

    申请日:2023-11-03

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于近端策略优化的多无人艇深度强化学习协同导航方法,对单个无人艇进行数学建模,确定无人艇水平面运动的运动学模型及动力学模型;将多无人艇多目标导航问题建模为马尔科夫决策过程,确定状态空间以及动作空间;根据多无人艇多目标导航的目标,建立考虑无人艇与障碍物发生碰撞情况以及无人艇与其余的无人艇发生碰撞情况的差分奖励函数;获取多个无人艇的状态信息,输入多智能体深度强化学习模型,得到多个无人艇的动作;采用训练后的多智能体深度强化学习模型进行多无人艇多目标导航。解决了多个无人艇可能因为选择同一个目标点而产生冲突的问题,从而可以引导多个无人艇通过合作在避碰避障的前提下(56)对比文件周从航,李建兴,石宇静等.基于改进MAAC算法的多无人机自主路径规划.无线电工程.2023,全文.Wang, ZY.etc.Task Scheduling forDistributed AUV Network Target Huntingand Searching: An Energy-Efficient AoI-Aware DMAPPO Approach《.IEEE INTERNET OFTHINGS JOURNAL》.2023,第10卷(第9期),第8271-8285页.

    一种基于统一AI框架的深度强化学习智能决策平台

    公开(公告)号:CN117114088A

    公开(公告)日:2023-11-24

    申请号:CN202311338634.3

    申请日:2023-10-17

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于统一AI框架的深度强化学习智能决策平台,通过参数配置模块选定深度强化学习模型的参数,利用通用模块对选定的参数进行读取,根据读取到的参数,从模型库中调取并创建相应的表征器、策略模块、学习器以及智能体,在创建策略和学习器的过程中,从数学工具中调取必要的函数定义以及优化器;同时,根据读取到的参数,在原始环境基础上创建向量环境,并实例化环境,将实例化环境和智能体输入运行器中计算动作输出,并在环境中执行动作,实现智能决策。该智能决策平台对不同功能和结构的深度强化学习模型进行模块化设计,从而兼容多种AI框架。

Patent Agency Ranking