基于网络结构搜索的视觉问答方法

    公开(公告)号:CN113282721B

    公开(公告)日:2023-07-21

    申请号:CN202110464526.5

    申请日:2021-04-28

    Applicant: 南京大学

    Abstract: 本申请提供了一种基于网络结构搜索的视觉问答方法,包括如下步骤:采用第一人工神经网络模型对原始图片进行特征提取;采用第二人工神经网络模型对文本信息进行特征提取;待搜索的网络结构框架为编码‑解码器框架,定义三种搜索算子供框架网络搜索,所述搜索算子的输入为基于所述原始图片或/和所述文本信息所提取的图像特征或文本特征;使用基于梯度交替优化策略搜索网络结构的架构权重和算子的操作权重;使搜索网络按照多分类的方法输出候选词向量,并选择概率最大的词向量作为答案输出。本申请的有益之处在于提供了一种能在更大的空间搜索出更好的效果的基于网络结构搜索的视觉问答方法。

    基于队友感知的多智能体协作通信策略的训练系统和方法

    公开(公告)号:CN114757092A

    公开(公告)日:2022-07-15

    申请号:CN202210297894.X

    申请日:2022-03-24

    Applicant: 南京大学

    Abstract: 本发明公开了提出一种基于队友感知的多智能体协作通信策略的训练系统和方法,借助于队友建模方法,在与队友交互的过程中,为队友生成定制化、稀疏化的消息。通过多智能体强化学习通信方法,使得智能体能够在带宽受限的条件下学得能够抗干扰的高效协作通信策略,训练得到的智能体协作通信策略可以使智能体既能根据自身得到的观测信息选择合理的协作动作,又能够在合适时刻向队友发送信息以促进协作,或根据收到的队友信息进行配合。本发明在带宽受限的实际场景中仅通过少量节点间的通信实现紧密有效的协作,能够保证多智能体协作通信过程中的抗干扰能力。

    基于网络结构搜索的视觉问答方法

    公开(公告)号:CN113282721A

    公开(公告)日:2021-08-20

    申请号:CN202110464526.5

    申请日:2021-04-28

    Applicant: 南京大学

    Abstract: 本申请提供了一种基于网络结构搜索的视觉问答方法,包括如下步骤:采用第一人工神经网络模型对原始图片进行特征提取;采用第二人工神经网络模型对文本信息进行特征提取;待搜索的网络结构框架为编码‑解码器框架,定义三种搜索算子供框架网络搜索,所述搜索算子的输入为基于所述原始图片或/和所述文本信息所提取的图像特征或文本特征;使用基于梯度交替优化策略搜索网络结构的架构权重和算子的操作权重;使搜索网络按照多分类的方法输出候选词向量,并选择概率最大的词向量作为答案输出。本申请的有益之处在于提供了一种能在更大的空间搜索出更好的效果的基于网络结构搜索的视觉问答方法。

    基于多目标神经网络搜索的嵌入式目标检测模型生成方法

    公开(公告)号:CN113283426B

    公开(公告)日:2024-07-26

    申请号:CN202110478018.2

    申请日:2021-04-30

    Applicant: 南京大学

    Abstract: 本发明公开一种基于多目标神经网络搜索的嵌入式目标检测模型生成方法,选择嵌入式目标检测模型的基础检测结构并设定搜索空间;构建包含搜索空间中所有子网络的超网络;将训练好的超网络联合设定好的检测头在目标检测数据集上进行微调;在搜索前通过批量枚举搜索空间中的子网络,自动构建可推理的模型,并将模型部署到嵌入式设备上进行运行时间的测试,建立搜索空间中子网络结构编码与运行时延之间的速查表;使用强化学习的方法展开搜索;搜索过程使得网络结构朝着多个目标的方向优化;维护一个帕累托最优解集来获得符合多目标要求的目标检测模型;选择帕累托最优解集中的元素,将其对应的检测网络在嵌入式平台上进行编译部署。

    基于动态生成环境的无人车行驶策略规划方法及实现装置

    公开(公告)号:CN113276883B

    公开(公告)日:2023-04-21

    申请号:CN202110464610.7

    申请日:2021-04-28

    Applicant: 南京大学

    Abstract: 本发明公开一种基于动态生成环境的无人车行驶策略规划方法及实现装置,(1)在模拟器中构建无人驾驶环境。(2)初始化强化学习参数及网络策略模型。(3)与环境交互,收集无人驾驶车辆当前状态,由策略网络进行动作采样,在模拟器中执行动作并进入新的状态。(4)收集车辆在一段生成环境中的累积奖励以及是否成功完成任务,并建立一段新的生成环境。(5)对于车辆的行驶策略,在重复(3)中的操作采集一定强化学习样本后,进行强策略迭代。(6)对于车辆所面临的环境,将由(4)中所述的模式不断生成,并基于对是否成功以及累积奖励的收集,抽取那些失败道路以及低累积奖励道路的环境参数,在这些路段进行反复多次训练。(7)持续上述步骤训练直到策略收敛。

    一种基于课程学习的无人机空中博弈对抗的解决方法

    公开(公告)号:CN113282061A

    公开(公告)日:2021-08-20

    申请号:CN202110445367.4

    申请日:2021-04-25

    Applicant: 南京大学

    Abstract: 本发明公开一种基于课程学习的无人机空中博弈对抗的解决方法,包含以下步骤:(1)构建仿真模拟环境;(2)收集飞行员控制飞机的真实轨迹数据,将轨迹数据按照机动动作难度进行课程目标分类;(3)对指定课程目标下的轨迹,通过模仿学习来优化策略模型生成的轨迹和专家轨迹的相似度;(4)获得预训练无人机策略模型;(5)基于预训练无人机策略模型,在模拟器中创建敌我双方无人机智能体;(6)无人机在模拟器中获得当前时刻的观测;(7)无人机与模拟环境进行交互,将我方与敌方无人机对抗的任务建模为一个强化学习智能体与环境交互的问题,用强化学习算法优化无人机对抗的飞行策略;(8)获得无人机进行空中博弈对抗的有效策略。

    一种基于强化学习与网络模型蒸馏的无人机飞行控制方法

    公开(公告)号:CN113110550A

    公开(公告)日:2021-07-13

    申请号:CN202110442229.0

    申请日:2021-04-23

    Applicant: 南京大学

    Abstract: 本发明公开一种基于强化学习与网络模型蒸馏的无人机飞行控制方法,构建无人机环境模拟器;基于强化学习算法,在不同场景中进行大规模训练,得到最优控制策略,以此构建无人机飞行控制系统;基于网络模型蒸馏技术,通过教师网络和学生网络计算辅助控制信息,量化当前场景与训练场景的差异,展示强化学习控制策略对当前场景的适应能力,以此构建无人机辅助控制系统。本发明基于强化学习算法,通过在模拟器中大规模训练,使无人机自主学习控制策略,构建无人机控制系统;基于网络模型蒸馏技术,通过量化当前场景与训练场景的差异,展示强化学习控制策略对当前场景的适应程度,以此规避陌生场景,减少安全风险。

    一种基于离线强化学习的无人机自主飞行控制方法

    公开(公告)号:CN113110546A

    公开(公告)日:2021-07-13

    申请号:CN202110422019.5

    申请日:2021-04-20

    Applicant: 南京大学

    Abstract: 本发明公开一种基于离线强化学习的无人机自主飞行控制方法,包含以下步骤:(1)人为控制无人机执行飞行任务,收集无人机在现实环境中的飞行数据,生成数据集。(2)基于数据集,根据飞行状态和动作设计奖赏函数。(3)基于离线强化学习算法,仅利用数据集训练自主飞行控制策略。(4)在现实环境中,使用自主飞行控制策略操控无人机执行飞行任务,无人机操作员实时监控,测试控制策略性能并收集飞行数据。(5)把收集的新飞行数据加入数据集。(6)迭代执行步骤(2)(3)(4)(5),直到自主飞行控制策略能够完成飞行任务。本发明能够以很低的成本训练出泛化性好、鲁棒的自主飞行控制策略,适用于复杂多变的现实环境。

Patent Agency Ranking