-
公开(公告)号:CN118466550A
公开(公告)日:2024-08-09
申请号:CN202410701834.9
申请日:2024-05-31
Applicant: 南京大学
IPC: G05D1/46 , G05D109/20
Abstract: 本发明公开一种基于隐函数学习的无人机模拟器学习方法,旨在解决现有无人机模拟器难以学习飞行控制问题中复杂的转移函数问题。由于飞行控制中存在各种非平滑、突变等情况,传统模拟器难以学习复杂任务的转移,本发明提出的隐函数模型能够更好地适应各种复杂的非平滑情况,并具有更强的外推泛化能力。该模拟器利用隐函数,即能量函数模型,对离线收集的数据进行学习。通过该方法,能够更有效地建模离线数据的特征以及分布,进一步的作为强化学习的环境模型从而高效的学习策略。本发明可被广泛应用于各种方法和领域,为离线数据模拟提供了一种新的技术途径。
-
公开(公告)号:CN113240119B
公开(公告)日:2024-03-19
申请号:CN202110375385.X
申请日:2021-04-08
Applicant: 南京大学
Abstract: 本发明公开一种用于游戏AI策略解释的跨模型蒸馏装置,主要包括基于监督学习、决策树学习的模型蒸馏系统以及基于决策树规则提取的策略解释两个部分。本发明为研究人员提供了一种针对游戏AI的策略解释装置,能够实时对游戏AI的决策行为提供可理解的解释信息,从而揭示观测和行为之间的因果结构,增强游戏互动性,同时还能够为人类玩家的游戏过程提供技术参考。
-
公开(公告)号:CN112957740B
公开(公告)日:2023-09-29
申请号:CN202110324418.8
申请日:2021-03-26
Applicant: 南京大学
IPC: A63F13/67 , G06V10/764 , G06V10/82 , G06V10/762 , G06N3/0464 , G06N3/048 , G06N3/092
Abstract: 本发明公开一种适配分层强化学习的自动分解游戏环境的方法,涉及到两个方面,一个是计算机视觉方面的弱监督语义分割技术,这一块为任务分解模块,另一个是强化学习中的分层强化学习的领域,这一块为策略训练模块。该方法能够大大降低强化学习的学习难度,以使得可以在更复杂的游戏环境中训练出更强大的游戏AI。这能够一方面提高游戏公司在设计游戏AI方面的生产力,另一方面也能够提高强化学习技术本身的适用性,使其能够进一步落地到更多的通用领域。
-
公开(公告)号:CN113268810B
公开(公告)日:2023-09-22
申请号:CN202110466328.2
申请日:2021-04-28
Applicant: 南京大学
Abstract: 本申请提供了一种基于动力学控制和随机化的交通流仿真方法,包括如下步骤:创建若干相异的道路单元;配置每段道路起始导航点和结束导航点、模拟车辆和模拟行人的生成位置集合、速度限制以及限制可行区域的墙体;将各道路单元进行拼接,使驶出道路的结束导航点靠近驶入道路的开始导航点;随机从所有道路单元的模拟行人生成位置集合中选取初始化位置等步骤。本申请的有益之处在于提供了一种有效模拟车辆和行人相互作用关系的基于动力学控制和随机化的交通流仿真方法。
-
公开(公告)号:CN116562734A
公开(公告)日:2023-08-08
申请号:CN202310567161.8
申请日:2023-05-19
Applicant: 南京大学 , 北京三快在线科技有限公司
IPC: G06Q10/083 , G06Q30/0601 , G06Q10/04 , G06N3/0455 , G06N3/092
Abstract: 本发明公开一种在群组上的隐外生变量发现方法,适用于配送场景的预测,根据系统记录获取所需的内生变量数据集,并获得辅助变量;根据内生变量、辅助变量和隐外生变量情况构建网络;在拥有相同隐外生变量且独立采样的同质群组上,进行隐外生变量发现;获得隐外生变量结果和转移模型。本发明解决了配送场景中存在不可观测的隐外生变量的问题,该问题会造成配送场景无法准确进行转移预测,通过对隐外生变量的发现,填补缺失数据,我们可以更加准确地模拟配送场景,提高模型的预测能力,进而提升用户的配送体验。
-
公开(公告)号:CN111666949B
公开(公告)日:2023-06-20
申请号:CN202010546056.2
申请日:2020-06-16
Applicant: 南京大学
IPC: G06V10/26 , G06N3/0464 , G06V10/774 , G06V20/70 , G06V10/82 , G06V10/764
Abstract: 本发明公开一种基于迭代分割的图像语义分割方法,包括:图像预处理,通过图像增强模型对输入的样本图像进行增强,得到增强样本图像,然后对所述增强样本图像进行若干次分割,如此反复得到最终的卷积神经网络,根据最终的卷积神经网络对图像进行语义分割,输出语义分割结果;本发明后续的样本图像是由最初的增强样本图像分割而成的,由于其经过多次分割,数量会逐渐庞大,并且先训练后验证,再训练再验证,如此反复得到最终的卷积神经网络,训练数据和验证数据之间相当于存在母体和子体关系,既不会产生因训练数据差异较大导致的精度降低问题,而且还由于训练数据之间的漂移较小,有助于提升精度。
-
-
公开(公告)号:CN114581748B
公开(公告)日:2022-09-23
申请号:CN202210483252.9
申请日:2022-05-06
Applicant: 南京大学
IPC: G06V10/80 , G06V10/774 , G06K9/62 , G06N20/00
Abstract: 本发明公开一种基于机器学习的多智能体感知融合系统及其实现方法,多个智能体在行驶过程中通过摄像头采集道路环境图片,根据采集的道路环境图片制作训练数据集;使用训练数据集训练算法模型,并将算法模型部署在计算芯片上;使用过程:智能体行驶过程中,通过摄像头采集道路环境图片,并发送给计算芯片,在计算芯片中运行算法模型,提取图片中的特征,对多摄像头图片进行特征融合,对融合好的特征进行多任务预测,得到环境信息,使用通信模块将环境信息分享给周边智能体并获取周边智能体分享的环境信息,计算芯片将通信获取的环境信息进行融合,完善自身环境信息。本发明增加了智能体感知范围,降低了智能体感知盲区,提高了智能体的决策精度。
-
公开(公告)号:CN113189985B
公开(公告)日:2022-09-23
申请号:CN202110410291.1
申请日:2021-04-16
Applicant: 南京大学
IPC: G05D1/02
Abstract: 本发明公开一种基于自适应粒子与信念填充的部分可观察驾驶规划方法,把自动驾驶任务建模为一个部分可观察马尔科夫决策任务,并使用一种高效在线规划求解方法对其进行实时求解。由于采用了在线求解的方法,本系统能够支持对各类道路类型、障碍物类型、智能体类型的灵活建模求解,是一种通用的智能驾驶规划方法。本方法所采用的在线规划求解方法利用自适应粒子滤波实现了信念状态的高效近似,并引入了信念填充方法对相似观察分支进行合并,这使得其能够高效地求解自动驾驶这类观察空间巨大的任务。
-
公开(公告)号:CN113110592B
公开(公告)日:2022-09-23
申请号:CN202110488468.X
申请日:2021-05-06
Applicant: 南京大学
IPC: G05D1/10
Abstract: 本发明公开一种无人机避障与路径规划方法,结合蒙特卡洛树搜索与对比强化学习算法,克服GPS在特定环境中信号不足的问题,实现无人机在复杂环境中避障与路径选择的功能。包括以下几个步骤:(1)构造环境仿真模拟器。(2)无人机在模拟器中获得观测信息,利用深度神经网络处理观测信息。(3)利用蒙特卡洛树搜索进行粗粒度的路径规划,生成无人机前进路径中的阶段性目标点,用于后续强化学习算法的训练。(4)利用强化学习学习无人机精细的控制策略和细粒度的路径规划。(5)基于对比学习加速无人机训练。本发明方法使得无人机在难度系数高,不确定因素大的复杂环境中有自主决策能力,在相当程度上可应对突发情况,完成特定任务。
-
-
-
-
-
-
-
-
-