-
公开(公告)号:CN111026127A
公开(公告)日:2020-04-17
申请号:CN201911373375.1
申请日:2019-12-27
Applicant: 南京大学
IPC: G05D1/02
Abstract: 本发明公开一种基于部分可观测迁移强化学习的自动驾驶决策方法及系统,使用情景相关的方案重用方法,通过迁移驾驶方案数据库中的现有方案来辅助解决陌生路况下的行车问题。为了达到较好的乘坐体验,使用强化学习来解决自动驾驶领域中的决策问题。系统包括情景单元、感知单元、决策单元、动作规划单元和控制单元。通过向虚拟环境数据库添加新的环境模型以应对日渐复杂的行车情景;通过在神经网络中添加卷积层来识别车辆周围的障碍物;通过在神经网络中添加长短时记忆单元来记忆重要的历史信息;通过使用基于玻尔兹曼软最大化的加权深度双Q网络算法来更准确地估计Q值;通过使用最大熵Mellowmax算法来求得各驾驶方案被选中的概率。
-
公开(公告)号:CN110969216A
公开(公告)日:2020-04-07
申请号:CN201911324653.4
申请日:2019-12-20
Applicant: 南京大学
IPC: G06K9/62
Abstract: 本发明公开一种基于多模态传感器数据的移动设备后台应用预测方法,首先利用移动设备的多种传感器进行数据收集,然后采用能够利用多种不同类型数据的学习方法对这些数据进行融合处理,并且进行分类学习,最后在实际使用中利用训练完毕的分类器对采集到的多种传感数据进行分类和识别。本发明实施过程中利用不对齐多模态数据,可以处理模态不完全和不一致的情况,利用标记之间的相关性,分类性能优越。
-
公开(公告)号:CN108959655B
公开(公告)日:2020-04-03
申请号:CN201810889330.9
申请日:2018-08-07
Applicant: 南京大学
IPC: G06F16/9535
Abstract: 本发明公开一种面向动态环境的自适应在线推荐方法,通过将推荐任务建模成一个在线多分类问题,然后使用自适应在线分类方法进行推荐。首先,获取应用场景的历史数据集。接着,选择分类器和损失函数,并计算出分类器在历史数据集上的最优参数作为初始值。然后,在每个回合根据分类器的预测决定推荐项目,并通过一个自适应方法更新分类器参数。该自适应方法包含一个元方法和多个专家方法。与现有技术相比,本发明能自适应地进行在线推荐,适用于变化速度和幅度无法事先预测的动态环境。
-
公开(公告)号:CN108255059A
公开(公告)日:2018-07-06
申请号:CN201810054083.0
申请日:2018-01-19
Applicant: 南京大学
IPC: G05B13/04
CPC classification number: G05B13/042
Abstract: 本发明公开了一种基于模拟器训练的机器人控制方法,对机器人待执行任务环境进行仿真建模,建立模拟器;在模拟器中,随机生成T个不同性能参数的机器人,各机器人分别训练策略,最终得到由各自策略构成的基策略集;在模拟器中,另外随机生成M个不同性能参数的机器人,并在此M个机器人中优化得到各机器人在执行任务时所使用的基策略集的最优组合权重,将各机器人执行随机动作序列得到的特征Fi(A)和最优组合权重分别作为回归模型的输入和标签,优化得到最优的回归模型θ;在模拟器中,另外随机生成N个不同性能参数的机器人,在这N个机器人上优化出最优动作;在同一任务中,使未知的不同性能参数的机器人执行最优动作A*,得到该机器人的最优动作策略。
-
公开(公告)号:CN107122800A
公开(公告)日:2017-09-01
申请号:CN201710298619.9
申请日:2017-04-27
Applicant: 南京大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于预测结果筛选的鲁棒机器学习方法,用于获得更可靠的数字图像标注结果。具体而言,本发明采用机器学习中的经典思想——最大化间隔原理,对待标注的数字图像在多种相似度度量下得到的预测结果进行筛选,选取其中间隔最大的结果作为最终预测结果输出,完成对数字图像的标注。预测结果具有大间隔理论上避免了预测结果难以区分的情况,具有不错的鲁棒性。为了显示地计算间隔,本发明采用机器学习经典损失函数来衡量预测结果的区分程度,从而得到间隔的大小。其中,损失函数指预测结果(连续值)与候选的预测标记(离散值)之间的差距,该损失越小代表了预测结果的间隔越大。
-
公开(公告)号:CN105930277A
公开(公告)日:2016-09-07
申请号:CN201610543653.3
申请日:2016-07-11
Applicant: 南京大学
IPC: G06F11/36
CPC classification number: G06F11/3608
Abstract: 本发明公开一种基于缺陷报告分析的缺陷源代码定位方法,首先获得新的待检查缺陷报告;如果不存在缺陷定位模型,建立缺陷定位模型。建立缺陷定位模型:获取大量历史缺陷报告、源代码和缺陷定位标记,构造训练集合;初始化缺陷定位模型;利用当前模型,提取训练集合缺陷报告和源代码的统一特征;计算当前模型的缺陷定位训练误差;若缺陷定位模型的训练误差低于预设阈值,模型训练完成,否则更新缺陷定位模型权重参数,继续训练。利用模型提取待检查的缺陷报告和源代码的统一特征并利用统一特征定位包含缺陷的源代码模块;输出定位到的缺陷源代码模块;若还有缺陷报告尚未检查,继续获取并分析新的待检查缺陷报告,否则缺陷定位过程结束。
-
公开(公告)号:CN105894032A
公开(公告)日:2016-08-24
申请号:CN201610202600.5
申请日:2016-04-01
Applicant: 南京大学
IPC: G06K9/62
CPC classification number: G06K9/6267 , G06K9/6256
Abstract: 本发明公开一种针对样本性质提取有效特征的方法,包括训练样本特征序列化步骤、样本特征选择器与对应模型训练步骤和针对样本的模型分类步骤;分类时初期设定一个初始的特征集,对于每一个需要分类的样本根据当前已有特征集决定下一步需要提取特征集,然后判断是否停止提取特征,如果还需要提取特征,则重复上一步过程,如果停止提取特征,就输入到合适的分类器进行分类,得到预测结果。与现有技术相比,本发明充分考虑了样本特征提取的时间开销和分类的置信度。
-
公开(公告)号:CN102521623B
公开(公告)日:2014-01-15
申请号:CN201110407426.5
申请日:2011-12-09
Applicant: 南京大学
IPC: G06K9/66
Abstract: 本发明公开了一种基于子空间的增量学习人脸识别方法,包括以下步骤:步骤一:人脸图片的预处理;步骤二:生成一组以上训练样本子空间和一组测试图片子空间:步骤三:比较测试图片子空间与一组以上训练样本子空间之间的相似度;步骤四:增量学习:如果在步骤三中标识为第j*类的测试图片与表示第j*类人脸的样本图片之间的相似度大于设定阈值,则通过基底变换法对该组样本子空间进行调整,生成一组新的样本子空间。本发明优点是实现了增量学习,在识别过程中能够充分利用已接触的信息,对识别结果进行改进。
-
公开(公告)号:CN103092762A
公开(公告)日:2013-05-08
申请号:CN201310053478.6
申请日:2013-02-19
Applicant: 南京大学
IPC: G06F11/36
Abstract: 本发明公开一种适用于快速软件开发模式的实时软件缺陷检测方法,首先初始化模型使其对任意模块的检测结果置信度为0;等待并接收一个刚完成编码的软件模块;利用当前缺陷检测模型对所接收的软件模块进行实时检测;若缺陷检测模型的缺陷检测置信度低于预设阈值,将所接收的软件模块送交测试人员进行详细测试,输出其缺陷情况,否则直接输出检测结果;利用接收到的软件模块对当前模型进行实时增量式建模;返回等待步骤接收新的软件模块直至所有软件模块开发完毕。该方法能够在编码过程中同步利用不断积累的软件模块进行实时建模,并在每个模块开发完成后及时为开发人员提供该模块的缺陷预警。
-
公开(公告)号:CN1851703A
公开(公告)日:2006-10-25
申请号:CN200610040157.2
申请日:2006-05-10
Applicant: 南京大学
IPC: G06F17/30
Abstract: 本发明公开了一种数字图像检索中的主动半监督相关反馈方法,包括以下步骤:(1)接受用户的实例图像,包括相关图像和不相关图像;(2)依据实例图像初步计算图像的相似度;(3)基于图像的初步相似度,使用一种半监督协同技术自动选择一些图像加入实例图像集合,共同作为依据生成对检索更为有效的相似度度量;(4)依据新生成的图像相似度对图像排序,生成图像检索结果;(5)依据新生成的图像相似度的绝对值对图像排序,生成用于用户主动相关反馈的图像序列;(6)结束。本发明的显著优点是(1)使用较少的用户标记样本达到学习的目的;(2)通过较少轮次的用户反馈,获得较好的检索效果。
-
-
-
-
-
-
-
-
-