-
公开(公告)号:CN113095429A
公开(公告)日:2021-07-09
申请号:CN202110447613.X
申请日:2021-04-25
Applicant: 南京大学
IPC: G06K9/62
Abstract: 本发明公开一种应对增量式新类图像数据的鲁棒弱监督分类方法。具体而言,在开放场景下,数据增量涌现,其中包括未标记、已标记、新类图像。对于已标注图像,加入模型并更新标注数据集合。对于新来的未标注图像,通过特征描述和弱监督学习等技术判断其类别归属。若其属于已知类别,则基于标记传播算法等弱监督学习技术预测其标注类别后加入已有标记数据集合;若检测出其属于未见过的新类别,则将图像放入缓存器,收集足够数量时,及时更新模型并清空缓存器。本发明能够有效实现增量式新类图像数据的鲁棒分类。
-
公开(公告)号:CN110245723A
公开(公告)日:2019-09-17
申请号:CN201910565453.1
申请日:2019-06-27
Applicant: 南京大学
IPC: G06K9/62
Abstract: 本发明公开了一种安全可靠的图像分类半监督机器学习方法及装置,方法包括:获取目标图像数据集;构建少量的验证图像数据集;对目标数据集中的未标记数据进行赋值并根据机器学习算法在目标数据集上训练得到机器学习模型;计算模型在验证数据集上的预测性能和安全性;更新未标记数据的赋值策略使得训练得到的模型在验证数据集上的预测性能和安全性不断调优,直到收敛。最终训练得到的模型确定为目标图像数据集的机器学习模型。本发明适用于图像分类任务中常见的“数据多但标记少”的数据分析情况。
-
公开(公告)号:CN118691874A
公开(公告)日:2024-09-24
申请号:CN202410684501.X
申请日:2024-05-30
Applicant: 南京大学
IPC: G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0895 , G06F16/903
Abstract: 本发明公开一种针对图像分类任务的学件查搜与复用的方法,通过在学件规约构造的过程中利用文本‑图像预训练模型进行统一数据表示,并且同时考虑训练数据分布和模型性能表现,提升学件规约对模型功能描述的准确性,从而在面临新的图像分类任务时能够更好地通过规约实现模型的查搜和复用。该发明构建了一个由大量图像分类模型以及使用本发明生成的模型规约组成的学件库,当用户面临新的图像分类任务时,可以通过本发明生成的学件规约在学件库中进行高效的模型查搜,精准查找到能够在自身任务中表现良好的模型。
-
公开(公告)号:CN113095423B
公开(公告)日:2024-05-28
申请号:CN202110430304.1
申请日:2021-04-21
Applicant: 南京大学
IPC: G06F16/35
Abstract: 本发明公开一种基于在线反绎学习的流式数据分类方法及其实现装置,通过将输入的无标记(或弱监督标记)流式数据放入当前学习器,从而获得对当前流式数据预测的伪标记;对预测得到的伪标记,通过利用知识库(和弱监督标记),执行反绎推理操作得到修改后的伪标记;最后,使用修改后的伪标记对学习器进行更新。上述过程随着流式数据到来不断执行。本发明一方面可以利用一阶逻辑表达的领域知识,使用在线反绎学习方法超越传统在线学习方法的性能;另一方面,可快速处理大量流式数据,能利用无标记或弱标记数据,并且还能处理数据中可能出现的新类别。
-
公开(公告)号:CN116824268A
公开(公告)日:2023-09-29
申请号:CN202310881586.6
申请日:2023-07-18
Applicant: 南京大学
IPC: G06V10/764 , G06V10/82 , G06N3/0895 , G06V10/774 , G06V10/74
Abstract: 本发明公开一种基于半监督不平衡学习技术的道路路面图像标注方法,针对无人驾驶领域中道路路面数据标注数量少、难度大的问题,对存在不平衡类别分布的数据设计半监督分类模型,具有易实现、高效的特点,可以基于少量的有标注样本,实现模型的快速性能提升。主要步骤包括:基于仅有少量标注的图像数据集,利用半监督学习技术训练基准模型,为无标注样本预测得到伪标注标注分布;优化基准模型结果,基于原型学习更新得到高质量伪标注,基于类别比例的逻辑调整使基准模型预测更平衡;构造重用模型,基于标注分布学习,使其充分学习基准模型预测标注分布中少数类信息。将最终的重用模型作为目标图像数据集上的机器学习模型。
-
公开(公告)号:CN116012654A
公开(公告)日:2023-04-25
申请号:CN202310063875.5
申请日:2023-01-13
Applicant: 南京大学 , 上海高德威智能交通系统有限公司
IPC: G06V10/764 , G06V10/774 , G06N20/00
Abstract: 本发明公开了一种显著降低图像标注开销的交互式增量学习方法和系统,主要利用“人在环路”的交互模式,引入专家标注过程和新型增量学习技术,降低增量图像分类的标注开销。本发明主要的技术方案为:利用历史积累图像和当前新增图像建立新型机器学习判别模型,通过理论分析从新增图像中遴选出与历史图像差异较大的样本作为候选图像池,从而过滤掉不必要标注的图像,减少标注开销,并进一步选择一批最具代表性的样本给专家标注,从而基于少量新增标注快速更新模型,提升性能。本发明具有易实现、低开销并具有理论支持的特点,基于少量的图像标注开销,有效增强了增量图像分类的能力。
-
公开(公告)号:CN107122800B
公开(公告)日:2020-09-18
申请号:CN201710298619.9
申请日:2017-04-27
Applicant: 南京大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于预测结果筛选的鲁棒机器学习方法,用于获得更可靠的数字图像标注结果。具体而言,本发明采用机器学习中的经典思想——最大化间隔原理,对待标注的数字图像在多种相似度度量下得到的预测结果进行筛选,选取其中间隔最大的结果作为最终预测结果输出,完成对数字图像的标注。预测结果具有大间隔理论上避免了预测结果难以区分的情况,具有不错的鲁棒性。为了显示地计算间隔,本发明采用机器学习经典损失函数来衡量预测结果的区分程度,从而得到间隔的大小。其中,损失函数指预测结果(连续值)与候选的预测标记(离散值)之间的差距,该损失越小代表了预测结果的间隔越大。
-
公开(公告)号:CN110263173A
公开(公告)日:2019-09-20
申请号:CN201910565455.0
申请日:2019-06-27
Applicant: 南京大学
Abstract: 本发明公开了一种快速提升文本分类性能的机器学习方法和装置,主要用于实现文本分类性能的快速提升。本发明主要的技术方案为:获取与目标任务相关的一组模型;通过复用已有模型选择出需要查询的本文样本,过滤掉不必要的查询,帮助获得更准确的主动学习模型,节省大量的查询代价;基于有标记的文本样本对已有模型的重要程度进行更新,用于更好地过滤不必要的查询。本发明具有易实现、高效的特点,可以基于少量的查询代价,实现模型的快速性能提升。
-
-
-
-
-
-
-