-
公开(公告)号:CN118981690A
公开(公告)日:2024-11-19
申请号:CN202411005624.2
申请日:2024-07-25
Applicant: 东南大学
IPC: G06F18/2413 , G06F18/241 , G06F18/22 , G06N3/0499 , G06N3/084
Abstract: 本发明公开了一种面向多维度语义对象的深度度量学习方法,至少包括两个学习阶段;第一学习阶段中:同时计算两组隐特征向量,其中一组用于学习每个维度内独特的相似度度量,另一组用于学习跨维度的共有相似度度量;第二学习阶段中:使用注意力模块结合第一学习阶段学到的两组隐特征向量,进一步学习每个维度特有的相似度度量,通过共有度量考虑维度相关性信息,输出每个维度专属的隐特征表示,最后采用5近邻分类准则为多维度语义对象进行分类。本发明方法进一步提高多维度语义对象分类模型的分类性能与泛化能力。
-
公开(公告)号:CN113379037B
公开(公告)日:2023-11-10
申请号:CN202110717550.5
申请日:2021-06-28
Applicant: 东南大学
IPC: G06N3/091 , G06N3/0985 , G06N3/045
Abstract: 本发明公开了一种基于补标记协同训练的偏多标记学习方法,该方法针对样本多标记场景下训练数据中存在噪声标记的问题,提高分类模型的性能。该方法使用了两个神经网络进行协同训练,其中一个网络仅从候选标记集合中学习,另一个网络仅从非候选标记集合即补标记中学习。具体来说,在每个batch数据中选择损失小的样本,指导另一个网络更新参数,最后按权重组合两个网络的输出来赋予此batch数据标记置信度。分别从候选标记和非候选标记中学习并综合考虑两个网络来降低候选标记中噪声对模型性能的影响,从而获得偏多标记学习场景下的鲁棒分类模型。
-
公开(公告)号:CN116881713A
公开(公告)日:2023-10-13
申请号:CN202310816049.3
申请日:2023-07-05
Applicant: 东南大学
IPC: G06F18/214 , G06F18/24 , G06F18/21 , G06N3/048 , G06N3/08
Abstract: 本发明公开一种基于主动查询和分组标注的多义数据标注方法,具体包括以下步骤:(1)用户初始时选择小部分多义数据进行精确标注;(2)利用深度神经网络在小部分已标注数据上训练多标记分类网络;(3)利用多标记分类网络对未标注数据的标记向量进行预测;(4)对该被查询示例的标记空间分组,小部分组发送给领域专家进行精确标注;(5)将该样本加入已标注集,更新多标记分类网络参数,在测试集上测试效果;(6)如果用户对当前模型性能满意,则结束,否则转步骤(3)。本发明能够在多义数据标注的质量和成本之间达到一定平衡,在减少标注成本的同时提高标注质量。
-
公开(公告)号:CN111783788B
公开(公告)日:2022-11-08
申请号:CN202010583875.4
申请日:2020-06-24
Applicant: 东南大学
IPC: G06V10/764 , G06V10/774 , G06V10/30
Abstract: 本发明公开了一种面向标记噪声的多标记分类方法,该方法适用于标记空间含有噪声的多标记数据分类场景,具体包括以下步骤:(1)用户在保证完全获得真实标记的前提下收集多标记数据;(2)利用ECOC编码对原始标记进行embedding,按照ECOC编码重新为每个码字选择正负训练样本;(3)基于每个码字重构的二类分类集训练二类分类模型;(4)根据训练所得分类模型对未见示例进行预测,得到每个码字上的分类结果;(5)根据欧式距离计算原始空间每个标记的ECOC编码和未见示例的预测编码之间的距离,将满足筛选条件的标记视为未见示例的真实标记;(6)如果用户对预测结果满意,则结束,否则转到步骤(2),对原始标记重新进行ECOC编码。
-
公开(公告)号:CN114861816A
公开(公告)日:2022-08-05
申请号:CN202210574747.2
申请日:2022-05-25
Applicant: 东南大学
Abstract: 本发明提出了一种基于类属特征构造的含噪多标记分类方法,该方法适用于标记空间含有噪声的多标记数据分类场景。该方法包括以下步骤:(1)用户在保证完全获得真实标记的前提下收集多标记数据;(2)利用特征空间的内部结构信息对含噪标记进行消歧;(3)基于已消歧的数据集,为每个标记构建类属特征映射;(4)根据每个标记的类属特征映射构建二分类数据集,并训练二分类模型;(5)根据训练得到的分类模型对未见示例进行预测,得到每个类别的分类结果;(6)如果用户对预测结果满意,则结束,否则转到步骤(2),对原始标记重新进行消歧。
-
公开(公告)号:CN111783788A
公开(公告)日:2020-10-16
申请号:CN202010583875.4
申请日:2020-06-24
Applicant: 东南大学
Abstract: 本发明公开了一种面向标记噪声的多标记分类方法,该方法适用于标记空间含有噪声的多标记数据分类场景,具体包括以下步骤:(1)用户在保证完全获得真实标记的前提下收集多标记数据;(2)利用ECOC编码对原始标记进行embedding,按照ECOC编码重新为每个码字选择正负训练样本;(3)基于每个码字重构的二类分类集训练二类分类模型;(4)根据训练所得分类模型对未见示例进行预测,得到每个码字上的分类结果;(5)根据欧式距离计算原始空间每个标记的ECOC编码和未见示例的预测编码之间的距离,将满足筛选条件的标记视为未见示例的真实标记;(6)如果用户对预测结果满意,则结束,否则转到步骤(2),对原始标记重新进行ECOC编码。
-
公开(公告)号:CN109242039A
公开(公告)日:2019-01-18
申请号:CN201811128127.6
申请日:2018-09-27
Applicant: 东南大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于候选标记估计的未标记数据利用方法,包括以下步骤:S10、就特定分类任务从现实世界分类任务中获取已标记数据与未标记数据,并提取数据特征;S20、根据数据特征估计未标记数据的候选标记集合,基于候选标记集合进一步估计其真实标记;S30、从估计的真实标记中挑选符合要求的相应未标记数据加入已标记数据集,并将其从未标记数据集中剔除;S40、基于扩充的已标记数据集,使用传统监督学习模型训练并返回分类结果;S50、如果用户对分类结果不满意,则基于步骤S30中更新的已标记数据集与未标记数据集,重新执行步骤S20-S40。本方法借助少量现有已标记数据来构造未标记数据的候选标记集合,能够弥补现实应用中未标记数据不能有效利用的问题。
-
公开(公告)号:CN105069133B
公开(公告)日:2018-09-14
申请号:CN201510506268.7
申请日:2015-08-18
Applicant: 东南大学
IPC: G06F17/30
Abstract: 本发明提供了一种基于未标记数据的数字图像分类方法。该方法包括以下步骤:(1)用户从包含已分类图像与未分类图像的多标记图像库中选择查询图像,包括相关图像和不相关图像;(2)在选取的已分类数字图像上使用已有的分类方法学习得到一个初始分类模型;(3)在所有查询图像上使用本发明提出的分类方法对初始分类模型进行学习优化得到一个最终分类模型;(4)基于最终分类模型对数字图像存储设备中待分类图像进行分类,并返回分类结果;(5)如果用户对分类结果满意,则执行步骤6,否则从多标记图像库中选择更多的查询图像进行反馈,执行步骤2;(6)结束。该方法能够有效利用大量未分类图像对数字图像的所有可能类别进行分类。
-
公开(公告)号:CN106384125A
公开(公告)日:2017-02-08
申请号:CN201610803784.0
申请日:2016-09-05
Applicant: 东南大学
IPC: G06K9/62
CPC classification number: G06K9/6268
Abstract: 本发明公开一种用于数字图像的面向偏标记数据的数字图像分类方法,包括初始化正则化因子与参数矩阵;在现有的样例图像上通过求解一个线性规划问题,得到真实标记指派;更新正则化因子并初始化当前目标函数值;根据真实标记指派和正则化因子,通过求解一个多类支持向量机问题,更新分类模型;根据分类模型设置参数矩阵;根据参数矩阵和分类模型,通过求解一个线性规划问题,更新真实标记指派;根据分类模型和真实标记指派,计算新目标函数值等步骤。该方法通过定义自己独有的目标函数,在数字图像对应着由多个标记组成的候选标记集合并且该集合中有且仅有一个真实标记时,可有效地对数字图像进行分类。
-
公开(公告)号:CN105005559A
公开(公告)日:2015-10-28
申请号:CN201510506904.6
申请日:2015-08-18
Applicant: 东南大学
IPC: G06F17/27
Abstract: 本发明提供了一种基于主题特征的文档分类方法,采用适于处理多主题文档的多标记学习技术。该方法包括以下步骤:(1)用户从已有的多主题文档库中选择样例文档,其中样例文档需涵盖各种类型的文档;(2)使用属性特征转换的方法显式地描述样例文档中各主题特有的属性特征;(3)使用预设的分类方法对转换后的样例文档进行学习得到一个预测模型;(4)基于预测模型预测文档存储设备中待分类文档的概念标记,并返回分类结果;(5)如果用户对分类结果满意,则执行步骤6,否则从多主题文档库中选择更多的样例文档进行反馈,执行步骤2;(6)结束。
-
-
-
-
-
-
-
-
-