-
公开(公告)号:CN119322940A
公开(公告)日:2025-01-17
申请号:CN202411415777.4
申请日:2024-10-11
Applicant: 东南大学
IPC: G06F18/213 , G06F18/27 , G06F40/30
Abstract: 本发明公开了基于隐式标记重要度恢复利用的多义对象度量学习方法及系统,在隐式标记重要度恢复阶段中,通过对特征空间进行局部线性重构以建模其潜在流形结构,传递该流形结构至标记空间以恢复多义对象的隐式标记重要度;在判别度量学习阶段中,构建判别度量学习目标函数以约束判别模型的预测输出与恢复的隐式标记重要度相对齐,通过迭代优化策略求解判别模型系数和判别度量,从而隐式得将具有相似标记重要度的样本相互拉近,将具有较大标记重要度差异的样本相互推远;在相似性刻画阶段中,通过判别模型系数和判别度量显式刻画多义对象的相似性。本方法显著提高了度量学习对多义对象相似性的刻画能力。
-
公开(公告)号:CN119206288A
公开(公告)日:2024-12-27
申请号:CN202411061909.8
申请日:2024-08-05
Applicant: 东南大学
IPC: G06V10/764 , G06V10/774 , G06V10/776 , G06V10/70
Abstract: 本发明公开了一种面向长尾类别分布的图像分类方法,包括:用户收集训练数据及其类别标签;利用数据混合技术对训练数据进行线性插值,构造新的标签样本对;使用新构造的标签样本对训练三个不同的专家模型;利用无标签的测试数据学习专家模型在该测试分布上的最优集成权重,提升多专家测试时的泛化性能;使用最优集成后的专家模型对测试数据再次进行预测,得到最终分类结果;如果用户对预测结果满意,则结束,否则收集更多的训练数据及标签,返回执行第二个步骤。本发明提升多专家集成模型在未知测试分布上的泛化效果,为解决真实场景中的长尾问题提供新的方案。
-
公开(公告)号:CN119048810A
公开(公告)日:2024-11-29
申请号:CN202411076021.1
申请日:2024-08-07
Applicant: 东南大学
IPC: G06V10/764 , G06V10/74 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N3/0985 , G06N3/09
Abstract: 本发明公开了一种基于视觉‑语言预训练模型的长尾多标记图像分类方法,获取具有真实标记的多标记样本数据;将传统CLIP预训练模型模型中softmax层替换为sigmoid层,适应多标记任务;构建长尾多标记图像分类模型并对其进行训练;将语义融合特征与文本特征进行残差连接,与图像特征进行余弦相似度计算,并经过sigmoid得到预测概率;由重加权长尾损失函数对模型进行监督训练,并应用参数高效微调避免过拟合问题;针对待测试的图像数据,经过数据增强策略后,输入到训练后的模型中进行预测,最终获得标签的预测结果,实现长尾多标记图像分类。本发明充分利用了标签之间的相关性,缓解长尾类别分布引发的尾部类分类精度不足的影响,提高了多标记分类的准确性。
-
公开(公告)号:CN114818979A
公开(公告)日:2022-07-29
申请号:CN202210576145.0
申请日:2022-05-25
Applicant: 东南大学
IPC: G06K9/62 , G06F40/216 , G06F40/289
Abstract: 本发明提出了一种基于最大化间隔机制的含噪多标记分类方法,该方法适用于标记空间含有噪声的多标记数据分类场景。该方法包括以下步骤:(1)用户在保证完全获得真实标记的前提下收集多标记数据;(2)使用标记置信度来表示标记信息,为每个标记初始化置信度值;(3)将含噪多标记分类问题转换成经验损失、铰链损失与置信度约束最小化的凸优化问题,求得凸优化问题的最优解生成多标记分类模型;(4)根据训练得到的分类模型对未见示例进行预测,得到每个类别的分类结果;(5)如果用户对预测结果满意,则结束,否则转到步骤(2),为每个标记重新初始化置信度值。
-
公开(公告)号:CN113379037A
公开(公告)日:2021-09-10
申请号:CN202110717550.5
申请日:2021-06-28
Applicant: 东南大学
Abstract: 本发明公开了一种基于补标记协同训练的偏多标记学习方法,该方法针对样本多标记场景下训练数据中存在噪声标记的问题,提高分类模型的性能。该方法使用了两个神经网络进行协同训练,其中一个网络仅从候选标记集合中学习,另一个网络仅从非候选标记集合即补标记中学习。具体来说,在每个batch数据中选择损失小的样本,指导另一个网络更新参数,最后按权重组合两个网络的输出来赋予此batch数据标记置信度。分别从候选标记和非候选标记中学习并综合考虑两个网络来降低候选标记中噪声对模型性能的影响,从而获得偏多标记学习场景下的鲁棒分类模型。
-
公开(公告)号:CN107633009A
公开(公告)日:2018-01-26
申请号:CN201710690612.1
申请日:2017-08-14
Applicant: 东南大学
Abstract: 本发明公开了一种基于标记置信度的弱监督文档分类方法,该方法适用于主题有歧义的样例文档的文档分类方法。该方法包括以下步骤:(1)用户从包含主题的歧义的文档库中选择样例文档,其中样例文档需要涵盖各个类型文档,且数目大致均衡;(2)使用标记置信度的方式表示标记信息;(3)使用预设的分类方法对转换后的文档对象进行学习;(4)根据学习所得的预测模型对文档存储设备中的文档进行分类;(5)如果用户对上一步预测的结果满意则结束,否则从有歧义的文档库中选择更多的样例进行反馈,转到步骤(2)。
-
公开(公告)号:CN107798113B
公开(公告)日:2021-11-12
申请号:CN201711063868.6
申请日:2017-11-02
Applicant: 东南大学
IPC: G06F16/35
Abstract: 本发明公开了一种基于聚类分析的文档数据分类方法,主要弥补在目前文档分类问题中,及现有技术使用相同的特征在不同的主题上进行预测而产生的性能不足问题。该方法包括以下步骤:(1)用户从已有的文档库中选择样例文档,其中每个文档都具备多个主题;(2)通过本发明提出的方法将选取的文档的初始特征针对每一种主题转化为新的特征;(3)对每一类主题,在新的特征上学习得到分类模型;(4)基于最终分类模型对文档存储设备中待分类文档进行分类,并返回分类结果;(5)如果用户对分类结果满意,则执行步骤6,否则从文档库中选择更多的查询图像进行反馈,执行步骤2;(6)结束。
-
公开(公告)号:CN109102006A
公开(公告)日:2018-12-28
申请号:CN201810815313.0
申请日:2018-07-24
Applicant: 东南大学
IPC: G06K9/62
Abstract: 本发明公开一种基于音频特征诱导信息增强的音乐自动标记方法,该方法通过MFCC、Beat、LPC、CQT组合生成音频属性特征向量;利用稀疏表示法学习训练集属性特征间的结构矩阵,并将该结构矩阵作为训练集样本相互关系的监督信息诱导标记空间进行重构,生成数值标记向量,完成标记信息增强;而后利用多元回归技术得到分类预测模型;将待标记音乐送入预测模型计算标记信息值,固定阈值进行分类,实现自动标记。本发明解决传统标记系统在训练过程中标记信息单一化的问题,利用信息增强技术有效提高训练集监督信息质量,进一步提高音乐自动标记系统的准确率和泛化性。
-
公开(公告)号:CN107798113A
公开(公告)日:2018-03-13
申请号:CN201711063868.6
申请日:2017-11-02
Applicant: 东南大学
IPC: G06F17/30
CPC classification number: G06F17/3071
Abstract: 本发明公开了一种基于聚类分析的文档数据分类方法,主要弥补在目前文档分类问题中,及现有技术使用相同的特征在不同的主题上进行预测而产生的性能不足问题。该方法包括以下步骤:(1)用户从已有的文档库中选择样例文档,其中每个文档都具备多个主题;(2)通过本发明提出的方法将选取的文档的初始特征针对每一种主题转化为新的特征;(3)对每一类主题,在新的特征上学习得到分类模型;(4)基于最终分类模型对文档存储设备中待分类文档进行分类,并返回分类结果;(5)如果用户对分类结果满意,则执行步骤6,否则从文档库中选择更多的查询图像进行反馈,执行步骤2;(6)结束。
-
公开(公告)号:CN119888884A
公开(公告)日:2025-04-25
申请号:CN202411836864.7
申请日:2024-12-13
Applicant: 中国电子科技集团公司第五十四研究所 , 东南大学
IPC: G07C3/00
Abstract: 本发明涉及无人机测控及通信链路数据挖掘技术领域,特别涉及无人机地面站研发中基于有限状态机的无人机时序数据回放器的通用设计方法。包括有限状态机模型和结构化逻辑框架两部分设计要素,适用于无人机地面站、计算机技术应用领域。本设计方法中的有限状态机模型明确定义并解耦了回放器的各行为和状态;结构化逻辑框架描述了回放器的通用接口和核心逻辑,其中自定义数据解码模块可以松耦合的方式对不同格式的回放数据文件多态实现。本设计方法保障了回放器程序的安全性、可维护性和可扩展性。
-
-
-
-
-
-
-
-
-