-
公开(公告)号:CN115019087A
公开(公告)日:2022-09-06
申请号:CN202210557333.9
申请日:2022-05-20
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/77
Abstract: 本发明提供一种小样本视频分类和分类模型训练方法及其装置,涉及计算机视觉技术领域,所述分类方法包括:将小样本分类任务输入预先构建的收敛的压缩域长短时Cross‑Transformer模型,获取压缩域信息;基于压缩域信息,获取短时融合的帧特征;基于短时融合的帧特征,获取查询特征,并输出基于查询特征获取的小样本分类任务中查询视频对各个查询类别原型所属支撑类别的分类分数,其中,分类分数最大的支撑类别用于表示查询视频的分类结果。本发明可实现少量示例视频下的快速、高精度、高效率的小样本视频分类。
-
公开(公告)号:CN110610230A
公开(公告)日:2019-12-24
申请号:CN201910698120.6
申请日:2019-07-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种台标检测方法、装置及可读存储介质,该方法包括如下步骤:获取台标数据集,并对所述台标数据集进行分组获得台标训练集;构建多损失融合的孪生神经网络,并基于所述台标训练集对所构建的多损失融合的孪生神经网络进行训练获得训练后的多损失融合的孪生神经网络;通过所述训练后的多损失融合的孪生神经网络对待测台标进行检测。本发明方法通过构建孪生神经网络框架,很好地消除了样本数量不足对训练网络带来的影响,可以更好地检测未知的新的种类的敏感台标。
-
公开(公告)号:CN119941551A
公开(公告)日:2025-05-06
申请号:CN202411972412.1
申请日:2024-12-30
Applicant: 支付宝(杭州)信息技术有限公司 , 中国科学院自动化研究所
Abstract: 本说明书实施例提供一种图像生成方法、装置、设备与存储介质,该方法包括:通过在图像去噪过程中将时间步分为完整推理步和缓存修剪步,在缓存修剪步,修剪一部分图像单元,采用缓存图像特征进行替代,减少了对图像单元的推理次数,解决了图像生成模型推理过程中由于图像单元数量多并且需要进行多次推理导致的冗余计算问题,从而提高了图像生成模型的推理速度,同时结合完整推理步减少由于缓存引入的误差,平衡加速效果和生成质量。
-
公开(公告)号:CN119360893B
公开(公告)日:2025-05-06
申请号:CN202411523922.0
申请日:2024-10-29
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
Abstract: 本公开关于声音分类方法、装置、电子设备、存储介质和计算机程序产品,包括:提取待分类的声音信号的音频特征;将音频特征输入脉冲残差模块,获得第一脉冲残差特征;将第一脉冲残差特征输入至少一个脉冲残差模块,获得第二脉冲残差特征;将第二脉冲残差特征以及经过下采样后的第一脉冲残差特征输入注意力特征融合模块,获得第一注意力融合特征;基于第一注意力融合特征,对待分类的声音信号进行分类。本公开可以充分利用脉冲神经网络(SNN)和残差神经网络的优势,可以实现高效、准确的进行声音分类,并可以显著降低系统功耗。
-
公开(公告)号:CN119600635A
公开(公告)日:2025-03-11
申请号:CN202411552965.1
申请日:2024-11-01
Applicant: 中国科学院自动化研究所
IPC: G06V30/422 , G06N5/022 , G06Q50/08 , G06F40/279
Abstract: 本发明提供一种基于知识图谱的智能审图方法和装置,其中方法包括:对轨道交通领域中待审核的工程图纸进行解析,得到工程图纸中的待审核信息,待审核信息包括图形、文字,以及图形和文字的对应关系;基于轨道交通知识图谱,以及待审核信息,对工程图纸进行图纸审核,得到工程图纸的图纸审核结果;轨道交通知识图谱基于轨道交通领域下的专家审图经验,以及工程执行标准和/或工程制图规范构建得到,克服了传统方案中人工审图周期长、效率低,以及通用的审图方法不适用于轨道交通领域下的图纸,审图效果不佳的缺陷,不仅保证了审图的精准度和有效性,还极大地提升了审图效率,为轨道交通领域工程建设的安全与质量提供保障。
-
公开(公告)号:CN119578470A
公开(公告)日:2025-03-07
申请号:CN202510138089.6
申请日:2025-02-07
Applicant: 中国科学院自动化研究所
Abstract: 提供基于时间自擦除的神经网络的训练方法和设备。所述训练方法包括:针对每个时间步长,通过将训练样本输入卷积层,生成与所述时间步长对应的第一特征图;针对除了第一个时间步长之外的每个时间步长,通过将应用了随着每个时间步长而变化的擦除掩码的第一特征图输入池化层,生成第二特征图;通过将第二特征图输入第一全连接层,生成第一预测图;基于第一预测图和真实标签,生成损失;通过基于损失调整所述神经网络的参数,得到训练后的神经网络。因此,提高了整体的预测准确性,提高了计算效率,并且降低了计算开销。
-
公开(公告)号:CN119515771A
公开(公告)日:2025-02-25
申请号:CN202411384319.9
申请日:2024-09-30
Applicant: 中国科学院自动化研究所
IPC: G06T7/00 , G06T5/77 , G06T5/60 , G06N3/0455
Abstract: 本发明公开了一种基于多模态提示的图像质量评估模型训练方法。所述方法包括:步骤1、准备训练图像质量评估模型所需的数据集;步骤2、对参考样例和待评估图像的编码器进行训练;步骤3、搭建图像质量评估模型,以参考样例特征和待评估图像特征作为输入,以图像质量分数作为输出;步骤4、利用所述数据集训练图像质量评估模型,使用训练好的图像质量评估模型进行实际待评估图像的质量评估。本发明为无参考图像质量评估模型设计了一种新型的参考样例形式,由不同质量的失真图像及其对应的内容描述和外观描述组成,对图像质量评估准则有更好的理解,从而促进对未知图像质量评估的准确性。
-
公开(公告)号:CN118643865A
公开(公告)日:2024-09-13
申请号:CN202410542618.4
申请日:2024-04-30
Applicant: 中国科学院自动化研究所
Abstract: 本申请实施例提供一种基于不确定性定向极化和自适应插件的反蒸馏方法及装置,所述方法包括:获取用作教师网络的预训练母模型,所述预训练母模型是基于蒸馏损失和竞争损失训练得到的;基于所述预训练母模型、反蒸馏模型和反蒸馏插件获取目标模型,所述目标模型是基于反蒸馏损失和不确定性定向极化损失训练得到的,所述不确定性定向极化损失用于使所述目标模型对于样本扰动的极化方向保持不变。本申请实施例提供的基于不确定性定向极化和自适应插件的反蒸馏方法及装置,通过先训练一个没有反蒸馏能力的普通母模型作为教师模型,然后利用反蒸馏插件结合不确定性定向极化损失对模型进行优化,从而在保证模型性能的前提下,提高防御蒸馏攻击的效率。
-
公开(公告)号:CN114666571B
公开(公告)日:2024-06-14
申请号:CN202210214422.3
申请日:2022-03-07
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
Abstract: 本发明提供一种视频敏感内容检测方法及系统,该方法包括:对待检测视频执行解码方法的部分步骤,提取所述待检测视频的压缩域信息;根据所述压缩域信息判断所述待检测视频的质量是否合格;在所述待检测视频的质量不合格的情况下,确定所述待检测视频中不存在敏感内容;在所述待检测视频的质量合格的情况下,根据所述压缩域信息对所述待检测视频进行敏感内容检测,确定所述待检测视频中是否存在敏感内容。本发明降低了敏感内容检测的资源消耗,提高检测效率和检测准确率。
-
公开(公告)号:CN118133241A
公开(公告)日:2024-06-04
申请号:CN202410552190.1
申请日:2024-05-07
Applicant: 中国科学院自动化研究所
IPC: G06F18/27 , G06F18/213 , G06N3/0455 , G06N3/0895 , G06N3/096
Abstract: 本发明涉及多模态技术领域,提供一种多模态预训练模型的训练方法、装置、设备和存储介质,包括:构建多模态预训练模型,包括视觉编码器、多语言编码器以及英文解码器;基于图像‑英文文本数据获取第一损失函数;基于多语言文本‑英文文本数据获取第二损失函数;基于目标文本‑图像数据应用于视觉编码器与多语言编码器进行对比学习获取第三损失函数;基于目标文本‑图像数据的相似度矩阵获取强负样本数据,基于强负样本数据与正样本数据应用于英文解码器获取第四损失函数;基于第一损失函数、第二损失函数、第三损失函数以及第四损失函数,得到训练好的多模态预训练模型。本发明既有效缓解对多语言‑图像数据的依赖,又直接有效的利用视觉特征。
-
-
-
-
-
-
-
-
-