-
公开(公告)号:CN112235569A
公开(公告)日:2021-01-15
申请号:CN202011086957.4
申请日:2020-10-12
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: H04N19/107 , H04N19/109 , H04N19/11 , H04N19/124 , H04N19/139 , H04N19/91 , G06K9/00 , G06K9/62 , G06N3/04 , G06N3/08 , G06T7/207 , G06T7/246
Abstract: 本发明属于计算机视觉领域,具体涉及了一种基于H264压缩域的快速视频分类方法、系统及装置,旨在解决现有视频分类技术速度慢、模型复杂度高的问题。本发明包括:提取H264标准的视频的I帧、P帧和B帧数据;进行I帧的解码及P帧和B帧的熵解码,获得I帧图像及视频帧之间的运动矢量;分别构建高低时间分辨率模型,并通过时间尺度注意力模块建模不同时间分辨率的特征进行模型融合;基于I帧图像和帧之间的运动矢量,获取四个初步预测分类;进行四个初步预测分类的加权融合,获得最终的预测分类结果。本发明无需进行所有视频帧的全解码,模型参数量小,可以有效提高视频分类速度,并能很好地识别视频中快慢不同的运动信息,实用性更强。
-
公开(公告)号:CN115690645A
公开(公告)日:2023-02-03
申请号:CN202211120031.1
申请日:2022-09-14
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: G06V20/40 , G06V10/764 , G06V10/82 , G06V10/77 , G06V10/46 , G06V10/44 , G06V10/42 , G06V10/50 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/0895 , G10L25/51 , G10L25/30 , G10L25/03
Abstract: 本发明提供一种视频检测方法、装置、设备、存储介质及程序产品,该方法包括:获取待处理视频;对待处理视频的图像进行视觉特征提取,得到视觉特征信息;对待处理视频的语音进行音频特征提取,得到音频特征信息;基于视觉特征信息和音频特征信息,确定待处理视频是否为安全视频。本发明提供的视频检测方法、装置、设备、存储介质及程序产品用于提高对待处理视频进行安全检测的准确性。
-
公开(公告)号:CN115019087A
公开(公告)日:2022-09-06
申请号:CN202210557333.9
申请日:2022-05-20
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/77
Abstract: 本发明提供一种小样本视频分类和分类模型训练方法及其装置,涉及计算机视觉技术领域,所述分类方法包括:将小样本分类任务输入预先构建的收敛的压缩域长短时Cross‑Transformer模型,获取压缩域信息;基于压缩域信息,获取短时融合的帧特征;基于短时融合的帧特征,获取查询特征,并输出基于查询特征获取的小样本分类任务中查询视频对各个查询类别原型所属支撑类别的分类分数,其中,分类分数最大的支撑类别用于表示查询视频的分类结果。本发明可实现少量示例视频下的快速、高精度、高效率的小样本视频分类。
-
公开(公告)号:CN109190750B
公开(公告)日:2021-06-08
申请号:CN201810737975.0
申请日:2018-07-06
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
Abstract: 本发明涉及深度学习技术领域,具体提供了一种基于对抗生成网络的小样本生成方法及装置,旨在解决如何在少量样本数据的情况下利用生成对抗网络生成样本数据的技术问题。为此目的,本发明提供的基于对抗生成网络的小样本生成方法能够基于对抗生成网络并根据随机噪声和标签信息,生成小样本类型对应的样本。在此过程中,本发明采用迁移学习和批量训练的方法对对抗生成网络进行网络训练,使生成对抗网络可以有效迁移应用于少量样本的对抗生成网络样本生成任务中。
-
公开(公告)号:CN110674673A
公开(公告)日:2020-01-10
申请号:CN201910697979.5
申请日:2019-07-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种视频关键帧抽取方法、装置和存储介质,用以减少视频处理过程中的冗余信息,提高视频处理速度。所述视频关键帧抽取方法,包括:从待分析视频中提取I帧;针对提取的每一I帧,利用深度哈希网络确定其对应的深度哈希码,所述深度哈希网络为利用预先生成的图像样本对进行训练得到的;根据各I帧对应的深度哈希码,分别确定两两I帧深度哈希码之间的汉明距离;根据两两I帧深度哈希码之间的汉明距离,对提取的I帧进行聚类;针对每一聚类,分别确定该聚类中包含的每一I帧的信息熵;从每一聚类中,提取信息熵最大的I帧组成所述待分析视频的关键帧。
-
公开(公告)号:CN119580333B
公开(公告)日:2025-05-02
申请号:CN202510127478.9
申请日:2025-01-27
Applicant: 中国科学院自动化研究所
Abstract: 本公开关于人脸图像鉴伪模型的训练方法、人脸图像鉴伪方法和装置,包括:提取训练样本图像中多个类型的指定特征;将多个类型的指定特征进行拼接;将指定拼接特征分别输入多个特征提取模块;利用每个特征提取模块输出的模型提取特征进行融合;将融合特征输入全连接层以预测训练样本图像的真伪;基于真实类别标签、预测结果和融合特征,计算损失;通过根据损失调整每个特征提取模块的参数。这样,通过预先从不同角度设计有针对性的指定特征,可以实现提高特征提取的全面性和丰富性。另外,还可以通过综合不同特征提取模块的优势来提高特征表示的鲁棒性和多样性,从而可以更好地应对复杂和多变的鉴伪场景。
-
公开(公告)号:CN119399029B
公开(公告)日:2025-04-08
申请号:CN202510013541.6
申请日:2025-01-06
Applicant: 中国科学院自动化研究所
IPC: G06T3/4053 , G06N3/084 , G06N3/0895
Abstract: 本发明公开了一种基于解耦对比学习的隐式图像退化估计方法,属于图像盲超分辨率技术领域,所述方法采样具有相同退化信息的不同LR图像中的图块来构建正样本集合,在数据层面保障了内容、纹理等任务无关信息不会影响退化特征学习,同时,通过不断地循环配对采样图块来实现数据扩增;在训练过程中引入特征增强策略增加相同退化类型的正样本数量,从而在训练过程中进一步扩展每个退化类别的样本多样性,以保障网络更充分的学习退化信息。将利用本发明训练的隐式图像退化估计器应用于基于隐式退化特征引导的盲图像超分辨率网络,可以有效提升LR图像的退化信息建模质量,进而改善LR图像到HR图像的重建效果。
-
公开(公告)号:CN119339100A
公开(公告)日:2025-01-21
申请号:CN202411371157.5
申请日:2024-09-29
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
IPC: G06V10/44 , G06V10/764 , G06V10/80 , G06N3/045 , G06N3/0464 , G06N3/049
Abstract: 本发明涉及神经网络技术领域,公开了一种基于SNN信息补充的图像识别方法、装置、设备及介质,该方法包括:获取目标图像,并输入图像识别模型中的脉冲神经网络和卷积神经网络,进行特征提取并前向传播;在每个对应处理阶段,对脉冲神经网络和卷积神经网络中当前处理阶段各自对应的输入特征进行处理,得到第一特征和第二特征,将其合并为第三特征,将第三特征和第二特征分别输出至脉冲神经网络和卷积神经网络的下一处理阶段;当脉冲神经网络的最后的处理阶段得到目标特征后,通过其全连接层基于目标特征确定目标图像的分类结果,本发明通过卷积神经网络为脉冲神经网络每个阶段提取的特征提供补充特征,从而提高脉冲神经网络的图像处理性能。
-
公开(公告)号:CN119169045A
公开(公告)日:2024-12-20
申请号:CN202411283206.X
申请日:2024-09-12
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
Abstract: 本公开提供一种基于类脑脉冲的光流估计方法、装置、介质和计算机设备。光流估计方法包括:获取事件相机数据和帧相机数据;通过脉冲神经网络从事件相机数据提取第一特征;通过卷积神经网络从帧相机数据提取第二特征;拼接第一特征和第二特征,以获得第三特征并且利用残差网络对第三特征进行转换,以获得转换特征;利用光流细化网络对转换特征、脉冲神经网络的除了输出层之外的至少一层提取的特征和卷积神经网络的除了输出层之外的至少一层提取的特征进行光流细化,以生成光流场。
-
公开(公告)号:CN118520153B
公开(公告)日:2024-12-06
申请号:CN202410972733.5
申请日:2024-07-19
Applicant: 中国科学院自动化研究所
IPC: G06F16/903 , G06N3/0455 , G06N3/08
Abstract: 本发明提供一种NFT跨模态检索方法、装置及存储介质,涉及电数字数据处理技术领域,所述方法包括:获取用于检索的语义信息;将所述语义信息输入至NFT跨模态检索模型中,基于置信累加两阶段搜索算法获取与语义信息最为匹配的NFT检索结果,所述NFT跨模态检索模型是基于动态组件差分训练得到的。本发明提供的NFT跨模态检索方法、装置及存储介质,可以根据动态组件差分训练得到NFT跨模态检索模型,然后根据NFT跨模态检索模型通过置信累加两阶段搜索算法,从而能够根据用户输入的语义信息输出与之最为匹配的检索结果,可以提高NFT图像的检索精度。
-
-
-
-
-
-
-
-
-