-
公开(公告)号:CN111612143B
公开(公告)日:2023-12-19
申请号:CN202010440475.8
申请日:2020-05-22
Applicant: 中国科学院自动化研究所
IPC: G06N3/082 , G06N3/084 , G06N3/0495 , G06N3/0464
Abstract: 本发明涉及一种深度卷积神经网络的压缩方法及系统,所述压缩方法包括:根据滤波器重要性选择方式和/或模型压缩率,确定待压缩深度卷积神经网络中不重要的滤波器;对不重要的滤波器施加渐进式稀疏约束,作为正则项加入到网络训练的损失函数中,得到优化损失函数;根据正则项,采用阈值迭代算法及反向传播算法联合求解,得到待压缩深度卷积神经网络的更新参数;基于所述优化损失函数及更新参数,获得具有滤波器稀疏形式的卷积神经网络模型;利用结构化剪枝算法,对所述具有滤波器稀疏形式的卷积神经网络模型进行剪枝,得到网络精度较高的压缩后的卷积神经网络模型。
-
公开(公告)号:CN115422399B
公开(公告)日:2023-10-31
申请号:CN202210869119.7
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
IPC: G06F16/783 , G06F16/78
Abstract: 本发明实施例提供一种视频搜索方法、装置、设备和存储介质,该方法包括:获取用户输入的搜索信息;根据搜索信息,从预设的多模态知识图谱中得到与搜索信息相关联的多模态信息;多模态信息包括搜索信息的扩展文本信息和视频特征信息;根据扩展文本信息和视频特征信息,基于搜索引擎确定目标视频。本发明实施例的方法通过多模态知识图谱,将用户的搜索信息扩展为更多模态的信息输入,进而基于扩展后的搜索信息,也就可以获得更加全面、更加准确的视频搜索结果,提升了视频搜索结果的准确性和全面性,解决了视频搜索过程中的误检和漏检问题。
-
公开(公告)号:CN110782019A
公开(公告)日:2020-02-11
申请号:CN201911029615.6
申请日:2019-10-28
Applicant: 中国科学院自动化研究所
IPC: G06N3/04
Abstract: 本发明属于人工智能领域,具体涉及一种基于分解和剪枝的卷积神经网络压缩方法、系统、装置,旨在解决采用低秩近似分解或结构化稀疏剪枝进行卷积神经网络压缩,导致压缩力度较小的问题。本系统方法包括将每个待压缩的卷积层后面添加一层系数矩阵表示层;通过低秩近似分解算法对系数矩阵表示层进行稀疏处理,并根据系数矩阵表示层稀疏的位置对对应的卷积层的滤波器进行剪枝处理;采用结构化稀疏剪枝方法对分解后的系数矩阵表示层进行稀疏处理,并根据系数矩阵表示层稀疏的位置对其滤波器进行剪枝处理;对稀疏剪枝处理后的卷积神经网络进行训练。本发明通过将低秩近似分解和结构化稀疏剪枝两种方法融合,解决了单一方法引起的缺陷,提高了压缩力度。
-
公开(公告)号:CN118296446A
公开(公告)日:2024-07-05
申请号:CN202410728250.0
申请日:2024-06-06
Applicant: 中国科学院自动化研究所
IPC: G06F18/24 , G06F18/22 , G06V10/762
Abstract: 本发明提供一种音视频内容风险识别方法、装置、电子设备和存储介质,属于多媒体内容安全识别领域,该方法包括:构建多模态特征推理模型;构建风险样例知识库,所述风险样例知识库中包含至少一个风险样例分别对应的多模态特征向量,所述至少一个风险样例分别属于至少一种风险类别;将待识别音视频输入所述多模态特征推理模型,获得所述待识别音视频的多模态特征向量;将所述待识别音视频的多模态特征向量与所述风险样例知识库中的多模态特征向量进行相似度计算,并基于相似度输出所述待识别音视频的风险类别,可以提高风险内容识别的精准率和召回率。
-
公开(公告)号:CN111612143A
公开(公告)日:2020-09-01
申请号:CN202010440475.8
申请日:2020-05-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种深度卷积神经网络的压缩方法及系统,所述压缩方法包括:根据滤波器重要性选择方式和/或模型压缩率,确定待压缩深度卷积神经网络中不重要的滤波器;对不重要的滤波器施加渐进式稀疏约束,作为正则项加入到网络训练的损失函数中,得到优化损失函数;根据正则项,采用阈值迭代算法及反向传播算法联合求解,得到待压缩深度卷积神经网络的更新参数;基于所述优化损失函数及更新参数,获得具有滤波器稀疏形式的卷积神经网络模型;利用结构化剪枝算法,对所述具有滤波器稀疏形式的卷积神经网络模型进行剪枝,得到网络精度较高的压缩后的卷积神经网络模型。
-
公开(公告)号:CN115422399A
公开(公告)日:2022-12-02
申请号:CN202210869119.7
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
IPC: G06F16/783 , G06F16/78
Abstract: 本发明实施例提供一种视频搜索方法、装置、设备和存储介质,该方法包括:获取用户输入的搜索信息;根据搜索信息,从预设的多模态知识图谱中得到与搜索信息相关联的多模态信息;多模态信息包括搜索信息的扩展文本信息和视频特征信息;根据扩展文本信息和视频特征信息,基于搜索引擎确定目标视频。本发明实施例的方法通过多模态知识图谱,将用户的搜索信息扩展为更多模态的信息输入,进而基于扩展后的搜索信息,也就可以获得更加全面、更加准确的视频搜索结果,提升了视频搜索结果的准确性和全面性,解决了视频搜索过程中的误检和漏检问题。
-
-
-
-
-