-
公开(公告)号:CN102043967A
公开(公告)日:2011-05-04
申请号:CN201010592894.X
申请日:2010-12-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明是一种有效的运动目标行为建模与识别方法,包括步骤1:用特征提取模块提取运动目标行为的局部特征,再提取运动目标行为的运动特征;步骤2:采用子空间学习的方法,用特征融合模块对提取的局部特征和运动特征进行融合,并对特征空间进行降维;步骤3:采用原型学习算法和测度学习算法相结合,用行为识别模块对运动目标行为进行识别,对识别的运动目标行为做出评判。本发明对局部特征和运动特征进行特征融合处理,降低了特征空间的维度,提高了特征表达的鲁棒性,具有低存储和低计算复杂度的特点,同时具有较好的分类识别性能。本发明可以用来对公共安全领域的异常行为进行智能监控,一旦发现异常行为发生,立刻报警。
-
公开(公告)号:CN101470897B
公开(公告)日:2011-04-20
申请号:CN200710304206.3
申请日:2007-12-26
Applicant: 中国科学院自动化研究所
IPC: G06T7/00
Abstract: 本发明是一种基于音视频融合策略的敏感视频检测方法,包括步骤:建立敏感声音的混合高斯模型,音频数据的分离、加窗、以及特征提取,敏感声音片段的定位及其敏感程度输出,敏感片断视频图像帧的检测,基于贝叶斯的音视频融合决策等。本发明结合了音频和视频两个模态的信息来过滤敏感视频,大大降低了采用单一模态可能出现的不确定性,显著提高了识别效率。本发明可以用来检测互联网上的视频流以及音像制品中是否包含敏感内容,亦可以用来对网络视频聊天室进行监控,一旦发现色情表演即进行阻断。
-
公开(公告)号:CN101751554A
公开(公告)日:2010-06-23
申请号:CN200810239326.4
申请日:2008-12-10
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种对互联网大麻图像进行的过滤方法,包括步骤:利用尺度不变特征变换算法提取图像的局部特征;对每一个大麻训练图像的每一个局部特征构造一个自相似性弱分类器;自相似性弱分类器考察任意一幅测试图像是否与此自相似性弱分类器的局部特征所在的大麻图像相似及自相似程度是否足够;如果一幅测试图像既与此自相似性弱分类器的局部特征所在的大麻图像相似,又有足够的自相似性;将自相似性弱分类器整合到一起,构造一个强分类器对一幅图像的所有局部特征判断此图像是否为大麻图像。本发明采用自相似性弱分类器,克服现有技术物体识别方法中无法考虑图像内部相似关系的缺点,从而有效地抓住大麻图像的特点。
-
公开(公告)号:CN101470897A
公开(公告)日:2009-07-01
申请号:CN200710304206.3
申请日:2007-12-26
Applicant: 中国科学院自动化研究所
IPC: G06T7/00
Abstract: 本发明是一种基于音视频融合策略的敏感视频检测方法,包括步骤:建立敏感声音的混合高斯模型,音频数据的分离、加窗、以及特征提取,敏感声音片段的定位及其敏感程度输出,敏感片断视频图像帧的检测,基于贝叶斯的音视频融合决策等。本发明结合了音频和视频两个模态的信息来过滤敏感视频,大大降低了采用单一模态可能出现的不确定性,显著提高了识别效率。本发明可以用来检测互联网上的视频流以及音像制品中是否包含敏感内容,亦可以用来对网络视频聊天室进行监控,一旦发现色情表演即进行阻断。
-
公开(公告)号:CN1941850A
公开(公告)日:2007-04-04
申请号:CN200510108137.X
申请日:2005-09-29
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及计算机视觉技术领域,一种在多摄像机下基于主轴匹配的行人跟踪方法,包括步骤:对序列图像进行运动检测;提取人的主轴特征;进行单摄像机下的跟踪;依据主轴匹配函数建立主轴匹配对;融合多视角信息对跟踪结果进行优化更新。本发明提出了一种新型的多摄像机匹配技术,克服了传统多摄像机匹配方法需要定标、采用特征易受噪声与视角因素的影响、依赖于准确分割算法的缺点,具有很好的应用前景。
-
公开(公告)号:CN1508755A
公开(公告)日:2004-06-30
申请号:CN02157117.1
申请日:2002-12-17
Applicant: 中国科学院自动化研究所
Abstract: 一种敏感视频检测方法,包括步骤:选择关键视频帧;检测皮肤的存在;确定关键帧是否敏感;计算敏感帧分布密度,如果敏感帧分布密度超过阈值,则判为敏感视频。本发明能够有效防止用户从互联网观看敏感视频信息。一旦用户点击网页上的视频链接,该软件能自动下载视频,并且在播放过程中检测视频的敏感性。当播放到视频的敏感信息部分时,自动终止对视频的播放。本发明还能以直方图的方式表示出视频的每一关键帧的敏感程度。
-
公开(公告)号:CN119941551A
公开(公告)日:2025-05-06
申请号:CN202411972412.1
申请日:2024-12-30
Applicant: 支付宝(杭州)信息技术有限公司 , 中国科学院自动化研究所
Abstract: 本说明书实施例提供一种图像生成方法、装置、设备与存储介质,该方法包括:通过在图像去噪过程中将时间步分为完整推理步和缓存修剪步,在缓存修剪步,修剪一部分图像单元,采用缓存图像特征进行替代,减少了对图像单元的推理次数,解决了图像生成模型推理过程中由于图像单元数量多并且需要进行多次推理导致的冗余计算问题,从而提高了图像生成模型的推理速度,同时结合完整推理步减少由于缓存引入的误差,平衡加速效果和生成质量。
-
公开(公告)号:CN119360893B
公开(公告)日:2025-05-06
申请号:CN202411523922.0
申请日:2024-10-29
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
Abstract: 本公开关于声音分类方法、装置、电子设备、存储介质和计算机程序产品,包括:提取待分类的声音信号的音频特征;将音频特征输入脉冲残差模块,获得第一脉冲残差特征;将第一脉冲残差特征输入至少一个脉冲残差模块,获得第二脉冲残差特征;将第二脉冲残差特征以及经过下采样后的第一脉冲残差特征输入注意力特征融合模块,获得第一注意力融合特征;基于第一注意力融合特征,对待分类的声音信号进行分类。本公开可以充分利用脉冲神经网络(SNN)和残差神经网络的优势,可以实现高效、准确的进行声音分类,并可以显著降低系统功耗。
-
公开(公告)号:CN119600635A
公开(公告)日:2025-03-11
申请号:CN202411552965.1
申请日:2024-11-01
Applicant: 中国科学院自动化研究所
IPC: G06V30/422 , G06N5/022 , G06Q50/08 , G06F40/279
Abstract: 本发明提供一种基于知识图谱的智能审图方法和装置,其中方法包括:对轨道交通领域中待审核的工程图纸进行解析,得到工程图纸中的待审核信息,待审核信息包括图形、文字,以及图形和文字的对应关系;基于轨道交通知识图谱,以及待审核信息,对工程图纸进行图纸审核,得到工程图纸的图纸审核结果;轨道交通知识图谱基于轨道交通领域下的专家审图经验,以及工程执行标准和/或工程制图规范构建得到,克服了传统方案中人工审图周期长、效率低,以及通用的审图方法不适用于轨道交通领域下的图纸,审图效果不佳的缺陷,不仅保证了审图的精准度和有效性,还极大地提升了审图效率,为轨道交通领域工程建设的安全与质量提供保障。
-
公开(公告)号:CN119580333A
公开(公告)日:2025-03-07
申请号:CN202510127478.9
申请日:2025-01-27
Applicant: 中国科学院自动化研究所
Abstract: 本公开关于人脸图像鉴伪模型的训练方法、人脸图像鉴伪方法和装置,包括:提取训练样本图像中多个类型的指定特征;将多个类型的指定特征进行拼接;将指定拼接特征分别输入多个特征提取模块;利用每个特征提取模块输出的模型提取特征进行融合;将融合特征输入全连接层以预测训练样本图像的真伪;基于真实类别标签、预测结果和融合特征,计算损失;通过根据损失调整每个特征提取模块的参数。这样,通过预先从不同角度设计有针对性的指定特征,可以实现提高特征提取的全面性和丰富性。另外,还可以通过综合不同特征提取模块的优势来提高特征表示的鲁棒性和多样性,从而可以更好地应对复杂和多变的鉴伪场景。
-
-
-
-
-
-
-
-
-