-
公开(公告)号:CN111126494B
公开(公告)日:2023-09-26
申请号:CN201911360305.2
申请日:2019-12-25
Applicant: 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 本发明涉及深度学习与图像分类领域,具体涉及一种基于各向异性卷积的图像分类方法及系统,目的在于解决当图像分辨率低、物体尺度和形态多变等情况下难以保证物体分类识别的精度的问题。本发明的图像分类方法包括:步骤A1,根据设定的标准图像大小,将训练图像与待分类图像都进行预处理;步骤A2,利用利用损失函数与预处理后的训练样本对神经网络进行训练优化,其中,神经网络包括各向异性卷积层;步骤A3,利用训练好的神经网络对预处理后的待分类图像进行特征提取与图像分类。本发明的神经网络能快速提取判别性特征因子,准确锁定图像中的物体轮廓,较好应对小图像、多形变等分类难题,从而充分挖掘了图像的空间信息,提高了物体分类的准确度。
-
公开(公告)号:CN111062885B
公开(公告)日:2023-09-12
申请号:CN201911252628.X
申请日:2019-12-09
Applicant: 中国科学院自动化研究所
IPC: G06T5/00 , G06N3/096 , G06N3/0464
Abstract: 本发明属于计算机视觉领域,具体涉及一种基于多阶段迁移学习的标志检测模型训练及标志检测方法、系统、装置,旨在解决现有标志检测模型因标志样本较少导致检测准确率低的问题。本系统模型训练方法包括基于ImageNet数据集中选取的样本对标志检测模型进行预训练,得到第一模型;基于合成标志样本对第一模型进行微调训练,得到第二模型;基于真实标志样本对第二模型进行训练,得到第三模型;并将第三模型作为训练好的标志检测模型;检测方法包括获取待检测的标志图像;通过上述模型训练方法获取的标志检测模型对标志图像进行目标标志检测。本发明增加了标志样本的数量,提高了标志检测模型检测的准确率。
-
公开(公告)号:CN112861652B
公开(公告)日:2023-04-28
申请号:CN202110076328.1
申请日:2021-01-20
Applicant: 中国科学院自动化研究所
IPC: G06V10/774 , G06V20/40 , G06V10/82 , G06N3/0464
Abstract: 本发明属于视频目标跟踪与分割领域,具体涉及了一种基于卷积神经网络的视频目标跟踪与分割方法及系统,旨在解决现有图像检测方法难以实现大规模视频的多目标跟踪与分割的问题。本发明包括:对输入视频进行目标检测、分割、图像裁剪等图像预处理操作;通过多种数据组织方式对视频跟踪进行训练,分别是预训练、迁移学习和精细训练,使得卷积神经网络具备对复杂场景的适应能力,同时,利用视频检测结果进行不断的初始化以及重新初始化;通过重分类器对视频目标轨迹进行重新的类别判断与打分,获得输入视频各设定类别目标的分类结果。本发明在保证效率的前提下,实现了大规模视频中高精度、高准确性的像素级多目标跟踪与分割。
-
公开(公告)号:CN115909479A
公开(公告)日:2023-04-04
申请号:CN202211289157.1
申请日:2022-10-20
Applicant: 中国科学院自动化研究所
IPC: G06V40/20 , G06V10/764 , G06V10/80 , G06V10/82 , G06V20/40
Abstract: 本发明提供一种人体行为识别方法、装置、电子设备及可读存储介质,其中人体行为识别方法包括:从压缩视频数据中提取压缩域信息,压缩域信息中包括多个I帧、残差以及运动矢量;将各I帧及各目标残差所对应的深层特征进行融合处理,得到各I帧对应的局部时空特征;将相邻两个局部时空特征进行融合处理,得到压缩视频数据对应的全局时空特征;基于全局时空特征、运动矢量及残差,确定压缩视频数据对应的目标特征,并基于目标特征确定压缩视频数据对应的人体行为识别结果。通过将各I帧及各目标残差进行融合,能得到表达能力更强的局部时空特征以及全局时空特征,基于全局时空特征、运动矢量及残差进行人体行为识别,能够提高人体行为识别的准确率。
-
公开(公告)号:CN115908307A
公开(公告)日:2023-04-04
申请号:CN202211427497.6
申请日:2022-11-15
Applicant: 中国科学院自动化研究所
IPC: G06T7/00 , G06T5/00 , G06N3/0464 , G06N3/08 , G06V10/77 , G06V10/774
Abstract: 本发明属于图像处理领域,具体涉及一种基于多阶段预训练的无参考图像质量检测方法及系统。本发明方法包括顺次通过第一特征提取器、第二特征提取器对待检测图像进行特征提取,获取图像特征;所述第一特征提取器为图像复原网络中的编码器,所述第二特征提取器为多个并行设置的结构一致的特征提取子网络,基于不同IQA数据集采用图像质量评估方法进行整体训练后获取;依据所述图像特征,通过图像质量检测网络,得到第二检测结果;所述图像质量检测网络基于跨数据集质量检测相关性和自注意力机制构建。本发明提高了对不同类别图像进行质量检测时准确性、泛化性。
-
公开(公告)号:CN115795355A
公开(公告)日:2023-03-14
申请号:CN202310095677.7
申请日:2023-02-10
Applicant: 中国科学院自动化研究所 , 人民中科(济南)智能技术有限公司
IPC: G06F18/24 , G06F18/214 , G06F18/22
Abstract: 本发明实施例涉及人工智能领域,公开了一种分类模型训练方法、装置及设备。本发明实施例涉及的分类模型训练方法,其特征在于,所述方法包括:获取待训练样本集进行特征提取,得到第一特征向量,计算得到原型特征向量;调用预设的损失调节器针对待训练的分类模型对应的损失函数进行参数调整,得到目标分类模型。这样,可以在模型训练过程中,基于当前学习结果及时施加相应的策略调整,提高了分类模型在小样本学习环境中训练的准确性,进而提高了训练后模型进行分类作业的正确率。
-
公开(公告)号:CN112001345B
公开(公告)日:2022-09-20
申请号:CN202010893758.8
申请日:2020-08-31
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种基于特征变换度量网络的少样本人体行为识别方法及系统,包括:对多个原始视频进行特征图提取,得到各原始视频的空间特征图;并划分成支持特征图和查询特征图;根据支持特征图和查询特征图,得到变换支持特征图和变换查询特征图;进而得到特征度量距离;根据特征度量距离及查询视频的行为类别,建立识别模型;根据识别模型及待识别视频,确定待识别视频对应的行为类别。本发明基于特征变换网络,通过将特征转移到行为类别中心的偏移位置,能够减小特征类内距离及增大特征类间差异,极大地减小分类难度;并进一步基于特征度量网络,可提高特征度量的精确度,从而可提高少样本人体行为识别精度。
-
公开(公告)号:CN113870254B
公开(公告)日:2022-03-15
申请号:CN202111440333.2
申请日:2021-11-30
Applicant: 中国科学院自动化研究所 , 人民中科(济南)智能技术有限公司
IPC: G06T7/00 , G06V10/25 , G06V10/774 , G06K9/62
Abstract: 本发明实施例公开了一种目标对象的检测方法、装置、电子设备及存储介质。该方法包括:根据待检测图像生成第一图像和第二图像,第一图像和第二图像的尺寸不同,第一图像和第二图像中的至少一个图像由待检测图像等比缩放得到,采用第一子模型检测第一图像,分别得到至少一类目标对像的第一子特征,以及采用第二子模型检测第二图像,分别得到至少一类目标对像的第二子特征,第一子模型与第二子模型是预训练的检测模型中相同的子模型,分别融合各类目标对像的第一子特征和第二子特征得到相应类的目标对像在待检测图像中的特征,实现了对待检测图像的整体轮廓和目标对象的同时检测,从而提高了目标对象检测方法检测的性能。
-
公开(公告)号:CN112990273B
公开(公告)日:2021-12-21
申请号:CN202110190037.5
申请日:2021-02-18
Applicant: 中国科学院自动化研究所
IPC: G06K9/62 , G06K9/00 , G06N3/02 , G06N3/08 , G06F16/951
Abstract: 本发明属于图像识别领域,具体涉及了一种面向压缩域的视频敏感人物识别方法、系统、设备,旨在解决现有的敏感人物识别方法低效和浪费资源的问题。本发明包括:对待检测视频部分解码获取压缩域多模态信息,将压缩域多模态信息进行检测和校准,将校准后的压缩域人脸多模态信息通过训练好的多模态人脸识别网络获取多模态人脸特征,将多模态人脸特征与敏感人脸特征库进行比对,确认是否存在敏感人脸。其中,压缩域人脸多模态信息通过I分支、MV分支和Res分支分别提取不同的特征再进行多模态特征融合得到唯一的多模态人脸特征。本发明只需要进行部分解码就能完成特征提取,解决了现有技术低效和资源浪费的问题,同时保有较高的识别精度。
-
公开(公告)号:CN110222611B
公开(公告)日:2021-03-02
申请号:CN201910446596.0
申请日:2019-05-27
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于计算机视觉及深度学习领域,具体涉及了一种基于图卷积网络的人体骨架行为识别方法、系统、装置,旨在解决基于图卷积神经网络的人体骨架行为识别结果精度不高的问题。本发明方法包括:获取骨架视频帧并归一化;构建每一帧图对应的人体关节自然连接图;学习非自然连接边,获得人体关节连接图;为人体关节连接图各条边分配权重值;进行图卷积操作,获得骨架序列的空间信息;在时间维度上进行卷积操作,获得骨架序列的行为类别。本发明自然连接边能够学习到基本的人体行为特征,同时非自然连接边可以学习到附加的行为特征,通过自然连接边和非自然连接边共同构成一张图,可以更加充分的表征人体运动信息,提高识别性能。
-
-
-
-
-
-
-
-
-