ISP参数预测方法及装置
    21.
    发明公开

    公开(公告)号:CN117058023A

    公开(公告)日:2023-11-14

    申请号:CN202310967661.0

    申请日:2023-08-02

    Abstract: 本发明提供一种ISP参数预测方法及装置,该方法包括:将待处理RAW图像输入特征提取器中,得到第一特征矩阵;将第一特征矩阵输入自注意力层,得到自注意力层输出的注意力图,将注意力图输入多尺度Swin Transformer模型,得到第二特征矩阵;将第二特征矩阵输入第一分支和第二分支,得到待处理RAW图像中每个像素对应的ISP参数最优值和置信分数;将像素对应的ISP参数最优值和置信分数相乘后计算平均值,得到待处理RAW图像对应的ISP参数最优值。本发明对任意RAW图像均可自动预测最优ISP参数,且预测参数适用于全局图像,提高成像质量和效率。

    视频特征提取方法、装置及电子设备

    公开(公告)号:CN115311595B

    公开(公告)日:2023-11-03

    申请号:CN202210771422.3

    申请日:2022-06-30

    Abstract: 本发明提供一种视频特征提取方法、装置及电子设备,涉及视频处理技术领域,可以应用于视频特征提取的场景。该视频特征提取方法包括:获取视频图像和视频图像对应的音频数据;将音频数据转换为声谱图,得到声谱图像;将视频图像和声谱图像输入至视频特征提取模型,得到视频特征提取模型输出的视频特征;其中,视频特征提取模型是基于样本视频数据和对偶式对比学习模型对基础神经网络模型进行预训练得到的,对偶式对比学习模型用于对样本视频数据经基础神经网络模型处理后输出的第一多模态样本特征矩阵分别进行行维度和列维度上的对比学习。本发明提供的技术方案可以提高视频特征提取的准确性和泛化性。

    基于各向异性卷积的图像分类方法及系统

    公开(公告)号:CN111126494B

    公开(公告)日:2023-09-26

    申请号:CN201911360305.2

    申请日:2019-12-25

    Abstract: 本发明涉及深度学习与图像分类领域,具体涉及一种基于各向异性卷积的图像分类方法及系统,目的在于解决当图像分辨率低、物体尺度和形态多变等情况下难以保证物体分类识别的精度的问题。本发明的图像分类方法包括:步骤A1,根据设定的标准图像大小,将训练图像与待分类图像都进行预处理;步骤A2,利用利用损失函数与预处理后的训练样本对神经网络进行训练优化,其中,神经网络包括各向异性卷积层;步骤A3,利用训练好的神经网络对预处理后的待分类图像进行特征提取与图像分类。本发明的神经网络能快速提取判别性特征因子,准确锁定图像中的物体轮廓,较好应对小图像、多形变等分类难题,从而充分挖掘了图像的空间信息,提高了物体分类的准确度。

    人体行为识别方法、装置、电子设备及可读存储介质

    公开(公告)号:CN115909479A

    公开(公告)日:2023-04-04

    申请号:CN202211289157.1

    申请日:2022-10-20

    Abstract: 本发明提供一种人体行为识别方法、装置、电子设备及可读存储介质,其中人体行为识别方法包括:从压缩视频数据中提取压缩域信息,压缩域信息中包括多个I帧、残差以及运动矢量;将各I帧及各目标残差所对应的深层特征进行融合处理,得到各I帧对应的局部时空特征;将相邻两个局部时空特征进行融合处理,得到压缩视频数据对应的全局时空特征;基于全局时空特征、运动矢量及残差,确定压缩视频数据对应的目标特征,并基于目标特征确定压缩视频数据对应的人体行为识别结果。通过将各I帧及各目标残差进行融合,能得到表达能力更强的局部时空特征以及全局时空特征,基于全局时空特征、运动矢量及残差进行人体行为识别,能够提高人体行为识别的准确率。

    基于多阶段预训练的无参考图像质量检测方法及系统

    公开(公告)号:CN115908307A

    公开(公告)日:2023-04-04

    申请号:CN202211427497.6

    申请日:2022-11-15

    Abstract: 本发明属于图像处理领域,具体涉及一种基于多阶段预训练的无参考图像质量检测方法及系统。本发明方法包括顺次通过第一特征提取器、第二特征提取器对待检测图像进行特征提取,获取图像特征;所述第一特征提取器为图像复原网络中的编码器,所述第二特征提取器为多个并行设置的结构一致的特征提取子网络,基于不同IQA数据集采用图像质量评估方法进行整体训练后获取;依据所述图像特征,通过图像质量检测网络,得到第二检测结果;所述图像质量检测网络基于跨数据集质量检测相关性和自注意力机制构建。本发明提高了对不同类别图像进行质量检测时准确性、泛化性。

    一种分类模型训练方法、装置及设备

    公开(公告)号:CN115795355A

    公开(公告)日:2023-03-14

    申请号:CN202310095677.7

    申请日:2023-02-10

    Abstract: 本发明实施例涉及人工智能领域,公开了一种分类模型训练方法、装置及设备。本发明实施例涉及的分类模型训练方法,其特征在于,所述方法包括:获取待训练样本集进行特征提取,得到第一特征向量,计算得到原型特征向量;调用预设的损失调节器针对待训练的分类模型对应的损失函数进行参数调整,得到目标分类模型。这样,可以在模型训练过程中,基于当前学习结果及时施加相应的策略调整,提高了分类模型在小样本学习环境中训练的准确性,进而提高了训练后模型进行分类作业的正确率。

    目标对象的检测方法、装置、电子设备及存储介质

    公开(公告)号:CN113870254B

    公开(公告)日:2022-03-15

    申请号:CN202111440333.2

    申请日:2021-11-30

    Abstract: 本发明实施例公开了一种目标对象的检测方法、装置、电子设备及存储介质。该方法包括:根据待检测图像生成第一图像和第二图像,第一图像和第二图像的尺寸不同,第一图像和第二图像中的至少一个图像由待检测图像等比缩放得到,采用第一子模型检测第一图像,分别得到至少一类目标对像的第一子特征,以及采用第二子模型检测第二图像,分别得到至少一类目标对像的第二子特征,第一子模型与第二子模型是预训练的检测模型中相同的子模型,分别融合各类目标对像的第一子特征和第二子特征得到相应类的目标对像在待检测图像中的特征,实现了对待检测图像的整体轮廓和目标对象的同时检测,从而提高了目标对象检测方法检测的性能。

    面向压缩域的视频敏感人物识别方法、系统及设备

    公开(公告)号:CN112990273B

    公开(公告)日:2021-12-21

    申请号:CN202110190037.5

    申请日:2021-02-18

    Abstract: 本发明属于图像识别领域,具体涉及了一种面向压缩域的视频敏感人物识别方法、系统、设备,旨在解决现有的敏感人物识别方法低效和浪费资源的问题。本发明包括:对待检测视频部分解码获取压缩域多模态信息,将压缩域多模态信息进行检测和校准,将校准后的压缩域人脸多模态信息通过训练好的多模态人脸识别网络获取多模态人脸特征,将多模态人脸特征与敏感人脸特征库进行比对,确认是否存在敏感人脸。其中,压缩域人脸多模态信息通过I分支、MV分支和Res分支分别提取不同的特征再进行多模态特征融合得到唯一的多模态人脸特征。本发明只需要进行部分解码就能完成特征提取,解决了现有技术低效和资源浪费的问题,同时保有较高的识别精度。

    基于图卷积网络的人体骨架行为识别方法、系统、装置

    公开(公告)号:CN110222611B

    公开(公告)日:2021-03-02

    申请号:CN201910446596.0

    申请日:2019-05-27

    Abstract: 本发明属于计算机视觉及深度学习领域,具体涉及了一种基于图卷积网络的人体骨架行为识别方法、系统、装置,旨在解决基于图卷积神经网络的人体骨架行为识别结果精度不高的问题。本发明方法包括:获取骨架视频帧并归一化;构建每一帧图对应的人体关节自然连接图;学习非自然连接边,获得人体关节连接图;为人体关节连接图各条边分配权重值;进行图卷积操作,获得骨架序列的空间信息;在时间维度上进行卷积操作,获得骨架序列的行为类别。本发明自然连接边能够学习到基本的人体行为特征,同时非自然连接边可以学习到附加的行为特征,通过自然连接边和非自然连接边共同构成一张图,可以更加充分的表征人体运动信息,提高识别性能。

Patent Agency Ranking