-
公开(公告)号:CN115631115A
公开(公告)日:2023-01-20
申请号:CN202211569108.3
申请日:2022-12-08
Applicant: 中国科学院自动化研究所
IPC: G06T5/00 , G06T3/40 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于递归Transformer的动态图像复原方法,涉及图像处理技术领域,该方法包括:获取待处理的图像;对所述待处理的图像进行预处理,得到第一图像;将所述第一图像输入至图像复原模型,得到所述图像复原模型输出的目标图像;所述目标图像的分辨率高于所述待处理图像的分辨率,所述图像复原模型是基于样本第一图像和所述样本第一图像的标签数据进行训练得到的,用于对所述第一图像进行复原。本发明提供的方法,通过图像复原模型实现了待处理的图像复原为高分辨率的目标图像,提升了图像复原的质量和效率。
-
公开(公告)号:CN106650737B
公开(公告)日:2020-02-28
申请号:CN201611041091.9
申请日:2016-11-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种图像自动裁剪方法。该方法包括:提取待裁剪图像的美感响应图和梯度能量图;对待裁剪图像密集提取候选裁剪图像;基于美感响应图,筛选候选裁剪图像;基于美感响应图和梯度能量图,估计筛选出的候选裁剪图像的构图分数,并将得分最高的候选裁剪图像确定为裁剪图像。本方案利用美感响应图去探究图片的美感影响区域,利用美感响应图确定美感保留部分,从而更加最大程度地保留了裁剪图像的高美感质量,同时本方案还利用梯度能量图去分析梯度分布规则,并且基于美感响应图和梯度能量图来评估裁剪图的构图分数。本发明实施例弥补了图像构图表达的缺陷,解决了如何提高图像自动裁剪的鲁棒性和精度的技术问题。
-
公开(公告)号:CN108932693A
公开(公告)日:2018-12-04
申请号:CN201810623739.6
申请日:2018-06-15
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于数字图像处理领域,具体涉及一种基于人脸几何信息的人脸编辑补全方法及装置,旨在解决解决如何实现缺失人脸图片的精确补全与属性编辑的技术问题。为此目的,本发明中的基于人脸几何信息的人脸编辑补全方法包括:基于预先构建的人脸几何估计模型并利用包含遮挡区域的目标人脸图像,获得人脸几何信息;基于预先构建的人脸补全网络模型并利用目标人脸图像与人脸几何信息,生成第一完整人脸图像;将第一完整人脸图像中的特定区域替换为目标人脸图像中的未遮挡区域,并对第一完整人脸图像与未遮挡区域进行图像融合,得到第二完整人脸图像。基于本发明的方法可以精确地补全和编辑缺失人脸图片。
-
公开(公告)号:CN106548159A
公开(公告)日:2017-03-29
申请号:CN201610982333.8
申请日:2016-11-08
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/00288 , G06K9/00248 , G06K9/00268 , G06K9/6256 , G06K9/6265 , G06N3/084
Abstract: 本发明公开了一种基于全卷积神经网络的网纹人脸图像识别方法与装置。该方法包括:收集网纹人脸图像和对应的清晰人脸图像对,并利用这些图像对训练一个用于从网纹图像中恢复清晰人脸图像(去网纹)的全卷积神经网络。识别时,将网纹人脸图像输入到训练好的去网纹模型中,得到清晰人脸图像用来进行后续的人脸识别任务。本发明采用了全卷积神经网络作为学习框架的主体,利用其具有更大视觉感受野和更快运算速度的特点。在训练目标函数设计上,结合像素级别的重建损失以及人脸特征级别的重建损失,搭配使用空间变换模块在网络中进行人脸区域的精确对准以实现人脸区域特征的准确提取。发明所采用的方法不仅能有效从网纹图像中恢复出清晰人脸图像,并且能够在恢复过程中保持人脸特征相对稳定,可以大幅度提高网纹人脸图像的识别准确率。
-
公开(公告)号:CN106250829A
公开(公告)日:2016-12-21
申请号:CN201610586767.6
申请日:2016-07-22
Applicant: 中国科学院自动化研究所
IPC: G06K9/00
CPC classification number: G06K9/00335
Abstract: 本发明公开了一种基于唇部纹理结构的数字识别方法,该方法包括:利用深度学习中卷积神经网络较强的特征提取能力以及长短时记忆网络对时序信息的处理能力,通过卷积神经网络和长短时记忆网络根据视频中对象的唇部运动识别数字。该方法对唇部图像的类内差异,头部姿势变化和非控制环境下的光照变化有较强的鲁棒性,有效地解决了唇语识别技术在交互式活体检测中识别精度不高的问题。该方法可被广泛应用于配有分辨率较高的摄像头的场景,如:中国金融系统的交互式活体检测等。
-
公开(公告)号:CN105760859A
公开(公告)日:2016-07-13
申请号:CN201610165633.7
申请日:2016-03-22
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/00288 , G06N3/02
Abstract: 本发明公开了一种基于多任务卷积神经网络的网纹人脸图像识别方法及装置。该方法包括:收集网纹人脸图像和对应的清晰人脸图像对,然后利用多任务卷积神经网络,分别设计基于回归和分类的目标函数,训练一个人脸去网纹模型,最后将网纹人脸图像输入到训练好的去网纹模型中,得到去网纹的人脸图像,从而进行后续的人脸识别任务。本发明采用了多任务学习的框架,将由网纹图像恢复清晰图像的任务表达成两个互为辅助的目标函数,并利用卷积神经网络学习其中涉及到的复杂非线性变换。发明所采用的方法不仅有效提高了模型训练时的收敛速度,并能明显提升图像恢复的效果以及泛化能力,大幅度提高了网纹人脸图像的识别准确率。
-
公开(公告)号:CN104281845A
公开(公告)日:2015-01-14
申请号:CN201410594606.2
申请日:2014-10-29
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种基于旋转不变字典学习模型的人脸识别方法,包括:将训练集和测试集图像降采样并展成由列向量为单位构成的训练集矩阵;建立旋转不变字典学习模型,将训练集矩阵输入模型,使用交替迭代的方法对模型进行求解,不断优化目标函数,学习得到字典、分类器和对齐后的训练集图像;基于得到的词典对测试样本进行稀疏编码并通过稀疏编码系数求解对齐参数;对对齐后的测试图像进行稀疏编码,把稀疏编码系数带入线性分类器得到最终分类结果。本发明对字典学习在人脸识别中的应用提出了新的模型和方法,可以应用于一般的模式分类任务中,特别是无约束环境下的人脸识别问题。本发明提出的方法可以显著提高人脸识别的识别正确率。
-
公开(公告)号:CN116524557B
公开(公告)日:2024-06-14
申请号:CN202310138757.6
申请日:2023-02-10
Applicant: 中国科学院自动化研究所
IPC: G06V40/16 , G06V40/40 , G06N3/098 , G06V10/82 , G06V10/774 , G06V10/764 , G06N3/0464
Abstract: 本发明提供一种基于联邦学习的人脸伪造检测模型优化方法、装置及系统,涉及图像处理技术领域,该方法包括:根据多个客户端中上一次迭代训练后的基础参数集对上一次更新后的基础参数集进行更新,得到当前次更新后的基础参数集并发送至客户端,以供客户端根据当前次更新后的基础参数集和上一次迭代训练后的个性化层参数集在本地数据库中的人脸伪造训练数据集上,对人脸伪造检测模型进行优化,将优化后的人脸伪造检测模型的基础网络层的参数作为当前次迭代训练后的基础参数集;迭代执行上述训练过程,若满足预设终止条件,则获取最优的人脸伪造检测模型。本发明实现确保各客户端的人脸信息安全,提高人脸伪造检测模型的泛化性和检测性能。
-
公开(公告)号:CN116524557A
公开(公告)日:2023-08-01
申请号:CN202310138757.6
申请日:2023-02-10
Applicant: 中国科学院自动化研究所
IPC: G06V40/16 , G06V40/40 , G06N3/098 , G06V10/82 , G06V10/774 , G06V10/764 , G06N3/0464
Abstract: 本发明提供一种基于联邦学习的人脸伪造检测模型优化方法、装置及系统,涉及图像处理技术领域,该方法包括:根据多个客户端中上一次迭代训练后的基础参数集对上一次更新后的基础参数集进行更新,得到当前次更新后的基础参数集并发送至客户端,以供客户端根据当前次更新后的基础参数集和上一次迭代训练后的个性化层参数集在本地数据库中的人脸伪造训练数据集上,对人脸伪造检测模型进行优化,将优化后的人脸伪造检测模型的基础网络层的参数作为当前次迭代训练后的基础参数集;迭代执行上述训练过程,若满足预设终止条件,则获取最优的人脸伪造检测模型。本发明实现确保各客户端的人脸信息安全,提高人脸伪造检测模型的泛化性和检测性能。
-
公开(公告)号:CN115908144B
公开(公告)日:2023-06-02
申请号:CN202310215782.X
申请日:2023-03-08
Applicant: 中国科学院自动化研究所 , 中国电子科技集团公司电子科学研究院
IPC: G06T3/40 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于随机小波注意力的图像处理方法、装置、设备及介质,涉及数据处理技术领域,方法包括:获取待处理的图像作为初始输入图像;将初始输入图像输入至预先设置的卷积编码器,得到卷积编码器输出的高维特征;卷积编码器用于将初始输入图像中的特征转换为高维特征;将高维特征输入至预先设置的深层图像特征提取器,得到深层图像特征提取器输出的深层图像特征;深层图像特征提取器用于基于高维特征,通过小波变换方法提取初始输入图像中的深层图像特征;将高维特征和深层图像特征输入至预先设置的卷积解码器,得到卷积解码器输出的超分辨率后的高清图像;卷积解码器用于基于高维特征和深层图像特征,预测超分辨率后的高清图像。
-
-
-
-
-
-
-
-
-