-
公开(公告)号:CN112686267A
公开(公告)日:2021-04-20
申请号:CN202110033687.9
申请日:2021-01-11
申请人: 北京三快在线科技有限公司
摘要: 本公开提供了一种图像语义分割方法及装置。包括:将待处理图像输入至图像识别模型;图像识别模型包括:短时密集连接网络层和解码网络层,短时密集连接网络层包括:卷积模块、多个短时密集连接层和输出模块,短时密集连接层包含多个短时密集连接模块;调用卷积模块对待处理图像进行处理得到待处理图像对应的第一特征图;调用短时密集连接层对第一特征图进行处理得到第二特征图;调用输出模块对第二特征图进行处理得到第三特征图;调用解码网络层对第三特征图进行上采样并向分割类别映射,得到通道数为分割类别数的第四特征图;根据第四特征图确定待处理图像对应的语义分割结果。本公开可以减少网络结构性冗余,提高图像语义分割性能和效率。
-
公开(公告)号:CN111814566A
公开(公告)日:2020-10-23
申请号:CN202010529860.X
申请日:2020-06-11
申请人: 北京三快在线科技有限公司 , 中国科学院自动化研究所
摘要: 本申请实施例公开了一种图像编辑方法、装置、电子设备及存储介质,该方法包括:获取待编辑人脸图像和与待编辑人脸图像中的目标属性区域对应的掩码图,并获取参考图像;根据掩码图,将待编辑人脸图像处理为缺失目标属性区域的缺失图像;通过第一编码器对缺失图像进行图像编码,得到缺失图像对应的缺失特征;通过第二编码器对参考图像进行图像编码,得到参考图像对应的参考特征;根据所述掩码图,通过注意力模型对所述缺失特征和参考特征进行融合,得到融合特征;通过解码器对所述融合特征进行图像解码,得到所述待编辑人脸图像和参考图像对应的目标图像。本申请实施例提高了人脸属性编辑的多样性,避免了对目标属性区域外无关区域的影响。
-
公开(公告)号:CN111738090A
公开(公告)日:2020-10-02
申请号:CN202010464193.1
申请日:2020-05-27
申请人: 北京三快在线科技有限公司
摘要: 本申请公开了一种行人重识别模型训练方法、装置及行人重识别方法、装置,所述行人重识别模型训练方法包括:利用行人重识别模型的卷积网络对行人图像进行特征提取,得到行人图像的原始特征;利用行人重识别模型的注意力模块对原始特征进行处理,得到多个行人局部特征;利用行人重识别模型的图神经网络,确定各行人局部特征之间的相似性矩阵,并根据相似性矩阵对各行人局部特征进行调整;基于调整后的行人局部特征确定行人识别结果及行人重识别模型的训练损失,根据训练损失对模型参数进行优化。通过本申请,在无需引入额外标注信息的情况下,能够自动抽取图像中重要的行人局部特征,使得最后的行人局部特征更具有判别力,模型识别性能也得到提升。
-
公开(公告)号:CN110415171A
公开(公告)日:2019-11-05
申请号:CN201910611797.1
申请日:2019-07-08
申请人: 北京三快在线科技有限公司
摘要: 本公开提供了一种图像处理方法、装置及存储介质、电子设备,涉及图像处理领域。首先通过对目标图像中的像素点进行特征信息交互;然后根据关键点识别模型对第二目标图像进行关键点识别,得到特征像素点集,其中,特征点像素集中包含有目标像素点及与目标像素点相邻的特征像素点;最后根据目标特征像素点集中的目标像素点及与目标像素点相邻的特征像素点的像素值及像素坐标,确定目标像素点的映射像素坐标,由于对于映射像素坐标的确定考虑了目标像素点及与所述目标像素点相邻的特征像素点的像素值及像素坐标,最终得到的映射像素坐标更加精确,实现了低分辨率的目标图像映射回高分辨率图像时,提高了高分辨率图像的精确度。
-
公开(公告)号:CN110069985A
公开(公告)日:2019-07-30
申请号:CN201910185907.2
申请日:2019-03-12
申请人: 北京三快在线科技有限公司
摘要: 本申请公开了一种基于图像的目标点位置检测方法,属于计算机技术领域,用于目标点位置检测性能低下的问题。本申请实施例中公开的点位置检测方法包括:获取标注有真实目标点位置的若干图像样本;通过所述神经网络模型的损失函数根据变量计算所述神经网络模型的损失值,并以所述损失值最小为目标调整所述神经网络模型的参数,训练所述神经网络模型;其中,所述损失函数被配置为相对于变量的绝对值单调递增,所述损失函数对应的梯度函数为单调递减函数且所述梯度函数的值大于1并在所述变量趋近于无穷大时逐渐趋近于1;所述变量用于表示真实值和预测值之间的差值,所述真实值基于样本标签确定,所述预测值通过所述神经网络模型预测得到。
-
公开(公告)号:CN112950732B
公开(公告)日:2022-04-01
申请号:CN202110203197.9
申请日:2021-02-23
申请人: 北京三快在线科技有限公司
IPC分类号: G06T11/00 , G06V40/16 , G06K9/62 , G06V10/774 , G06V10/80
摘要: 本说明书公开了一种图像生成方法、装置、存储介质及电子设备,本说明书实施例将获取到的指定非可见光人脸图像和指定可见光人脸图像输入预先训练的图像生成模型中,通过图像生成模型的第一模型提取指定非可见人脸图像的人脸语义特征,通过第二模型的环境特征编码器提取指定可见光人脸图像的环境特征。然后,通过第二模型的图像生成器,将人脸语义特征与环境特征进行融合,得到目标可见光人脸图像。在此方法中,可将人脸图像的特征分离成人脸语义特征和环境特征,然后,在根据所需人脸语义特征和所需环境特征生成指定人脸图像时,可以避免处于同一人脸图像中的这两种特征相互影响,从而提高了指定人脸图像的图像质量。
-
公开(公告)号:CN111738289A
公开(公告)日:2020-10-02
申请号:CN202010389080.X
申请日:2020-05-09
申请人: 北京三快在线科技有限公司
摘要: 本申请公开了一种计算机视觉CV模型训练方法、装置、电子设备和存储介质,所述方法包括:获取第一CV模型提取的训练图像的第一视觉特征,获取第二CV模型提取的训练图像的第二视觉特征;对各训练图像的第一视觉特征和第二视觉特征分别进行拆解,得到第一视觉特征的第一拆解特征和第二视觉特征的第二拆解特征;根据第一拆解特征生成表征训练图像间关系的监督信号,根据第二拆解特征生成表征图像间关系的学习信号;根据监督信号和学习信号确定第二CV模型的训练损失值,根据训练损失值对第二CV模型的参数进行优化。本申请可以得到更多监督信号,提高模型拟合效果,同时可以学到图像间更重要的关系,避免了一些不具有判别力的图像关系对模型精度的影响。
-
公开(公告)号:CN111652049A
公开(公告)日:2020-09-11
申请号:CN202010308040.8
申请日:2020-04-17
申请人: 北京三快在线科技有限公司
IPC分类号: G06K9/00
摘要: 本申请公开了一种人脸图像处理模型训练方法、装置、电子设备及存储介质,所述方法包括:利用所述人脸图像处理模型的编码器对第一人脸图像进行编码,得到第一人脸图像的第一特征向量;将所述第一特征向量拆分成多个子特征向量,所述子特征向量至少包括身份子特征向量和年龄子特征向量;根据各所述子特征向量确定待解码向量,并利用所述人脸图像处理模型的解码器对所述待解码向量进行解码,得到第二人脸图像;根据所述第一人脸图像与所述第二人脸图像的回归损失值,对所述人脸图像处理模型的参数进行优化。通过本申请训练得到的人脸图像处理模型降低了对数据分布的依赖性,对年龄不均衡的长尾数据更为鲁棒,且能够生成效果更好的面部老化图像。
-
公开(公告)号:CN109598201B
公开(公告)日:2020-07-10
申请号:CN201811309282.8
申请日:2018-11-05
申请人: 北京三快在线科技有限公司
IPC分类号: G06K9/00
摘要: 本发明公开了一种动作检测方法、装置、电子设备及可读存储介质。所述方法,包括:获取待检测的目标视频;依次获取待检测的目标视频中各目标视频帧的目标检测部位的部位特征;基于重新排序后的部位特征确定所述目标视频的特征向量,其中所述重新排序是基于所述部位特征的范数值实现的;基于所述特征向量,通过预设的动作检测模型,确定所述目标视频中所述目标检测部位的动作类型;其中,所述动作检测模型为根据已标记动作类型的样本视频训练得到。解决了现有的动作检测方法适应性以及稳定性不高的技术问题。取得了提高动作检测的适应性、稳定性的有益效果。
-
公开(公告)号:CN110717394A
公开(公告)日:2020-01-21
申请号:CN201910842783.0
申请日:2019-09-06
申请人: 北京三快在线科技有限公司
摘要: 本申请公开了一种人脸识别模型的训练方法、装置、电子设备和存储介质。所述方法包括:预设人脸识别网络;通过多个训练阶段,以所述人脸识别网络为基础进行迭代训练,得到人脸识别模型;其中,所述多个训练阶段分别基于不同的训练控制条件实现,并且在后的训练阶段的训练控制条件是在在前的训练阶段的训练控制条件基础上叠加新的训练控制条件得到的,所述训练控制条件包括训练数据控制条件和/或损失函数控制条件。有益效果在于,通过控制训练条件进行逐步的迭代训练学习得到高性能的识别模型,可以有效的防止过拟合,提升人脸特征的辨别能力和鲁棒性,强化了识别模型对不同人脸的辨别力。
-
-
-
-
-
-
-
-
-