基于文本的图像编辑方法、装置、设备、介质及程序产品

    公开(公告)号:CN117011414A

    公开(公告)日:2023-11-07

    申请号:CN202211088056.8

    申请日:2022-09-07

    Inventor: 宋奕兵 朱艺铭

    Abstract: 本申请公开了一种基于文本的图像编辑方法、装置、设备、介质及程序产品,属于人工智能领域。所述方法包括:获取待编辑图像的第一图像表征和引导文本的文本表征;通过线性映射的方式对齐第一图像表征和文本表征,得到中间表征;在文本表征的引导下,将中间表征调制为第一图像表征和文本表征之间的偏移量;将偏移量注入第一图像表征,得到编辑后的图像的第二图像表征,编辑后的图像的目标属性是根据引导文本的语义信息指示得到的。上述方法使得应用有本申请提供的基于文本的图像编辑方法的图像编辑模型,对于不同属性均能适用。

    神经网络训练时的特征量化方法、装置、介质及程序产品

    公开(公告)号:CN116957007A

    公开(公告)日:2023-10-27

    申请号:CN202310118897.7

    申请日:2023-01-31

    Inventor: 赵思杰 宋奕兵

    Abstract: 本申请公开了一种神经网络训练时的特征量化方法、装置、介质及程序产品,属于神经网络技术领域。该方法包括:将训练数据输入到神经网络中,神经网络包括至少两个神经网络层,至少两个神经网络层包括非参数层,非参数层是指包括非线性函数的神经网络层;在前向传播的过程中,通过至少两个神经网络层对训练数据进行特征计算,得到每个神经网络层的输入特征和输出特征;获取非参数层的输入特征和输出特征中的至少一项作为目标特征;对目标特征进行量化处理,得到量化后的特征;存储量化后的特征至存储器中,释放存储器中的非参数层的输入特征和输出特征。该方法能够在神经网络训练的过程中减少对存储空间的占用。

    视频处理方法、装置、计算机设备及存储介质

    公开(公告)号:CN114694065A

    公开(公告)日:2022-07-01

    申请号:CN202210293909.5

    申请日:2022-03-23

    Abstract: 本申请实施例公开了一种视频处理方法、装置、计算机设备及存储介质,可应用于计算机视觉、云技术、智慧交通、辅助驾驶等场景。其中方法包括:获取待处理的目标视频数据;调用视频处理模型的编码器对目标视频数据进行处理,得到目标视频数据的特征表示信息;该编码器是基于样本视频数据包括的多帧图像以及预设遮蔽策略进行预训练得到的;该预设遮蔽策略包括相邻图像的遮蔽规则相同,且遮蔽比率大于或等于预设比值;基于视频处理模型和目标视频数据的特征表示信息,确定目标视频数据的处理结果。采用本申请实施例,通过使用基于预设遮蔽策略训练得到的编码器,可准确高效的提取出视频数据的特征表示信息,从而准确的确定视频数据的处理结果。

    一种图像分类方法、装置、电子设备及存储介质

    公开(公告)号:CN114494774A

    公开(公告)日:2022-05-13

    申请号:CN202210078318.6

    申请日:2022-01-24

    Abstract: 本申请公开了一种图像分类方法、装置、电子设备及存储介质,涉及人工智能技术领域,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。方法包括:通过已训练的目标图像分类模型,将待分类图像划分为多个图像分块,并提取多个图像分块各自的图像特征;基于多个图像特征,采用迭代方式执行混合处理,获得相应的多个目标混合特征;其中,一轮混合处理包括:基于本轮输入的多个图像特征生成混合参数,并基于混合参数和多个图像特征,输出多个中间混合特征,以及基于多个中间混合特征获得新的多个图像特征;基于多个目标混合特征对待分类图像进行分类预测,获得待分类图像的分类结果。本申请可以有效地提高图像分类准确性。

    一种编码器的训练方法、装置及存储介质

    公开(公告)号:CN114418069A

    公开(公告)日:2022-04-29

    申请号:CN202210061366.4

    申请日:2022-01-19

    Inventor: 宋奕兵

    Abstract: 本申请公开了一种编码器的训练方法以及相关装置,应用于人工智能的计算机视觉领域。通过获取训练图像;对训练图像进行处理操作不同的样本;进一步的将不同的样本分别输入对应的编码器进行特征提取得到特征向量;然后将特征向量输入目标解码器得到对应的预测信息;进而基于预测信息进行损失函数计算,以对第一编码器进行训练。从而实现兼顾全局信息与局部信息的编码器训练过程,通过编码器进行局部特征的提取,并采用目标解码器中的注意力模块进行全局特征的关联,使得训练后的编码器提的特征向量更加精确度,提高图像识别的准确性。

    图像特征提取网络的训练方法、提取方法及装置

    公开(公告)号:CN114359650A

    公开(公告)日:2022-04-15

    申请号:CN202111398839.1

    申请日:2021-11-19

    Inventor: 宋奕兵 葛崇剑

    Abstract: 本申请提供了一种图像特征提取网络的训练方法、提取方法及装置;方法包括:基于第一图像样本调用第一编码器进行编码处理得到第一低维特征,基于第一低维特征调用第一处理网络和第三处理网络得到第一高维特征和第三高维特征;基于第二图像样本调用第二编码器进行编码处理得到第二低维特征,基于第二低维特征调用第二处理网络和第四处理网络得到第二高维特征和第四高维特征;根据第一高维特征和第三高维特征确定第一交叉损失值,根据第二高维特征和第四高维特征确定第二交叉损失值,对第一编码器的参数进行梯度更新;根据更新后的第一编码器的参数,对第二编码器的参数进行动量更新。通过本申请,能够有效地进行图像特征学习。

    一种三维脸部模型建立方法、装置和电子设备

    公开(公告)号:CN110458924B

    公开(公告)日:2021-03-12

    申请号:CN201910667561.X

    申请日:2019-07-23

    Abstract: 本申请提供了一种三维脸部模型建立方法、装置和电子设备,属于计算机技术领域,涉及人工智能和机器学习技术,基于机器学习技术和人工智能中的计算机视觉技术进行三维物体重建。其中,三维脸部模型建立方法包括:根据获取的脸部图像建立基础三维脸部模型;获取所述基础三维脸部模型相对于所述脸部图像的深度增量图;将所述深度增量图投射至所述基础三维脸部模型的表面,得到细节三维脸部模型。本申请实施例针对获取的脸部图像先建立基础三维脸部模型,然后获取基础三维脸部模型相对于所述脸部图像的深度增量图,将深度增量图投射至基础三维脸部模型的表面,得到细节三维脸部模型,可以提高三维重建的精度,获得更逼真和更自然的细节三维脸部模型。

    图像处理方法、装置、设备及可读存储介质

    公开(公告)号:CN112258606A

    公开(公告)日:2021-01-22

    申请号:CN202011129137.9

    申请日:2020-10-21

    Abstract: 本申请公开了一种图像处理方法、装置、设备及可读存储介质,涉及机器学习领域。该方法包括:获取输入图像组和视觉引导数据,输入图像组中包括孔洞图像,视觉引导数据用于对孔洞区域的内容填充进行引导;提取视觉引导数据的语义特征,得到语义特征图;提取输入图像组的纹理特征,得到纹理特征图;根据语义特征图和纹理特征图,对孔洞图像中的孔洞区域进行填充,得到目标图像。通过视觉引导数据确定语义特征图,以及通过对输入图像组提取纹理特征图,从而将语义特征图和纹理特征图结合,得到目标图像,既在目标图像中涵盖了用户期望的视觉引导数据,也能够保留孔洞图像所应有的纹理特征,提高了对包含孔洞区域的孔洞图像进行图像处理的准确率。

    基于人工智能的模型训练方法和相关装置

    公开(公告)号:CN111126515B

    公开(公告)日:2020-07-24

    申请号:CN202010237383.X

    申请日:2020-03-30

    Inventor: 宋奕兵 刘威

    Abstract: 本申请实施例公开了一种基于人工智能的模型训练方法和相关装置,通过构造正负标签对,并对由正负标签对求得的第一损失和第二损失对输入求偏导,得到分别反映目标对象和背景内容的内生响应图,然后利用L2范数损失来度量两者的距离。通过最大化目标对象和背景内容对应的内生响应图的空间距离,得到背景扰动损失。在原始损失的基础上,增加背景扰动损失,对网络模型的参数进行更新,增强了网络模型对目标对象和背景内容的分辨能力,提高了网络性能。

    一种三维脸部模型建立方法、装置和电子设备

    公开(公告)号:CN110458924A

    公开(公告)日:2019-11-15

    申请号:CN201910667561.X

    申请日:2019-07-23

    Abstract: 本申请提供了一种三维脸部模型建立方法、装置和电子设备,属于计算机技术领域,涉及人工智能和机器学习技术,基于机器学习技术和人工智能中的计算机视觉技术进行三维物体重建。其中,三维脸部模型建立方法包括:根据获取的脸部图像建立基础三维脸部模型;获取所述基础三维脸部模型相对于所述脸部图像的深度增量图;将所述深度增量图投射至所述基础三维脸部模型的表面,得到细节三维脸部模型。本申请实施例针对获取的脸部图像先建立基础三维脸部模型,然后获取基础三维脸部模型相对于所述脸部图像的深度增量图,将深度增量图投射至基础三维脸部模型的表面,得到细节三维脸部模型,可以提高三维重建的精度,获得更逼真和更自然的细节三维脸部模型。

Patent Agency Ranking