图像分类方法、图像分类模型的训练方法及装置

    公开(公告)号:CN114418030A

    公开(公告)日:2022-04-29

    申请号:CN202210102561.7

    申请日:2022-01-27

    Inventor: 宋奕兵 梁有为

    Abstract: 本申请实施例提供了一种图像分类方法、图像分类模型的训练方法及装置,涉及人工智能领域。该方法包括:将待分类图像输入至预先训练的图像分类模型的编码层,进行向量提取,得到特征向量,特征向量包括多个局部向量,每个局部向量对应待分类图像中的一个子图像;利用编码层中的注意力机制层,对局部向量进行筛选,得到剩余局部向量;基于剩余局部向量得到待分类图像的分类结果。本申请实施例在缩减局部向量的过程中首先无需辅助网络,也没有引入更多的参数,由于可以从头训练一个轻量级的图像分类模型,因此能够降低计算量,还适用于不同分辨率的图像,增强了方案的适应性。

    图像处理方法、装置、计算机设备及存储介质

    公开(公告)号:CN114283049A

    公开(公告)日:2022-04-05

    申请号:CN202111081567.2

    申请日:2021-09-15

    Inventor: 宋奕兵

    Abstract: 本申请提供了一种图像处理方法、装置、计算机设备及存储介质,属于计算机技术领域,能够应用于云技术、AI、智慧交通、车载等各种场景。方法包括:将待处理图像映射至源领域的第一隐空间,得到第一语意特征;获取迁移特征,基于迁移特征,将该第一语意特征迁移为第二语意特征;基于该第二语意特征,生成目标图像,该目标图像具有该目标领域的风格。上述方案,将待处理图像映射至源领域的第一隐空间,使得基于迁移特征,对映射得到的第一语意空间特征进行迁移,将待处理图像在第一隐空间中的语意方向迁移至第二隐空间中,得到第二语意特征,从而生成目标图像,不需要大量的数据进行训练即可完成图像迁移,节约时间且对训练平台的算力要求不高。

    图片处理方法和装置、存储介质及电子装置

    公开(公告)号:CN110956599A

    公开(公告)日:2020-04-03

    申请号:CN201911143196.9

    申请日:2019-11-20

    Inventor: 宋奕兵 刘威

    Abstract: 本发明公开了一种图片处理方法和装置、存储介质及电子装置。其中,该方法包括:使用目标识别模型识别原始面部图片,获取原始面部图片的面部结构图,面部结构图中包括原始面部图片中面部的基本面部结构;根据基本面部结构从数据库存储的高清面部图片中查找与面部结构图匹配的目标高清面部图片,根据基本面部结构与目标高清面部图片确定目标面部图片,其中,目标面部图片的分辨率为第三分辨率,第三分辨率大于第一分辨率。本发明解决了相关技术中对低清晰度图片处理准确度低的技术问题。

    虚拟对象的位置确定方法、装置、终端及存储介质

    公开(公告)号:CN110215706A

    公开(公告)日:2019-09-10

    申请号:CN201910538136.0

    申请日:2019-06-20

    Inventor: 宋奕兵 马林 刘威

    Abstract: 本申请实施例提供一种虚拟对象的位置确定方法、装置、终端及存储介质。该方法包括:获取目标虚拟对象对应的角色模板;获取目标视频,目标视频中存在第一图像,第一图像包括全局地图,全局地图用于显示虚拟场景的缩略图;在全局地图中查找与角色模板匹配的目标搜索子区域;将目标搜索子区域在全局地图中的位置确定为目标虚拟对象在全局地图中的位置。本申请实施例提供的技术方案,解决了相关技术中无法定位未出现在第一帧图像中的虚拟对象的位置的问题,可以准确定位出游戏视频中的每个虚拟对象在全局地图中的位置,提高了虚拟对象的定位精度。

    三维人脸重建方法、装置、存储介质和电子装置

    公开(公告)号:CN110163953A

    公开(公告)日:2019-08-23

    申请号:CN201910181932.3

    申请日:2019-03-11

    Abstract: 本发明公开了一种三维人脸重建方法、装置、存储介质和电子装置。其中,该方法包括:获取输入的多张目标人脸图像;通过第一神经网络模型对多张目标人脸图像进行处理,得到目标人脸对象的目标外观参数,第一神经网络模型通过人脸图像样本中的每张人脸图像和与每张人脸图像相关联的渲染图像之间的光流损失和图像特征损失,对子神经网络模型的参数进行更新得到,人脸图像样本包括从多个不同视角对人脸对象进行拍摄得到的多张人脸图像;将目标外观参数输入至预先确定的三维人脸模型中,并输出由三维人脸模型对目标外观参数进行处理,得到的目标人脸对象的目标三维人脸图像。本发明解决了相关技术中对三维人脸进行重建的准确性低的技术问题。

    模型训练方法、装置、终端及存储介质

    公开(公告)号:CN110147836A

    公开(公告)日:2019-08-20

    申请号:CN201910397253.X

    申请日:2019-05-13

    Inventor: 王宁 宋奕兵 刘威

    Abstract: 本发明实施例公开了一种模型训练方法、装置、终端及存储介质,方法包括:获取模板图像和测试图像;调用第一物体识别模型对模板图像中跟踪对象的特征处理得到第一参考响应,调用第二物体识别模型对模板图像中跟踪对象的特征处理得到第一参考响应;调用第一物体识别模型对测试图像中跟踪对象的特征处理得到第一测试响应,调用第二物体识别模型对测试图像中跟踪对象的特征处理得到第二测试响应;对第一测试响应进行跟踪处理得到在跟踪对象的跟踪响应;基于第一参考响应与第二参考响应之间差异信息、第一测试响应与第二测试响应之间差异信息和跟踪标签与跟踪响应之间差异信息更新第一物体识别模型。本发明实施例可以提高视觉目标跟踪的准确性。

    图像处理方法、装置、设备及可读存储介质

    公开(公告)号:CN112258606B

    公开(公告)日:2024-06-04

    申请号:CN202011129137.9

    申请日:2020-10-21

    Abstract: 本申请公开了一种图像处理方法、装置、设备及可读存储介质,涉及机器学习领域。该方法包括:获取输入图像组和视觉引导数据,输入图像组中包括孔洞图像,视觉引导数据用于对孔洞区域的内容填充进行引导;提取视觉引导数据的语义特征,得到语义特征图;提取输入图像组的纹理特征,得到纹理特征图;根据语义特征图和纹理特征图,对孔洞图像中的孔洞区域进行填充,得到目标图像。通过视觉引导数据确定语义特征图,以及通过对输入图像组提取纹理特征图,从而将语义特征图和纹理特征图结合,得到目标图像,既在目标图像中涵盖了用户期望的视觉引导数据,也能够保留孔洞图像所应有的纹理特征,提高了对包含孔洞区域的孔洞图像进行图像处理的准确率。

    图像融合方法、装置、计算机设备及存储介质

    公开(公告)号:CN111768507B

    公开(公告)日:2023-11-28

    申请号:CN202010790051.4

    申请日:2020-08-07

    Abstract: 本申请实施例公开了一种图像融合方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取原始人体图像和原始衣物图像;根据原始衣物图像,对原始人体图像进行人体区域检测,得到第一裸露区域图像;对原始人体图像、原始衣物图像和第一裸露区域图像进行融合,得到目标人体图像,以使在目标人体图像中,原始人体图像中的人体穿戴原始衣物图像中的衣物,目标人体图像的裸露人体区域与第一裸露人体区域匹配。本申请采用人工智能技术,获取自适应保留未被衣物遮挡的人体区域的目标人体图像,并去除被衣物遮挡的人体区域,使得人体与衣物更加贴合,试穿图像更加逼真,有利于提高图像显示效果,准确地呈现出用户试穿衣物的效果。

    对象定位方法、装置、计算机可读介质及电子设备

    公开(公告)号:CN116958517A

    公开(公告)日:2023-10-27

    申请号:CN202310191438.1

    申请日:2023-02-22

    Inventor: 宋奕兵

    Abstract: 本申请的实施例提供了一种对象定位方法、装置、计算机可读介质及电子设备,该方法包括:获取目标图像、查询信息和场景信息;将目标图像编码为图像特征图,将查询信息编码为查询信息标记嵌入特征,并将场景信息编码为场景信息标记嵌入特征;基于交叉注意力机制将场景信息标记嵌入特征嵌入图像特征图,得到图像场景深层交叉特征;将图像场景深层交叉特征、查询信息标记嵌入特征和回归标记嵌入特征作为联合输入特征,基于自注意力机制对联合输入特征中的特征向量之间进行交互,得到回归标记嵌入特征对应的编码结果;基于编码结果预测得到对象定位信息。本申请实施例能提高对描述性语言的理解能力和对象定位的准确性。

Patent Agency Ranking