-
公开(公告)号:CN109377544A
公开(公告)日:2019-02-22
申请号:CN201811459413.0
申请日:2018-11-30
Applicant: 腾讯科技(深圳)有限公司
CPC classification number: G06T15/00 , G06K9/00228 , G06K9/00288
Abstract: 本发明公开了一种人脸三维图像生成方法、装置和可读介质,属于图像处理技术领域,本发明提供的方法及装置中,利用可调整的训练模型从目标人脸二维图像中识别出的脸部特征参数、拍照环境特征和拍照参数信息,根据脸部特征参数和标准人脸模板库中的三维基底模型重构目标人脸三维模型,模拟拍照环境特征和拍照参数信息对目标人脸三维模型进行渲染获得中间人脸二维图像;在确定出目标人脸二维图像和中间人脸二维图像不满足一致性条件时,调整训练模型并利用调整后的训练模型重新返回根据目标人脸二维图像获得中间人脸二维图像的步骤;在确定满足一致性条件时基于最新重构的目标人脸三维模型得到目标人脸三维图像,提高了目标人脸三维图像的逼真度。
-
公开(公告)号:CN114302023B
公开(公告)日:2024-11-26
申请号:CN202111189312.8
申请日:2021-10-12
Applicant: 腾讯科技(深圳)有限公司
IPC: H04N5/14 , G06F18/214 , G06V40/20 , G06V20/40 , G06V10/774
Abstract: 本申请公开了一种视频重定向模型的训练方法、视频重定向方法及装置,属于人工智能技术领域。方法包括:获取参考动作图像、参考姿势图像、第一动作视频、第一姿势视频、第二动作视频和第二姿势视频;根据参考动作图像、参考姿势图像和第一姿势视频,基于第一网络模型确定第三动作视频;基于第一动作视频和第三动作视频对第一网络模型进行调整,得到第二网络模型;根据参考动作图像、参考姿势图像和第二姿势视频,基于第二网络模型确定第四动作视频;基于第二动作视频和第四动作视频对第二网络模型进行调整,得到第三网络模型;响应于满足训练结束条件,将第三网络模型作为视频重定向模型。提高了视频重定向模型的泛化能力和实用性。
-
公开(公告)号:CN114529761B
公开(公告)日:2024-10-15
申请号:CN202210112774.8
申请日:2022-01-29
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请提供了一种基于分类模型的视频分类方法,包括:通过分类模型的主特征提取网络,对待分类视频进行第一特征提取,得到融合有待分类视频的空间特征及待分类视频的时间特征的全局时空特征;然后,通过副特征提取网络,对待分类视频进行第二特征提取,得到融合有待分类视频的时间特征、及待分类视频在至少两个空间维度的空间子特征的局部时空特征;接着,通过特征融合层,对全局时空特征以及局部时空特征进行特征融合,得到待分类视频的目标时空特征;最后,通过视频分类层,基于目标时空特征对待分类视频进行视频分类,得到待分类视频所归属的视频类别。通过本申请,能够提高针对视频内容理解的精确度,从而完成不同场景下的视频分类任务。
-
公开(公告)号:CN112101154B
公开(公告)日:2023-12-15
申请号:CN202010907778.6
申请日:2020-09-02
Applicant: 腾讯科技(深圳)有限公司
IPC: G06V20/40 , G06V40/16 , G06V10/764 , G06V10/774
Abstract: 本申请涉及人工智能的计算机视觉技术、机器学习等技术,一种视频分类方法、装置、计算机设备和存储介质。所述方法包括:获取待分类视频片段;将待分类视频片段输入已训练的视频分类网络,得到第一视频分类结果,并将待分类视频片段输入已训练的人脸识别网络,得到与待分类视频片段对应的人物信息;将人物信息与各预设视频类别的人物信息集合进行比对,得到第二视频分类结果,根据第一视频分类结果以及第二视频分类结果,得到目标视频分类结果。采用本方法能够得到准确的视频分类结果。
-
公开(公告)号:CN117010452A
公开(公告)日:2023-11-07
申请号:CN202211051837.X
申请日:2022-08-30
Applicant: 腾讯科技(深圳)有限公司
IPC: G06N3/0464 , G06N3/0495 , G06N3/082 , G06N3/045 , G06N3/092 , G06V10/40 , G06V10/82
Abstract: 本公开的实施例提供了一种神经网络搜索方法、装置、设备和计算机可读存储介质。本公开的实施例所提供的方法相比于传统的用于多尺度特征提取的神经网络搜索方法,在网络搜索过程探索对网络本身保留多尺度自注意力的敏感性,从而能够在神经网络搜索中保留Transformer网络结构对图像内容的全面感知。本公开的实施例所提供的方法通过建立多尺度骨干网络,在多尺度Transformer视觉网络中的每一层级都产生不同的尺度信息,并在利用该多尺度骨干网络优化剪枝获得去冗余的子网络的过程中进行针对多尺度敏感性的保留,能够在本公开的神经网络搜索中保留Transformer网络结构对图像内容的全面感知,从而提升通过本公开的神经网络搜索方法确定的Transformer神经网络在各类视觉理解问题中的性能。
-
公开(公告)号:CN112991494B
公开(公告)日:2023-09-15
申请号:CN202110118922.2
申请日:2021-01-28
Applicant: 腾讯科技(深圳)有限公司
IPC: G06T11/60
Abstract: 本申请公开了一种图像生成方法、装置、计算机设备及计算机可读存储介质,属于图像处理技术领域。本申请通过先基于目标人体的姿态,对原始的第一衣物图像进行变换,得到与目标人体的姿态相贴合且保留了大量细节信息的第二衣物图像,再基于不同特征提取任务,分别从不同维度对第二衣物图像和第一人体图像进行特征提取,得到衣物特征、皮肤特征以及人体特征,也即是,得到三个不同维度的、更细粒度的、更精确的特征,从而基于这些特征所生成的第二人体图像能够包含更丰富的细节信息,使第二人体图像具有较高的真实度,确保虚拟换装效果良好。
-
公开(公告)号:CN109978989B
公开(公告)日:2023-08-01
申请号:CN201910140602.X
申请日:2019-02-26
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明公开了一种三维人脸模型生成方法、装置、计算机设备及存储介质,属于计算机技术领域。所述方法包括:获取二维人脸图像;调用人脸模型生成模型,人脸模型生成模型用于提取二维人脸图像的全局特征和局部特征,基于全局特征和局部特征,获取三维人脸模型参数,基于三维人脸模型参数,生成二维人脸图像对应的三维人脸模型;将二维人脸图像输入人脸模型生成模型中,输出二维人脸图像对应的三维人脸模型。本发明中人脸模型生成模型在生成过程中综合全局特征和局部特征获取三维人脸模型,这样得到的三维人脸模型相比于只根据局部特征得到的三维人脸模型,人脸细节体现的更明显,人脸细节处理的更精细,还原度高,从而三维人脸模型更真实。
-
公开(公告)号:CN109377544B
公开(公告)日:2022-12-23
申请号:CN201811459413.0
申请日:2018-11-30
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明公开了一种人脸三维图像生成方法、装置和可读介质,属于图像处理技术领域,本发明提供的方法及装置中,利用可调整的训练模型从目标人脸二维图像中识别出的脸部特征参数、拍照环境特征和拍照参数信息,根据脸部特征参数和标准人脸模板库中的三维基底模型重构目标人脸三维模型,模拟拍照环境特征和拍照参数信息对目标人脸三维模型进行渲染获得中间人脸二维图像;在确定出目标人脸二维图像和中间人脸二维图像不满足一致性条件时,调整训练模型并利用调整后的训练模型重新返回根据目标人脸二维图像获得中间人脸二维图像的步骤;在确定满足一致性条件时基于最新重构的目标人脸三维模型得到目标人脸三维图像,提高了目标人脸三维图像的逼真度。
-
公开(公告)号:CN111709471B
公开(公告)日:2022-09-23
申请号:CN202010535814.0
申请日:2020-06-12
Applicant: 腾讯科技(深圳)有限公司
Inventor: 宋奕兵
IPC: G06V10/764 , G06V10/774 , G06V10/22
Abstract: 本申请涉及一种对象检测模型的训练方法、装置、计算机设备和存储介质。所述方法包括:获取样本图像;通过待训练对象检测模型,获取在样本图像中目标对象所在的候选区域,以及各候选区域中目标对象对应各对象类别的初始置信度;根据各候选区域中目标对象对应各对象类别的初始置信度与样本图像的图像数据间的梯度信息,获取待训练对象检测模型针对样本图像的关注度响应图;从关注度响应图中获取各候选区域的关注度响应值,根据各候选区域的关注度响应值、各候选区域中目标对象对应各个对象类别的初始置信度以及对象类别标签,调整待训练对象检测模型的网络参数,直至满足收敛条件得到目标对象检测模型。采用本方法能够提高对象检测模型的检测性能。
-
公开(公告)号:CN114529761A
公开(公告)日:2022-05-24
申请号:CN202210112774.8
申请日:2022-01-29
Applicant: 腾讯科技(深圳)有限公司
IPC: G06V10/764 , G06V10/82 , G06V10/80 , G06V10/40 , G06V10/44 , G06V10/62 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种基于分类模型的视频分类方法,包括:通过分类模型的主特征提取网络,对待分类视频进行第一特征提取,得到融合有待分类视频的空间特征及待分类视频的时间特征的全局时空特征;然后,通过副特征提取网络,对待分类视频进行第二特征提取,得到融合有待分类视频的时间特征、及待分类视频在至少两个空间维度的空间子特征的局部时空特征;接着,通过特征融合层,对全局时空特征以及局部时空特征进行特征融合,得到待分类视频的目标时空特征;最后,通过视频分类层,基于目标时空特征对待分类视频进行视频分类,得到待分类视频所归属的视频类别。通过本申请,能够提高针对视频内容理解的精确度,从而完成不同场景下的视频分类任务。
-
-
-
-
-
-
-
-
-