-
公开(公告)号:CN117036546A
公开(公告)日:2023-11-10
申请号:CN202310956306.3
申请日:2023-07-31
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本申请提供了一种图片生成方法及装置、存储介质、计算设备,该图片生成方法包括:获取输入内容,输入内容包括人脸标识、服装标识、姿态信息以及背景图片;将输入内容输入至扩散模型,以生成目标图片,其中,扩散模型根据人脸标识调用其对应的第一LoRA模型生成目标图片中的人脸,扩散模型根据服装标识调用其对应的第二LoRA模型生成目标图片中的服装,目标图片还包括姿态信息中的姿态以及背景图片中的背景。本申请技术方案能够提升图片生成的效率和灵活性。
-
公开(公告)号:CN116847091A
公开(公告)日:2023-10-03
申请号:CN202310882709.8
申请日:2023-07-18
Applicant: 华院计算技术(上海)股份有限公司
IPC: H04N19/169 , H04N19/119 , H04N19/176 , H04N19/154
Abstract: 本公开提供了一种图像编码方法、系统、设备及介质,所述方法包括:获取待处理的图像;将所述图像划分为多个区域块,并确定所述区域块的区域视觉信息及所述区域块在语义标签上的概率分布;确定所述图像的图像视觉信息及图像语义信息,所述图像视觉信息根据每个所述区域块的区域视觉信息生成,所述图像语义信息根据每个所述区域块在语义标签上的概率分布生成;根据所述图像语义信息及所述图像视觉信息对图像进行编码,得到图像编码。本公开能够使得图像编码更丰富、更准确,能够扩展于各种图像任务重,提升编码在下游的应用率;另外,通过区域块确定图像视觉信息和图像语义信息,能够提升图像编码的准确率。
-
公开(公告)号:CN115965724B
公开(公告)日:2023-08-08
申请号:CN202211675468.1
申请日:2022-12-26
Applicant: 华院计算技术(上海)股份有限公司
Inventor: 虞钉钉
Abstract: 一种图像生成方法及装置、计算机可读存储介质、终端,所述方法包括:获取音频内容信息;根据所述音频内容信息得到N组系数,将所述N组系数代入通用函数以得到N个函数表达式,N为大于1的整数;根据所述N个函数表达式在空白图像中绘制N个唇部线条,得到唇形图像,所述N个唇部线条组合形成所述唇形图像中的唇形;将所述唇形图像和预设脸部图像输入至预先训练得到的图像融合模型,得到所述图像融合模型输出的目标脸部图像,其中,所述目标脸部图像中的唇形与所述唇形图像相适配。本申请提供的方案有利于使脸部图像中的唇形更加准确。
-
公开(公告)号:CN116342835A
公开(公告)日:2023-06-27
申请号:CN202310333415.X
申请日:2023-03-31
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本发明公开了一种人脸三维表面网格生成方法、装置、计算设备及存储介质,该方法包括:获取目标的人脸三维表面网格模板以及音频驱动信息;对目标的人脸三维表面网格模板进行空间特征提取,得到目标的人脸空间特征;对目标的音频驱动信息进行时序特征提取,得到目标的音频序列特征;基于目标的人脸空间特征以及音频序列特征,对目标的人脸进行三维重建,得到目标人脸的三维表面网格序列。本发明可以提取音频驱动信息的序列特征和人脸三维表面网格的空间特征,有利于提高人脸三维表面网格重建的准确性。
-
公开(公告)号:CN115965724A
公开(公告)日:2023-04-14
申请号:CN202211675468.1
申请日:2022-12-26
Applicant: 华院计算技术(上海)股份有限公司
Inventor: 虞钉钉
Abstract: 一种图像生成方法及装置、计算机可读存储介质、终端,所述方法包括:获取音频内容信息;根据所述音频内容信息得到N组系数,将所述N组系数代入通用函数以得到N个函数表达式,N为大于1的整数;根据所述N个函数表达式在空白图像中绘制N个唇部线条,得到唇形图像,所述N个唇部线条组合形成所述唇形图像中的唇形;将所述唇形图像和预设脸部图像输入至预先训练得到的图像融合模型,得到所述图像融合模型输出的目标脸部图像,其中,所述目标脸部图像中的唇形与所述唇形图像相适配。本申请提供的方案有利于使脸部图像中的唇形更加准确。
-
-
-
-