Patent search ap:("北京达佳互联信息技术有限公司" OR "中科计算技术创新研究院") AND inv:"张渊" Page 1

1.

发明公开
文本输入生成动态三维视频的方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN118741069A

公开(公告)日：2024-10-01

申请号：CN202410756606.1

申请日：2024-06-12

Applicant: 北京达佳互联信息技术有限公司 , 中科计算技术创新研究院

Inventor： 袁宇杰 , 刘继文 , 张渊 , 万鹏飞

IPC: H04N13/275 , H04N13/282 , H04N21/81 , G06N3/096

Abstract: 本公开关于一种文本输入生成动态三维视频的方法、装置、电子设备、计算机存储介质以及计算机程序产品，所述方法包括：获取文本数据，并基于文本数据生成满足文本数据的描述内容的参考视频；以文本数据和参考视频中的参考图片作为约束条件，生成满足文本数据描述和参考图片的静态三维模型；基于静态三维模型，确定动态信息生成模型；基于混合先验优化策略对动态信息生成模型优化监督，并基于优化监督后的动态信息生成模型，生成文本数据对应的三维视频；混合先验优化策略包括参考视频的直接先验和扩散模型的蒸馏先验。采用本方法，增强了三维视频的动态效果。

2.

发明公开
生成三维模型的方法及装置审中-公开

公开(公告)号：CN120014133A

公开(公告)日：2025-05-16

申请号：CN202510065501.6

申请日：2025-01-15

Applicant: 北京达佳互联信息技术有限公司 , 香港中文大学(深圳)

Inventor： 韩晓光 , 张渊 , 刘晓强

IPC: G06T15/00 , G06T15/04 , G06T15/08 , G06T17/10 , G06T5/60 , G06T5/70

Abstract: 本申请实施例公开了一种生成三维模型的方法及装置。主要技术方案包括：获取目标对象的单视角图像；利用第一对象生成模型基于目标对象的单视角图像，预测得到其他视角的图像；利用其他视角的图像得到目标对象的三维模型；利用第二对象生成模型基于其他视角的图像，得到其他视角的优化图像；将其他视角的优化图像作为真值图像优化目标对象的三维模型；其中，第一对象生成模型和第二对象生成模型均基于扩散模型预先训练得到。

3.

发明公开
光照方向确定方法、装置、电子设备及存储介质有权

公开(公告)号：CN114092381A

公开(公告)日：2022-02-25

申请号：CN202010789367.1

申请日：2020-08-07

Applicant: 北京达佳互联信息技术有限公司

Inventor： 郝燕龙 , 张渊 , 郑文

IPC: G06T7/00 , G06T3/00

Abstract: 本公开关于光照方向确定方法、装置、电子设备及存储介质，所述方法包括：通过多个下采样神经网络依次对待处理图像进行下采样，得到待转换图像；通过通道转换神经网络对待转换图像进行通道转换，得到转换后图像；对转换后图像进行矩阵变换，得到目标图像；根据目标图像中像素的亮度在目标图像中确定光源对应的光源像素；根据每个光源像素指向目标图像中心的向量，计算待处理图像中光源的光照方向。根据本公开，将待处理图像的特征表达在目标图像中，实现通过目标图像准确地对待处理图像光照的特征进行表达，进而根据目标直接准确地确定待处理图像中的光照方向，所应用模型简单，计算速度快，适用于在手机等计算能力不强的设备上使用。

4.

发明公开
图像处理方法、装置、电子设备及介质有权

公开(公告)号：CN110910304A

公开(公告)日：2020-03-24

申请号：CN201911090043.2

申请日：2019-11-08

Applicant: 北京达佳互联信息技术有限公司

Inventor： 张渊

IPC: G06T3/00 , G06N3/04 , G06N3/08

Abstract: 本公开关于一种图像处理方法、装置、电子设备及介质，涉及计算机技术领域，可以提高图像虚化效果的真实性。本公开实施例包括：获取包含对象区域的待处理图像；然后将待处理图像输入图像识别模型，得到待处理图像中各像素点的深度值以及对象区域，并将对象区域作为待处理图像的前景区域，图像识别模型包括设置在跳跃连接的空洞空间金字塔池化ASPP层、第一输出层和第二输出层，第一输出层用于输出各像素点的深度值，第二输出层用于输出对象区域。对于待处理图像包括的每个待虚化像素点，根据待虚化像素点的深度值与前景区域包括的各像素点深度值平均值的差值，对待虚化像素点进行虚化处理，待虚化像素点为待处理图像的背景区域包括的像素点。

5.

发明公开
图像处理方法、装置、电子设备及存储介质有权

公开(公告)号：CN110400337A

公开(公告)日：2019-11-01

申请号：CN201910618669.X

申请日：2019-07-10

Applicant: 北京达佳互联信息技术有限公司

Inventor： 安世杰 , 张渊 , 马重阳

IPC: G06T7/50

Abstract: 本申请是关于一种图像处理方法、装置、电子设备及存储介质，获取待处理图像的每个像素的深度信息；根据所述深度信息和所述像素在图像坐标系中的二维位置，获得所述像素在图像采集装置坐标系中的像素三维位置；获取视角参数，以及对焦点的对焦三维位置；其中，视角参数为与待处理图像对应的固定观察视角不同的视角的参数；根据所述对焦三维位置、所述视角参数以及所述像素三维位置，获得所述像素的偏移后的三维位置；分别根据每个像素的所述偏移后的三维位置，将每个像素投影至待处理图像的二维坐标系中，得到目标图像。通过本方案能够实现待处理图像中的场景具有不同的观察视角所对应的不同展示效果。

6.

发明公开
场景分割方法、装置、计算机设备及存储介质有权

公开(公告)号：CN110136136A

公开(公告)日：2019-08-16

申请号：CN201910446505.3

申请日：2019-05-27

Applicant: 北京达佳互联信息技术有限公司

Inventor： 张渊

IPC: G06T7/10

Abstract: 本公开是关于一种场景分割方法、装置、计算机设备及存储介质，涉及机器学习技术领域，本公开将待识别的图像输入深度神经网络，通过下采样模块对图像进行深度可分离卷积，得到尺寸小于所述图像的第一特征图，通过空洞空间金字塔池化模块对第一特征图进行空洞卷积，得到不同尺度的第二特征图，通过上采样模块对不同尺度的第二特征图进行深度可分离卷积，得到与图像尺寸相同的第三特征图，通过分类模块对第三特征图中的每个像素进行分类，得到图像的场景分割结果。本公开可以减少通过深度神经网络进行场景分割的计算量，并且可以保证通过深度神经网络进行场景分割的准确性。

7.

发明公开
拍摄引导方法、装置及移动终端和存储介质无效

公开(公告)号：CN109040605A

公开(公告)日：2018-12-18

申请号：CN201811307419.6

申请日：2018-11-05

Applicant: 北京达佳互联信息技术有限公司

Inventor： 张渊 , 郑文

IPC: H04N5/232 , G06N3/04

CPC classification number: H04N5/23229 , G06N3/0454 , H04N5/23216

Abstract: 本申请提供了一种拍摄引导方法、装置及移动终端和存储介质，其中，该方法包括：获取包含拍摄场景中目标的指示图像；基于预先训练的卷积神经网络，确定提示图像中的至少一个显著性目标区域；从至少一个显著性目标区域中选择主体区域；指示主体区域移动至目标拍摄区域；其中，目标拍摄区域是基于预设构图方式确定的。通过本申请实施例提供的拍摄引导方法、装置及移动终端和存储介质，能够提高拍摄引导的准确性。

8.

发明授权
光照方向确定方法、装置、电子设备及存储介质有权

公开(公告)号：CN114092381B

公开(公告)日：2025-03-04

申请号：CN202010789367.1

申请日：2020-08-07

Applicant: 北京达佳互联信息技术有限公司

Inventor： 郝燕龙 , 张渊 , 郑文

IPC: G06T7/00 , G06T3/04

Abstract: 本公开关于光照方向确定方法、装置、电子设备及存储介质，所述方法包括：通过多个下采样神经网络依次对待处理图像进行下采样，得到待转换图像；通过通道转换神经网络对待转换图像进行通道转换，得到转换后图像；对转换后图像进行矩阵变换，得到目标图像；根据目标图像中像素的亮度在目标图像中确定光源对应的光源像素；根据每个光源像素指向目标图像中心的向量，计算待处理图像中光源的光照方向。根据本公开，将待处理图像的特征表达在目标图像中，实现通过目标图像准确地对待处理图像光照的特征进行表达，进而根据目标直接准确地确定待处理图像中的光照方向，所应用模型简单，计算速度快，适用于在手机等计算能力不强的设备上使用。

9.

发明公开
表情驱动模型的训练方法、表情驱动方法及对应装置审中-实审

公开(公告)号：CN119418383A

公开(公告)日：2025-02-11

申请号：CN202411545849.7

申请日：2024-10-31

Applicant: 北京达佳互联信息技术有限公司

Inventor： 张浩贤 , 陈禾嘉 , 刘晓强 , 张渊

IPC: G06V40/16 , G06V10/774 , G06V10/80 , G06N3/0464 , G06N3/0455 , G06N3/08

Abstract: 本申请实施例公开了一种表情驱动模型的训练方法、表情驱动方法及对应装置。主要技术方案包括：获取包括多个第一训练样本的第一训练数据，所述第一训练样本至少包括：音频样本、与所述音频样本对应的表情控制数据以及表情参数真值，所述表情控制数据至少包括时序控制数据，所述时序控制数据包括所述音频样本的时序内至少一个时间窗口对应的动作类型序列；基于所述第一训练数据训练表情驱动模型，包括：将所述音频样本和与所述音频样本对应的表情控制参数作为所述表情驱动模型的输入，获取所述表情驱动模型输出的表情参数序列。本申请可以提高面部表情的精细化控制效果，使其表情变化更加丰富和生动。

10.

发明授权
图像生成方法、装置、电子设备及存储介质

公开(公告)号：CN114170349B

公开(公告)日：2024-12-20

申请号：CN202010947268.1

申请日：2020-09-10

Applicant: 北京达佳互联信息技术有限公司

Inventor： 安世杰 , 张渊 , 郑文

IPC: G06T11/40 , G06T17/00 , G06T3/60

Abstract: 本公开提供了一种图像生成方法、装置、电子设备及存储介质，涉及图像处理技术领域。方法包括：确定第一图像中第一图像区域的第一深度信息和第二图像区域的第二深度信息，第一图像区域为目标对象所在的图像区域，第二图像区域为除目标对象以外的背景图像所在的区域；根据第二图像区域的图像数据，替换第一图像区域的图像数据，得到第二图像；对第二图像中的第三图像区域进行深度填充，得到第三图像区域的第三深度信息；根据第一深度信息和第三深度信息，将第一图像区域中的图像数据融合至深度填充后的第二图像中，得到第三图像。这样，在视角变换时，能够填补背景空洞的，防止目标对象的边界处出现扭曲或缺失，优化生成的三维图像的图像效果。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification