Patent search ap:("北京百度网讯科技有限公司") AND inv:"冯浩城" Page 5

41.

发明公开
一种数字人视频生成方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN119729145A

公开(公告)日：2025-03-28

申请号：CN202411898013.5

申请日：2024-12-20

Applicant: 北京百度网讯科技有限公司

Inventor： 王凯思源 , 何声一 , 周航 , 冯浩城

IPC: H04N21/81 , H04N21/85 , G10L21/10 , G10L25/57 , G06T13/20 , G06T13/40

Abstract: 本公开提供了一种数字人视频生成方法、装置、电子设备及存储介质，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型、增强现实等技术领域，可应用于数字人等场景。具体实现方案为：根据参考视频和驱动语音生成目标人物的人体骨骼特征点序列、人体脸部序列、手部序列和唇形序列；根据人体骨骼特征点序列和手部序列，生成目标人物的身体序列；根据身体序列、人体脸部序列和唇形序列，生成数字人视频，数字人与目标人物相匹配。

42.

发明公开
视频生成和视频生成模型的训练方法、装置、设备和介质审中-实审

公开(公告)号：CN119399839A

公开(公告)日：2025-02-07

申请号：CN202411598040.0

申请日：2024-11-08

Applicant: 北京百度网讯科技有限公司

Inventor： 徐志良 , 周航 , 吴冶 , 王凯思源 , 李莹莹 , 冯浩城

IPC: G06V40/20 , G06V20/40 , G06V10/46 , G06V10/82 , G06N3/0455 , G06V10/80 , G06T9/00

Abstract: 本公开提供了一种视频生成和视频生成模型的训练方法、装置、设备和介质，涉及计算机视觉、深度学习、大模型等技术领域，可应用于AIGC、数字人、智能电商等场景。具体实现方案为：获取动作姿态序列和展示有目标对象的参考图像；其中，动作姿态序列中的元素表征根据人体关键点生成的动作姿态；对参考图像进行编码，得到目标对象的外观特征；从动作姿态序列中提取姿态指导特征，并根据姿态指导特征、噪声特征和外观特征，生成目标特征；对目标特征进行解码，得到展示有目标对象的动作驱动视频。

43.

发明公开
视频生成方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN119031204A

公开(公告)日：2024-11-26

申请号：CN202411267110.4

申请日：2024-09-10

Applicant: 北京百度网讯科技有限公司

Inventor： 王凯思源 , 官佳智 , 周航 , 冯浩城

IPC: H04N21/81 , H04N21/234 , H04N21/2343 , H04N21/44 , H04N21/4402 , G06V40/10 , G06V40/16

Abstract: 本申请公开了视频生成方法、装置、电子设备及存储介质，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于AIGC、数字人、智能电商等场景。具体实现方案为：获取展示有目标对象的参考图像对应的参考人体信号及驱动视频对应的驱动人体信号；对参考人体信号和驱动人体信号分别进行动态特征提取，得到第一动态特征和第二动态特征；对参考图像进行纹理特征提取，得到第一纹理特征；对第一动态特征、第二动态特征及第一纹理特征进行交叉注意力计算，得到第二纹理特征；对第二纹理特征、第二动态特征及噪声进行拼接，得到第一拼接特征；根据第一拼接特征进行去噪处理，生成展示有目标对象的目标视频。

44.

发明公开
目标对象的驱动方法和驱动模型的训练方法、装置审中-实审

公开(公告)号：CN118762129A

公开(公告)日：2024-10-11

申请号：CN202410940397.6

申请日：2024-07-12

Applicant: 北京百度网讯科技有限公司

Inventor： 徐志良 , 梁柏荣 , 何声一 , 周航 , 冯浩城

IPC: G06T17/00 , G06N3/0475 , G06N3/094 , G06N3/0464 , G06N3/0455

Abstract: 本公开提供了一种目标对象的驱动方法和驱动模型的训练方法、装置、设备、介质、程序产品，涉及人工智能技术领域，尤其涉及计算机视觉和深度学习等技术领域，可应用于生成式人工智能和数字人驱动等场景。目标对象的驱动方法的具体实现方案为：基于包括目标对象的源视频帧及目标音频片段，生成与目标音频片段对应的目标对象的目标三维模型序列；基于目标三维模型序列，渲染得到与目标音频片段对应的初始图像序列；基于初始图像包括的唇部图像以及初始图像与源视频帧之间的对应关系，融合唇部图像与源视频帧，得到融合后图像序列；以及基于融合后图像序列，生成驱动后视频片段，驱动后视频片段中目标对象的唇部形状与目标音频片段相适配。

45.

发明授权
人脸活体检测方法、装置、电子设备和存储介质有权

公开(公告)号：CN113361349B

公开(公告)日：2023-08-04

申请号：CN202110573893.9

申请日：2021-05-25

Applicant: 北京百度网讯科技有限公司

Inventor： 王珂尧 , 陆杰 , 李云昊 , 岳海潇 , 冯浩城

IPC: G06V40/16 , G06V40/40 , G06V40/18 , G06V40/19 , G06V10/56 , G06V10/764 , G06V10/44 , G06V10/24 , G06V10/82

Abstract: 本公开提供一种人脸活体检测方法、装置、电子设备和存储介质，涉及计算机视觉和深度学习技术领域等人工智能技术领域，可应用于智慧城市和智慧金融场景下。具体实现方案为：获取颜色序列验证码；控制电子设备屏幕依次产生相应颜色，并控制电子设备的摄像头采集在相应颜色下目标对象面部的图像，获得目标对象在不同颜色下的图像序列；根据目标对象在不同颜色下的图像序列对目标对象进行人脸活体验证，获得活体分数值；根据目标对象在不同颜色下的图像序列获取图像序列各自颜色所对应的差分图，并根据颜色序列验证码和图像序列各自颜色所对应的差分图进行颜色验证；根据活体分数值和颜色验证结果，确定目标对象的最终人脸活体检测结果。

46.

发明公开
视频生成方法、模型的训练方法、装置、设备和介质审中-实审

公开(公告)号：CN116320216A

公开(公告)日：2023-06-23

申请号：CN202310252631.1

申请日：2023-03-15

Applicant: 北京百度网讯科技有限公司

Inventor： 李鑫 , 刘芳龙 , 袁苇航 , 张琦 , 李甫 , 王井东 , 冯浩城 , 丁二锐 , 王海峰 , 吴甜

IPC: H04N5/262 , G06T7/269 , G06V10/82 , G06V10/774 , H04N19/44

Abstract: 本公开提供了一种视频生成方法、模型的训练方法、装置、设备和介质，涉及人工智能技术领域，具体为计算机视觉、深度学习等技术领域，可应用于AIGC等场景。具体实现方案为：获取参考图像和文本，其中，所述参考图像和所述文本之间语义相关；利用预先训练的视频特征生成模型，根据所述参考图像的特征和所述文本的特征生成目标视频特征序列；利用视频解码器对所述目标视频特征序列进行解码，生成目标视频。本公开可以提高生成视频的质量。

47.

发明公开
活体检测模型训练方法、活体检测方法、装置和电子设备有权

公开(公告)号：CN115937993A

公开(公告)日：2023-04-07

申请号：CN202211610370.8

申请日：2022-12-14

Applicant: 北京百度网讯科技有限公司

Inventor： 王珂尧 , 张国生 , 岳海潇 , 冯浩城

IPC: G06V40/40 , G06V40/16 , G06V10/764 , G06V10/82 , G06N3/08

Abstract: 本公开提供了一种活体检测模型训练方法、活体检测方法、装置和电子设备，涉及人工智能技术领域，具体为深度学习、图像处理、计算机视觉技术领域。该方法包括：通过活体检测模型中的特征提取网络对样本图像中的样本人脸区域进行特征提取得到样本人脸特征；通过动态路由网络根据样本人脸特征从至少两个候选活体检测网络中选择目标活体检测网络；通过目标活体检测网络根据样本人脸特征确定样本图像的预测活体信息；根据目标活体检测网络、预测活体信息、样本图像的标注攻击类型和样本图像的标注活体信息，对特征提取网络、动态路由网络和目标活体检测网络进行训练。通过上述技术方案能够提高活体检测的准确性。

48.

发明公开
训练方法、预测方法、装置、电子设备以及存储介质有权转让

公开(公告)号：CN113657249A

公开(公告)日：2021-11-16

申请号：CN202110934297.9

申请日：2021-08-13

Applicant: 北京百度网讯科技有限公司

Inventor： 范彦文 , 温圣召 , 张刚 , 冯浩城

IPC: G06K9/00 , G06K9/62

Abstract: 本公开提供了一种训练方法、预测方法、装置、电子设备以及存储介质，涉及人工智能技术领域，具体为计算机视觉和深度学习技术领域，可应用于人脸识别等场景下。具体实现方案为：确定与多个场景样本集中的每个场景样本集对应的目标正样本相似度和目标负样本相似度，其中，每个场景样本集对应一个场景；在确定不满足相似度条件的情况下，根据与多个场景中的每个场景对应的目标正样本相似度和目标负样本相似度，分别调整与预设模型对应的损失函数中与场景对应的正样本场景阈值和负样本场景阈值，得到调整后的损失函数；以及基于调整后的损失函数，利用多个场景样本集训练预设模型直至满足相似度条件。

49.

发明公开
基于多模态的图像检测方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN113642425A

公开(公告)日：2021-11-12

申请号：CN202110859555.1

申请日：2021-07-28

Applicant: 北京百度网讯科技有限公司

Inventor： 岳海潇 , 王珂尧 , 冯浩城

IPC: G06K9/00

Abstract: 本公开提出了基于多模态的图像检测方法、装置、电子设备及存储介质，涉及人工智能技术领域，尤其涉及计算机视觉和深度学习等技术领域，可应用于人脸识别场景下。具体实现方案：获取参考帧图像和待处理帧图像，参考帧图像和待处理帧图像的模态不相同，并从参考帧图像之中识别出参考检测框，以及将参考检测框映射至待处理帧图像之中，以得到目标检测框，目标检测框被用于进行图像检测，能够实现对不同模态图像中的检测框进行准确地映射，当采用映射得到的目标检测框进行图像检测时，能够有效提升复杂场景下图像检测准确率与召回率，提高图像识别系统的有效性。

50.

发明公开
人脸活体检测方法、装置、设备及存储介质有权

公开(公告)号：CN113205057A

公开(公告)日：2021-08-03

申请号：CN202110524896.3

申请日：2021-05-13

Applicant: 北京百度网讯科技有限公司

Inventor： 王珂尧 , 陆杰 , 李云昊 , 岳海潇 , 冯浩城

IPC: G06K9/00

Abstract: 本公开揭露了人脸活体检测方法，涉及人工智能领域，具体为计算机视觉和深度学习技术，可应用于人脸识别场景下。具体实现方案为：获取包含多个人脸图像的人脸图像序列；基于人脸图像序列，获取对应的包含多个人眼图像的人眼图像序列；基于人眼图像序列，对多个人眼图像中的每个人眼图像中人眼瞳孔显示的光斑颜色进行识别，得到瞳孔颜色识别结果；以及响应于瞳孔颜色识别结果表征人脸图像序列是电子设备现场采集的人脸图像的序列，利用人脸图像序列中的至少一个人脸图像得到人脸活体检测结果。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification