Patent search ap:("北京百度网讯科技有限公司") AND inv:"洪智滨" Page 10

91.

发明公开
用于生成图像的方法和装置有权

公开(公告)号：CN110516598A

公开(公告)日：2019-11-29

申请号：CN201910797619.2

申请日：2019-08-27

Applicant: 北京百度网讯科技有限公司

Inventor： 胡天舒 , 张世昌 , 洪智滨 , 韩钧宇 , 刘经拓

IPC: G06K9/00 , G06K9/62

Abstract: 本公开的实施例公开了用于生成图像的方法和装置。该方法的一具体实施方式包括：获取底版图像和目标人脸图像，其中，该底版图像包括待替换人脸图像和背景；从与该待替换人脸图像匹配的预设人脸图像库中确定匹配人脸图像，其中，该匹配的预设人脸图像库中包括该待替换人脸图像所指示的人脸的不同面部姿态的人脸图像，该匹配人脸图像用于表征待替换人脸图像所显示的面部姿态与该目标人脸图像所显示的面部姿态一致；基于该匹配人脸图像对该待替换人脸图像的替换，生成目标图像，其中，该目标图像包括与该匹配人脸图像相一致的人脸图像和与该底版图像相一致的背景。该实施方式提升了生成与目标人脸图像的面部姿态相一致的图像的速度。

92.

发明授权
脸型变换模型训练、脸型变换方法及相关装置有权

公开(公告)号：CN113379594B

公开(公告)日：2024-11-15

申请号：CN202110728844.8

申请日：2021-06-29

Applicant: 北京百度网讯科技有限公司

Inventor： 尚太章 , 刘家铭 , 洪智滨

IPC: G06T3/04 , G06N3/0475 , G06N3/045 , G06N3/094 , G06N3/0455 , G06N3/0464 , G06N3/08

Abstract: 本公开提供了脸型变换模型训练、脸型变换方法、装置、电子设备、计算机可读存储介质及计算机程序产品，涉及计算机视觉和深度学习等人工智能技术领域，可应用于人脸图像处理等场景。该方法包括：基于第一脸型特征集和第二脸型特征集，得到第一生成网络和第二生成网络；分别利用第一生成网络和第二生成网络生成与第一样本图像对应的第一目标图像和与第二样本图像对应的第二目标图像；分别利用第二生成网络和第一生成网络生成与第一目标图像对应的第一变换图像、与第二目标图像对应的第二变换图像；控制第一样本图像与第一变换图像、第二样本图像与第二变换图像被判别为相同的图像；将满足要求的生成对抗网络输出为目标脸型变换模型。

93.

发明授权
编辑人脸的方法、装置、电子设备和可读存储介质有权

公开(公告)号：CN111861954B

公开(公告)日：2024-10-18

申请号：CN202010576349.5

申请日：2020-06-22

Applicant: 北京百度网讯科技有限公司

Inventor： 胡天舒 , 刘家铭 , 何声一 , 洪智滨

IPC: G06T11/60 , G06T7/11 , G06T3/4053 , G06T5/50

Abstract: 本申请公开了一种编辑人脸的方法、装置、电子设备和可读存储介质，涉及图像处理、深度学习技术领域。本申请在编辑人脸时所采用的实现方案为：获取待处理图像中的人脸图像；根据编辑属性对所述人脸图像进行属性转换，生成属性图像；对所述属性图像进行语义分割之后，根据所述编辑属性来处理语义分割图像，生成掩码图像；利用所述掩码图像将所述属性图像与所述待处理图像进行融合，生成结果图像。本申请能够实现在不同需求下对人脸中不同部位的自由编辑，增加了人脸编辑的灵活性。

94.

发明授权
与虚拟对象的对话方法、装置、客户端及存储介质有权

公开(公告)号：CN112100352B

公开(公告)日：2024-08-20

申请号：CN202010962857.7

申请日：2020-09-14

Applicant: 北京百度网讯科技有限公司

Inventor： 李彤辉 , 胡天舒 , 马明明 , 洪智滨

IPC: G06F16/332 , G06F40/30 , G10L13/02 , G10L15/26 , G06T13/20 , G06T13/40

Abstract: 本申请公开了与虚拟对象的对话方法、装置、客户端及存储介质，涉及人工智能领域，具体为自然语言处理、知识图谱、计算机视觉和语音技术领域。具体实现方案为：所述方法应用于客户端，在客户端处于离线模式的情况下，将客户端采集的第一语音转换成第一文本内容；基于离线自然语言处理NLP和/或客户端预先存储的目标数据库，获取针对第一文本内容进行应答的第二文本内容；对第二文本内容进行语音合成，以得到第二语音；使用虚拟对象对第二语音进行口型模拟，得到虚拟对象使用第二语音发言的目标视频；播放目标视频。根据本申请的技术，解决了与虚拟对象实时对话过程中的网络传输问题，提高了与虚拟对象的实时对话的实现效果。

95.

发明授权
生成虚拟人物视频的方法、装置、设备和计算机存储介质有权

公开(公告)号：CN112233210B

公开(公告)日：2024-06-07

申请号：CN202010962994.0

申请日：2020-09-14

Applicant: 北京百度网讯科技有限公司

Inventor： 李彤辉 , 胡天舒 , 马明明 , 洪智滨

IPC: G06T13/20 , G06T13/40 , G10L25/48 , G10L25/78

Abstract: 本申请公开了一种生成虚拟人物视频的方法、装置、设备和计算机存储介质，涉及人工智能技术，特别涉及计算机视觉和深度学习技术。具体实现方案为：将语音按照预设时长进行切分，得到n个语音段，所述n为正整数；按照时间顺序，分别对各语音段进行静音识别和虚拟人物预测得到各语音段对应的图像帧序列，并将各语音段以及语音段对应的图像帧序列发送至终端的队列，以便所述终端逐一从所述队列中获取语音段及语音段对应的图像帧序列进行合成，并播放合成的虚拟人物视频。本申请能够降低虚拟人物视频播放对终端的性能影响，提高实时性。

96.

发明授权
图像处理方法、模型训练方法、装置、电子设备及介质有权

公开(公告)号：CN114022598B

公开(公告)日：2024-02-20

申请号：CN202111321970.8

申请日：2021-11-09

Applicant: 北京百度网讯科技有限公司

Inventor： 胡天舒 , 何声一 , 韩钧宇 , 洪智滨

IPC: G06T13/20 , G10L21/10 , G06V40/16 , G06V40/20 , G06V40/70 , G06V10/774

Abstract: 本公开提供了图像处理方法、模型训练方法、装置、电子设备及介质，涉及工智能技术领域，尤其涉及深度学习、计算机视觉等技术领域。具体实现方案为：生成第一人脸图像；所述第一人脸图像和参照人脸图像之间的清晰度差异和真实性差异在设定范围内；根据用于驱动所述第一人脸图像的目标语音，调整所述第一人脸图像中与发音相关的脸部动作信息，生成脸部组织位置符合所述目标语音发音规则的第二人脸图像；将所述第二人脸图像作为所述目标语音驱动后的人脸图像。本公开实施例能够提高人脸驱动效果。

97.

发明授权
一种视频拼接方法、装置、电子设备及存储介质有权

公开(公告)号：CN114125324B

公开(公告)日：2024-02-06

申请号：CN202111315996.1

申请日：2021-11-08

Applicant: 北京百度网讯科技有限公司

Inventor： 胡天舒 , 郭汉奇 , 韩钧宇 , 洪智滨

IPC: H04N5/265 , H04N21/44

Abstract: 本公开提供了一种视频拼接方法、装置、电子设备及存储介质，涉及人工智能技术领域，尤其涉及深度学习和计算机视觉技术领域。具体实现方案为：在第一视频的最后一个图像帧和第二个视频的第一个图像帧之间插入一个中间帧；在第一视频和第二视频中分别按照从后向前的顺序和从前向后的顺序依次选取L个图像帧；其中，L为大于1的自然数；基于中间帧以及第一视频中的L个图像帧和第二视频中的L个图像帧，将第一视频和第二视频拼接为目标视频。本申请实施例可以实现视频之间的平滑过渡，能够极大地降低视频拼接难度，同时还可以提高拼接速度，降低成本。

98.

发明授权
虚拟对象形象合成方法、装置、电子设备和存储介质有权

公开(公告)号：CN112150638B

公开(公告)日：2024-01-26

申请号：CN202010963014.9

申请日：2020-09-14

Applicant: 北京百度网讯科技有限公司

Inventor： 郭汉奇 , 胡天舒 , 马明明 , 洪智滨

IPC: G06T19/20 , G06T15/04

Abstract: 本申请公开了虚拟对象形象合成方法、装置、电子设备和存储介质，涉及人工智能领域，具体为计算机视觉和深度学习技术。实现方案为：提取虚拟对象脸部的第一面部关键点，以及每帧原始嘴型面部图像的第二面部关键点；对虚第一面部关键点进行处理，生成与虚拟对象脸部对应的第一3D面部位置和姿态信息；对每帧原始嘴型面部图像的每个第二面部关键点进行处理，生成与每帧原始嘴型面部图像对应的第二3D面部形状顶点信息；生成与每帧原始嘴型面部图像对应的目标嘴型面部图像；根据虚拟对象形象图像和每帧目标嘴型面部图像，合成与语音片段对应的虚拟对象说话形象片段。由此，将原始嘴型面部图像调整到虚拟对象形象图像的姿态和位置下合并，提高合并后的图像自然度。

99.

发明授权
用于检测活体的方法和装置有权

公开(公告)号：CN111507262B

公开(公告)日：2023-12-08

申请号：CN202010304904.9

申请日：2020-04-17

Applicant: 北京百度网讯科技有限公司

Inventor： 冯浩城 , 岳海潇 , 洪智滨 , 王珂尧

IPC: G06V40/40 , G06V10/82 , G06N3/0464 , G06N3/08 , G06V10/764 , G06V10/40 , G06V10/774

Abstract: 本申请实施例公开了用于检测活体的方法和装置。该方法的一具体实施方式包括：获取原始图像；将原始图像输入至训练完成的攻击特征提取网络，输出原始图像的攻击特征信号；计算攻击特征信号的元素级均值；基于元素级均值，生成原始图像的活体检测结果。该实施方式提供了一种新的活体检测方法，基于攻击特征挖掘及放大的活体检测技术进行活体检测，能够显著提升活体检测的准确性。(56)对比文件Anjith George等.Deep Pixel-wiseBinary Supervision for Face PresentationAttack Detection《.arXiv:1907.04047》.2019,1-8,正文第1节第5段,第2.3节第2-7段,第3.2.1节第3段,图1-图3.Anjith George等.Deep Pixel-wiseBinary Supervision for Face PresentationAttack Detection《.arXiv:1907.04047》.2019,1-8,正文第1节第5段,第2.3节第2-7段,第3.2.1节第3段,图1-图3.Yaojie Liu等.Learning Deep Models forFace Anti-Spoofing: Binary or AuxiliarySupervision《.2018 IEEE/CVF Conference onComputer Vision and Pattern Recognition》.2018,2909-2914,正文第1节,第3节,第3.3节,图1-图3.Face De-Spoofing: Anti-Spoofing viaNoise Modeling《.Proceedings of theEuropean Conference on Computer Vision(ECCV)》.2018,第11217卷297-315.Yunxiao Qin.Learning meta model forzero-and few-shot face anti-spoofing.《arXiv：1904-12490》.2019,1-8.曲啸枫.基于多特征融合的活体人脸检测算法研究及应用《.中国硕士学位论文全文数据库(信息科技辑)》.2020,(第2020(01)期),I138-1602.

100.

发明授权
人脸融合模型的训练方法、人脸融合方法、装置及设备有权

公开(公告)号：CN111783647B

公开(公告)日：2023-11-03

申请号：CN202010615462.X

申请日：2020-06-30

Applicant: 北京百度网讯科技有限公司

Inventor： 薛洁婷 , 余席宇 , 洪智滨 , 韩钧宇

IPC: G06V40/16 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0475 , G06N3/094

Abstract: 本申请公开了人脸融合模型的训练方法、人脸融合方法、装置及设备，涉及深度学习领域。具体实现方案为：获取样本图像，所述样本图像包括用户样本图像和底板样本图像；根据所述用户样本图像和底板样本图像对生成式对抗网络进行训练，得到人脸融合模型，所述人脸融合模型用于将底板图像中的人脸替换为用户图像。由于人脸融合模型是基于生成式对抗网络训练得到的，因此能够提取出图像的深层语义特征信息，并基于深层语义特征信息进行人脸融合，从而得到很好的人脸融合效果。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification