Patent search ap:("北京百度网讯科技有限公司") AND inv:"洪智滨" Page 5

41.

发明公开
图像处理方法、图像处理模型训练方法、装置及存储介质有权

公开(公告)号：CN113963087A

公开(公告)日：2022-01-21

申请号：CN202111189380.4

申请日：2021-10-12

Applicant: 北京百度网讯科技有限公司

Inventor： 郭汉奇 , 洪智滨 , 胡天舒

IPC: G06T11/60 , G06N3/04 , G06N3/08

Abstract: 本申请公开了图像处理方法、图像处理模型训练方法、装置及存储介质，涉及人工智能领域的计算机视觉、深度学习等领域。具体实现方案为：将所述待编辑图像在生成对抗网络的S空间进行编码，获取第一隐编码；其中，所述生成对抗网络为基于样式的生成对抗网络；将所述文本描述信息进行编码，获取文本图像的文本编码，并将所述文本编码在所述S空间上进行映射，获取第二隐编码；将所述第一隐编码和第二隐编码进行距离优化，获取满足距离要求的目标隐编码；基于所述目标隐编码生成所述目标图像。能够在编辑图像的某一部分时对其它无需编辑的部分产生的影响更小；并能够有效提升优化速度。

42.

发明公开
图像处理方法、图像处理装置、电子设备以及存储介质有权

公开(公告)号：CN113962845A

公开(公告)日：2022-01-21

申请号：CN202110985605.0

申请日：2021-08-25

Applicant: 北京百度网讯科技有限公司

Inventor： 束长勇 , 刘家铭 , 洪智滨 , 韩钧宇

IPC: G06T3/00 , G06T5/00 , G06T5/50 , G06T7/40

Abstract: 本公开提供了一种图像处理方法、图像处理装置、电子设备以及存储介质，涉及人工智能领域，尤其涉及计算机视觉和深度学习领域，可应用于人脸图像处理和人脸识别等场景。具体实现方案为：根据第一目标图像和第二目标图像，生成待处理图像，待处理图像中对象的身份信息与第一目标图像中对象的身份信息匹配；根据第二目标图像和待处理图像，生成解耦图像集，解耦图像集包括与待处理图像中对象的头部区域对应的头部解耦图像和与待处理图像中对象相关的待修复信息对应的修复解耦图像；根据解耦图像集，生成融合图像，融合图像中对象的身份信息和纹理信息分别与待处理图像中对象的身份信息和纹理信息匹配，与融合图像中对象相关的待修复信息已被修复。

43.

发明公开
表情驱动方法、装置、电子设备及存储介质有权

公开(公告)号：CN113870399A

公开(公告)日：2021-12-31

申请号：CN202111117185.0

申请日：2021-09-23

Applicant: 北京百度网讯科技有限公司

Inventor： 梁柏荣 , 郭知智 , 洪智滨

IPC: G06T13/40

Abstract: 本公开提供了表情驱动方法、装置、电子设备及存储介质，涉及人工智能技术领域，具体涉及计算机视觉和深度学习技术领域，可应用于人脸图像处理和人脸识别等场景。具体实现方案为：将具有表情的源图像及无表情的目标图像分别输入至三维表情表达模型中，以获取多个第一面部属性以及多个第二面部属性，采用第一面部属性中的至少部分面部属性替换第二面部属性中对应的面部属性，并对替换后的第二面部属性进行三维面部重建和渲染，通过表情驱动模型对将渲染的三维面部图像进行表情驱动。由此，可实现源图像和目标图像中的面部表情和面部姿态的解耦，进而，可实现单独控制目标图像的面部表情和面部姿态，更好地满足更多样的表情驱动。

44.

发明公开
一种视频生成方法、装置、设备以及存储介质无效

公开(公告)号：CN112989935A

公开(公告)日：2021-06-18

申请号：CN202110163607.1

申请日：2021-02-05

Applicant: 北京百度网讯科技有限公司

Inventor： 胡天舒 , 洪智滨

IPC: G06K9/00 , G06K9/62 , G10L25/63

Abstract: 本申请公开了一种视频生成方法、装置、设备以及存储介质，涉及人工智能领域，尤其涉计算机视觉和深度学习领域。具体实现方案为：根据待生成视频的人物情绪特征，更换原始人物图像的人物情绪，得到目标人物图像；采用人物驱动网络，基于语音片段驱动所述目标人物图像，得到所述待生成视频。能够在语音驱动人物图像，生成人物视频的过程中，编辑人物情绪，提高生成人物视频的灵活性，为图像驱动技术的发展提供了一种新思路。

45.

发明公开
用于改变人物的发型的方法、装置、设备和存储介质有权

公开(公告)号：CN112819921A

公开(公告)日：2021-05-18

申请号：CN202011379566.1

申请日：2020-11-30

Applicant: 北京百度网讯科技有限公司

Inventor： 郭知智 , 梁柏荣 , 洪智滨 , 韩钧宇

IPC: G06T11/40 , G06K9/00 , G06K9/46 , G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本公开涉及人工智能领域，具体为计算机视觉和深度学习技术，更具体地，公开了用于改变人物的发型的方法、装置、设备和存储介质。在一种方法中，确定包括所述人物的原始图像的原始特征向量，所述原始图像中的所述人物具有原始发型。基于发型分类模型，获取与所述原始发型和所述目标发型相关联的边界向量。基于所述原始特征向量和所述边界向量，确定与所述目标发型相对应的目标特征向量。基于所述目标特征向量生成包括所述人物的目标图像，所述目标图像中的所述人物具有所述目标发型。采用上述实现方式，可以大大降低对于训练数据的要求，降低训练过程的计算量并且获得逼真的目标图像。

46.

发明公开
与虚拟对象的对话方法、装置、客户端及存储介质有权

公开(公告)号：CN112100352A

公开(公告)日：2020-12-18

申请号：CN202010962857.7

申请日：2020-09-14

Applicant: 北京百度网讯科技有限公司

Inventor： 李彤辉 , 胡天舒 , 马明明 , 洪智滨

IPC: G06F16/332 , G06F40/30 , G10L13/02 , G10L15/26 , G06T13/20 , G06T13/40

Abstract: 本申请公开了与虚拟对象的对话方法、装置、客户端及存储介质，涉及人工智能领域，具体为自然语言处理、知识图谱、计算机视觉和语音技术领域。具体实现方案为：所述方法应用于客户端，在客户端处于离线模式的情况下，将客户端采集的第一语音转换成第一文本内容；基于离线自然语言处理NLP和/或客户端预先存储的目标数据库，获取针对第一文本内容进行应答的第二文本内容；对第二文本内容进行语音合成，以得到第二语音；使用虚拟对象对第二语音进行口型模拟，得到虚拟对象使用第二语音发言的目标视频；播放目标视频。根据本申请的技术，解决了与虚拟对象实时对话过程中的网络传输问题，提高了与虚拟对象的实时对话的实现效果。

47.

发明公开
构建图像编辑模型的方法以及装置有权

公开(公告)号：CN111861955A

公开(公告)日：2020-10-30

申请号：CN202010576505.8

申请日：2020-06-22

Applicant: 北京百度网讯科技有限公司

Inventor： 何声一 , 刘家铭 , 胡天舒 , 洪智滨

IPC: G06T5/50 , G06T7/11 , G06T7/194 , G06N3/04 , G06N3/08

Abstract: 本申请公开了一种构建图像编辑模型的方法、装置、电子设备和计算机可读存储介质，涉及图像处理、深度学习技术领域。本申请在构建图像编辑模型时所采用的实现方案为：获取训练样本，所述训练样本中包含第一图像及其对应的第二图像；构建包含生成器与判别器的生成对抗网络，其中所述生成器包含背景图像生成分支、掩码图像生成分支以及前景图像生成分支；根据第一图像及其对应的第二图像训练所述生成对抗网络，将训练得到的所述生成对抗网络中的生成器作为图像编辑模型。本申请所构建的图像编辑模型能够对生成图像的缺失背景进行填补，从而提升所构建的图像编辑模型的编辑性能。

48.

发明公开
视频融合方法、装置、电子设备及可读存储介质有权

公开(公告)号：CN111291218A

公开(公告)日：2020-06-16

申请号：CN202010065820.4

申请日：2020-01-20

Applicant: 北京百度网讯科技有限公司

Inventor： 姚锟 , 洪智滨 , 郭汉奇 , 曾旭升

IPC: G06F16/738 , G06F16/783 , G06K9/62

Abstract: 本申请公开了一种视频融合方法、装置、电子设备及可读存储介质，涉及计算机视觉技术。具体实现方案为根据用户视频的各视频帧图像和模板视频的各视频帧图像，获得用户视频的各视频帧图像中人脸图像的预测三维人脸网格；根据用户视频的各视频帧图像中人脸图像的用户三维人脸网格的用户纹理和模板视频的各视频帧图像中人脸图像的模板三维人脸网格的模板纹理，获得预测三维人脸网格的预测纹理；根据预测三维人脸网格、预测纹理和用户人脸姿态，以及模板人脸姿态，获得预测三维人脸网格的渲染人脸图像；对渲染人脸图像和模板视频的各视频帧图像进行融合处理，以获得融合之后的各融合视频帧图像，并对其进行合成处理获得融合视频。

49.

发明公开
用于生成信息的方法和装置审中-实审

公开(公告)号：CN110534085A

公开(公告)日：2019-12-03

申请号：CN201910806660.1

申请日：2019-08-29

Applicant: 北京百度网讯科技有限公司

Inventor： 姚锟 , 洪智滨 , 韩钧宇 , 刘经拓

IPC: G10L13/02 , G10L13/04 , G10L25/57 , H04N21/233 , H04N21/234 , H04N21/43 , H04N21/439 , H04N21/44

Abstract: 本公开实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括：获取待处理视频中原始音频对应的原始音素序列，以及待处理视频的原始视频帧序列；根据原始音频对应的文本生成合成语音，并确定合成语音对应的合成音素序列；基于合成音素序列对应的合成语音帧标识序列，对原始音素序列对应的原始语音帧标识序列进行处理，得到处理后语音帧标识序列，其中，处理后语音帧标识序列的长度与合成音素序列对应的合成语音帧标识序列长度相等；根据处理后语音帧标识序列，从原始视频帧序列中提取出视频帧生成处理后视频帧序列；使用合成语音和处理后视频帧序列，生成合成视频。该实施方式保证了合成视频中的合成语音和处理后视频帧序列同步。

50.

发明公开
确定人脸关键点位置的方法和装置有权

公开(公告)号：CN110147776A

公开(公告)日：2019-08-20

申请号：CN201910441092.X

申请日：2019-05-24

Applicant: 北京百度网讯科技有限公司

Inventor： 洪智滨 , 郭汉奇

IPC: G06K9/00

Abstract: 本发明实施例提出一种确定人脸关键点位置的方法和装置，方法包括：通过坐标回归网络获取图像中的初步人脸关键点坐标；基于初步人脸关键点坐标和图像中的人脸底层特征，通过位置敏感特征提取网络获取位置敏感特征，位置敏感特征包含初步人脸关键点坐标对应的人脸底层特征和人脸语义特征；根据位置敏感特征，对初步人脸关键点坐标进行修正，确定出图像中的最终人脸关键点坐标。本发明实施例充分利用包括空间位置信息的初步人脸关键点坐标，以及具有底层高分辨率特征的人脸底层特征来获取位置敏感特征，使得获取的位置敏感特征能够具有丰富的语义特征和底层特征，从而提高通过修正得到的最终人脸关键点坐标的精度。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification