Patent search ap:("华为云计算技术有限公司") AND inv:"彭亮" Page 1

1.

发明公开
一种3D人脸动画生成方法及装置审中-公开

公开(公告)号：CN118537457A

公开(公告)日：2024-08-23

申请号：CN202310627046.5

申请日：2023-05-30

Applicant: 华为云计算技术有限公司

Inventor： 彭亮 , 马飞 , 李明磊 , 怀宝兴

IPC: G06T13/40 , G06V40/16 , G10L25/63

Abstract: 一种3D人脸动画生成方法及装置，包括：获取3D人脸基准模型和待处理的音频数据以及该音频数据对应的脸部状态语义信息，其中，脸部状态语义信息用于指示所述音频数据所包括的每一段语音内容对应的脸部状态；基于所述3D人脸基准模型、音频数据和脸部状态语义信息，生成3D人脸动画，该3D人脸动画中的3D人脸基准模型受音频数据驱动做出与所述音频数据的每一段语音内容相匹配的脸部状态，使得该3D人脸动画能够更加真实准确、自然流畅表达出一段音频数据中的情绪变化。

2.

发明公开
一种数字人视频生成方法及相关装置审中-公开

公开(公告)号：CN118537456A

公开(公告)日：2024-08-23

申请号：CN202310505617.8

申请日：2023-05-06

Applicant: 华为云计算技术有限公司

Inventor： 吴玉博 , 马飞 , 彭亮 , 李明磊 , 怀宝兴

IPC: G06T13/40 , G06T13/20

Abstract: 本申请提供了一种数字人视频生成方法及相关装置，所述方法应用于数字人生成领域，所述方法包括：获取第一音频，使用第一音频驱动数字人，生成第一数字人视频，其中，第一数字人视频中包括数字人的第一面部动作系列和第一肢体动作序列中的至少一种，第一音频与第一面部动作系列和第一肢体动作序列中的至少一种适配，其中，面部动作包括面部各个器官的微表情和面部肌肉的微表情。将音频应用于数字人领域，使得数字人的肢体动作和面部动作可以随着音频的变化而变化，实施本申请实施例，丰富了数字人的形态、表情和动作。

3.

发明公开
数字人视频的生成方法、装置、设备及存储介质审中-公开

公开(公告)号：CN118870137A

公开(公告)日：2024-10-29

申请号：CN202310429308.7

申请日：2023-04-20

Applicant: 华为云计算技术有限公司

Inventor： 马飞 , 彭亮 , 李明磊 , 怀宝兴

IPC: H04N21/81 , H04N21/234 , H04N21/235 , H04N21/472

Abstract: 本申请公开了一种数字人视频的生成方法、装置、设备及存储介质，属于人工智能技术领域。该方法包括：获取数字人对应的单张对象图像，响应于针对对象图像中对象属性的调整指令，生成用于展示对象属性调整后数字人状态的数字人图像资源，数字人图像资源包括至少一张数字人图像；用音频驱动数字人图像资源中的数字人做出与音频内容匹配的口型，以生成以对象属性调整后的状态表达音频内容的数字人视频。本申请提供了一种支持灵活编辑对象属性的数字人视频生成流程，基于输入的单张对象图像，无需更多操作，即可根据用户需求来调整数字人呈现的对象属性，生成自然、真实性强的数字人视频，提升用户体验，降低生成过程中提高真实性所需的操作成本。

4.

发明公开
多媒体流的处理方法、装置及相关设备审中-公开

公开(公告)号：CN119814948A

公开(公告)日：2025-04-11

申请号：CN202311412575.X

申请日：2023-10-27

Applicant: 华为云计算技术有限公司

Inventor： 陈志毅 , 李明磊 , 彭亮 , 戴博纬 , 胥皇 , 陈飞扬 , 王喆锋 , 高原 , 杨昌鹏

IPC: H04N5/76 , H04N5/91 , H04N21/431 , H04N21/439 , H04N21/44

Abstract: 本申请提供一种多媒体流的处理方法，包括：输出配置界面，并响应于用户在该配置界面上的操作，获取第一配置信息，该第一配置信息用于配置录制任务、检测算法、录制要求；获取该录制任务下的多媒体流，该多媒体流为对被采集对象进行视频录制得到的视频流，或者是进行语音录制得到的音频流；根据用户配置的检测算法，对多媒体流进行检测，得到检测结果，并当该检测结果不满足用户配置的录制要求时，输出针对被采集对象的录制建议。如此，通过反馈建议，能够有效提高生成符合用户预期的录制视频/音频的效率，而且，能够满足不同用户对于不同录制任务、不同检测算法、不同录制要求的差异化需求。此外，本申请还提供了对应的处理装置及相关设备。

5.

发明公开
数字人多媒体资源的生成方法、装置、设备及存储介质审中-公开

公开(公告)号：CN118860233A

公开(公告)日：2024-10-29

申请号：CN202310389438.2

申请日：2023-04-12

Applicant: 华为云计算技术有限公司

Inventor： 马飞 , 彭亮 , 李明磊 , 怀宝兴

IPC: G06F3/04842 , G06F3/0481 , G06T13/20 , G06T13/40

Abstract: 本申请公开了一种数字人多媒体资源的生成方法、装置、设备及存储介质，属于人工智能技术领域。该方法包括：响应于针对数字人的多媒体资源生成请求，根据对象的音频描述信息来确定与之匹配的音频，并基于音频调整数字人的形象，使得调整后的数字人的形象与该音频的内容匹配，进而驱动数字人动起来，得到数字人的多媒体资源。在这一过程中，无需手动调整数字人的形象，以使数字人的形象与音频的内容匹配，从而简化了人机交互操作，提高了数字人多媒体资源的生成效率，提升了用户体验感。

6.

发明公开
一种虚拟对象的动作图像数据生成方法、装置及相关设备审中-实审

公开(公告)号：CN116681807A

公开(公告)日：2023-09-01

申请号：CN202310489294.8

申请日：2023-04-28

Applicant: 深圳华为云计算技术有限公司

Inventor： 彭亮 , 马飞 , 李明磊 , 怀宝兴

IPC: G06T13/40 , G06T13/20 , G06V40/20 , G06V10/764 , G06V10/82

Abstract: 本申请公开了应用于计算机技术领域的一种虚拟对象的动作图像数据生成方法、装置及相关设备。在该方法中，获取目标音乐、形象参考图像以及乐器类型，将目标音乐、形象参考图像以及乐器类型作为手势驱动模型的输入数据，得到手势驱动模型输出的虚拟对象的乐器演奏动作图像数据。手势驱动模型能够支持多种乐器类型。目标乐器类型是手势驱动模型支持的多种乐器类型中的一种。利用手势驱动模型能够生成多种乐器类型中，指定的目标乐器类型对应的虚拟对象的乐器演奏动作图像数据。如此无需训练多个驱动模型，降低成本。

Patent Agency Ranking