Patent search ap:("科大讯飞股份有限公司") AND inv:"周良" Page 4

31.

发明授权
一种三维点云构建方法、装置、电子设备及存储介质有权

公开(公告)号：CN115393533B

公开(公告)日：2023-05-30

申请号：CN202211326575.3

申请日：2022-10-27

Applicant: 科大讯飞股份有限公司

Inventor： 孙晓俊 , 李林 , 周良 , 何山 , 胡金水 , 殷兵 , 刘聪

IPC: G06T17/00

32.

发明公开
一种人脸建模方法、装置、电子设备及存储介质有权

公开(公告)号：CN116152447A

公开(公告)日：2023-05-23

申请号：CN202310431115.5

申请日：2023-04-21

Applicant: 科大讯飞股份有限公司

Inventor： 杨硕 , 何昊南 , 何山 , 殷兵 , 刘聪 , 周良 , 胡金水

IPC: G06T17/00 , G06V40/16 , G06V10/74 , G06F18/22 , G06N20/00

Abstract: 本申请提供一种人脸建模方法、装置、电子设备及存储介质，所述人脸建模方法，包括：获得包含目标人脸的影像数据；利用预先训练的面部参数处理模型，对所述影像数据中的目标人脸进行参数化建模，得到所述目标人脸的面部参数；其中，所述面部参数处理模型至少基于样本影音数据中的人脸影像数据，以及与所述人脸影像数据对应的语音数据进行人脸参数建模训练得到。该方法通过样本影音数据中的人脸影像数据，以及与所述人脸影像数据对应的语音数据进行人脸参数建模，训练能够基于包含目标人脸的影像数据，获得目标人脸的面部参数的面部参数处理模型，使得所述面部参数处理模型能够学习到二维图像中缺失的、而在语音空间中存在的信息。

33.

发明公开
面部图像生成方法、装置、设备及存储介质无效

公开(公告)号：CN115810215A

公开(公告)日：2023-03-17

申请号：CN202310083541.4

申请日：2023-02-08

Applicant: 科大讯飞股份有限公司

Inventor： 左童春 , 周良 , 何山 , 胡金水 , 刘聪 , 殷兵

IPC: G06V40/16 , G06V10/46 , G06V10/80

Abstract: 本申请提供了一种面部图像生成方法、装置、设备及存储介质，涉及神经网络技术领域。该面部图像生成方法包括：获取面部素材数据，面部素材数据包括面部线框图、面部遮罩图、面部描述文本，以及面部参考图中的至少一种；将面部素材数据输入预先训练的面部生成模型，得到面部生成模型生成的与面部素材数据匹配的目标面部图像。通过一种或多种面部素材数据作为面部生成模型的输入，支持用户可以利用不同模式的面部素材数据对目标面部图像的需求进行表达，降低了用户的操作难度，提高了目标面部图像的生成效率以及准确性。

34.

发明授权
一种虚拟形象生成方法、装置、电子设备及存储介质有权

公开(公告)号：CN115392216B

公开(公告)日：2023-03-14

申请号：CN202211326587.6

申请日：2022-10-27

Applicant: 科大讯飞股份有限公司

Inventor： 左童春 , 周良 , 何山 , 胡金水 , 刘聪 , 殷兵

IPC: G06F40/205 , G06F40/289 , G06F16/335

Abstract: 本申请提供一种虚拟形象生成方法、装置、电子设备及存储介质，所述虚拟形象生成方法，在生成虚拟形象的过程中，基于对期望虚拟形象的描述文本的分析，获得了期望虚拟形象的整体形象描述文本和局部形象描述文本，实现了对所述描述文本的细粒度解耦，有利于从整体到局部的更全面把握虚拟形象的特征。之后，基于对整体形象描述文本和局部形象描述文本的联合预测，得到了参考了整体形象特征的、与所述局部形象描述文本对应的预测形象特征，即可以实现对预测虚拟形象的局部形象的控制，同时也考虑了预测虚拟形象的整体形象，提高了虚拟形象的局部形象与整体形象之间的关联，同时也提高了生成的虚拟形象的质量。

35.

发明公开
基于语音的图像驱动方法、装置、电子设备及存储介质无效

公开(公告)号：CN115393945A

公开(公告)日：2022-11-25

申请号：CN202211327173.5

申请日：2022-10-27

Applicant: 科大讯飞股份有限公司

Inventor： 方嘉仪 , 何山 , 殷兵 , 刘聪 , 周良 , 吴小燕

IPC: G06V40/16 , G06V40/20 , G06V10/22 , G06V10/26 , G06V10/774 , G10L19/04

Abstract: 本申请提出一种基于语音的图像驱动方法、装置、电子设备及存储介质，方法包括：预测目标语音对应的口唇偏移数据和目标语音对应的头部运动数据；根据目标语音对应的口唇偏移数据和目标语音对应的头部运动数据，对待驱动面部图像的各个面部关键点进行位置变换，得到待驱动面部图像的更新后的面部关键点位置；基于待驱动面部图像的更新后的面部关键点位置，生成驱动后的面部图像。采用本申请的技术方案，可以直接预测目标语音对应的口唇偏移数据和头部运动数据，然后根据口唇偏移数据和头部运动数据对待驱动面部图像进行驱动，无需利用目标语音对应的说话视频作为中间媒介，实现了端到端的语音驱动图像，提高了语音驱动图像的效率。

36.

发明公开
虚拟形象的生成方法、装置、设备及存储介质有权

公开(公告)号：CN115393486A

公开(公告)日：2022-11-25

申请号：CN202211326581.9

申请日：2022-10-27

Applicant: 科大讯飞股份有限公司

Inventor： 李林 , 周良 , 何山 , 胡金水 , 殷兵 , 刘聪

IPC: G06T13/40 , G06T13/20

Abstract: 本申请提供了虚拟形象的生成方法、装置、设备及存储介质，具体实现方案为：确定待处理图像中目标人物的人脸形状特征和表情特征；基于人脸形状特征和表情特征，优化预设的初始三维真人脸部模型中的脸部形状参数和表情参数，得到第一人脸形状参数和第一表情参数；利用初始三维真人脸部模型与初始虚拟形象模型的映射关系，将第一人脸形状参数和第一表情参数迁移至初始虚拟形象模型中，得到目标虚拟形象模型；其中，初始三维真人脸部模型和初始虚拟形象模型均是由基础脸部模型以及脸部形状基和表情基而确定的模型；基于目标虚拟形象模型生成目标人物对应的虚拟形象。根据本申请的技术方案，能够有效减小生成的虚拟形象与真人形象之间差距。

37.

发明公开
一种虚拟形象生成方法、装置、电子设备及存储介质有权

公开(公告)号：CN115392216A

公开(公告)日：2022-11-25

申请号：CN202211326587.6

申请日：2022-10-27

Applicant: 科大讯飞股份有限公司

Inventor： 左童春 , 周良 , 何山 , 胡金水 , 刘聪 , 殷兵

IPC: G06F40/205 , G06F40/289 , G06F16/335

Abstract: 本申请提供一种虚拟形象生成方法、装置、电子设备及存储介质，所述虚拟形象生成方法，在生成虚拟形象的过程中，基于对期望虚拟形象的描述文本的分析，获得了期望虚拟形象的整体形象描述文本和局部形象描述文本，实现了对所述描述文本的细粒度解耦，有利于从整体到局部的更全面把握虚拟形象的特征。之后，基于对整体形象描述文本和局部形象描述文本的联合预测，得到了参考了整体形象特征的、与所述局部形象描述文本对应的预测形象特征，即可以实现对预测虚拟形象的局部形象的控制，同时也考虑了预测虚拟形象的整体形象，提高了虚拟形象的局部形象与整体形象之间的关联，同时也提高了生成的虚拟形象的质量。

38.

发明公开
虚拟人交互方法、装置、电子设备及存储介质有权

公开(公告)号：CN115390678A

公开(公告)日：2022-11-25

申请号：CN202211326573.4

申请日：2022-10-27

Applicant: 科大讯飞股份有限公司

Inventor： 江昊宸 , 何山 , 殷兵 , 刘聪 , 周良 , 胡金水

IPC: G06F3/01 , G06T13/20 , G06T13/40

Abstract: 本申请提出一种虚拟人交互方法、装置、电子设备及存储介质，通过对目标对象的音视频数据进行视线追踪和情感分析，确定目标对象的视线轨迹特征和情感状态；根据目标对象的情感状态和虚拟形象的当前情感状态，预测虚拟形象的下一时刻情感状态；根据目标对象和虚拟形象的视线轨迹特征、目标对象的情感状态、虚拟形象的下一时刻情感状态、虚拟形象当前时刻的交互状态参数，预测虚拟形象下一时刻的交互状态参数，交互状态参数包括视线方向。本方案基于目标对象的情感状态与虚拟形象的情感状态，对目标对象和虚拟形象进行视线交互预测，实现了虚拟形象与目标对象在不同情感状态下的视线交互，提高了目标对象与虚拟形象的交互真实感和交互体验。

39.

发明公开
语音合成方法、装置、设备及存储介质有权

公开(公告)号：CN112802444A

公开(公告)日：2021-05-14

申请号：CN202011607966.3

申请日：2020-12-30

Applicant: 科大讯飞股份有限公司

Inventor： 周良 , 孟廷 , 侯秋侠 , 刘丹 , 江源 , 胡亚军

IPC: G10L13/02 , G10L13/08 , G10L15/16

Abstract: 本申请公开了一种语音合成方法、装置、设备及存储介质，本申请在对待合成的原始文本进行语音合成的过程中，参考了与原始文本存在相匹配的文本片段的匹配文本对应的辅助合成特征，该辅助合成特征为基于匹配文本对应的发音音频所确定的用于辅助语音合成的特征，本申请通过参考匹配文本对应的辅助合成特征，可以利用匹配文本对应的发音音频中发音信息辅助对原始文本进行语音合成，丰富了原始文本语音合成时所参考的信息，进而提高了原始文本的语音合成质量。本申请方案可以适用于带前端预处理和不带前端预处理两种类型的语音合成系统，辅助合成特征可以作为前端文本分析结果也可以直接辅助语音合成系统进行语音合成，均能够提高合成语音的质量。

40.

发明公开
语音合成方法、相关设备及可读存储介质有权

公开(公告)号：CN111128118A

公开(公告)日：2020-05-08

申请号：CN201911393613.5

申请日：2019-12-30

Applicant: 科大讯飞股份有限公司

Inventor： 周良 , 王志鹍 , 江源 , 胡国平

IPC: G10L13/02 , G10L13/08 , G10L25/30 , G10L25/63

Abstract: 本申请公开了一种语音合成方法、相关设备及可读存储介质，获取待进行语音合成的文本后，确定该文本对应的情感编码，利用该文本对应的情感编码，得到该文本的语音合成参数，对该文本的语音合成参数进行语音合成处理，得到该文本对应的语音。上述方案中，由于该文本对应的情感编码能够指示该文本进行语音合成时的情感强度，而用户可以根据自身对语音合成的情感强度需求控制该文本对应的情感编码，使得利用该文本对应的情感编码得到的该文本对应的语音，是满足用户对语音合成时的情感强度需求的语音。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification