Patent search ap:("科大讯飞股份有限公司") AND inv:"何山" Page 6

51.

发明授权
图像特征点匹配方法、计算机设备及存储装置有权

公开(公告)号：CN112686302B

公开(公告)日：2024-02-13

申请号：CN202011594625.7

申请日：2020-12-29

Applicant: 科大讯飞股份有限公司

Inventor： 孙晓俊 , 胡金水 , 何山 , 李林

IPC: G06V10/75

Abstract: 本申请公开了一种图像特征点匹配方法、计算机设备及存储装置。该方法包括：获取待匹配的两张目标图像；分别对每张目标图像进行特征点提取，得到每张目标图像的若干个第一特征点；确定每个第一特征点的描述子；利用描述子对两张目标图像中的第一特征点进行匹配，得到至少一组第一匹配点对；其中，每组第一匹配点对的彩色像素值满足光照一致性。上述方案，能够提高图像特征点匹配的准确度。

52.

发明公开
视频生成方法、装置、设备和存储介质审中-实审

公开(公告)号：CN117336567A

公开(公告)日：2024-01-02

申请号：CN202311030837.6

申请日：2023-08-14

Applicant: 科大讯飞股份有限公司

Inventor： 高建清 , 左童春 , 姚仕豪 , 何山 , 郜静文 , 杨硕 , 殷保才 , 殷兵 , 刘烨秋 , 付新勇 , 王雨露 , 张若楠 , 管广鹏 , 吕磊 , 陈付国 , 金左雨 , 董飞 , 胡国平 , 刘聪 , 魏思 , 王士进 , 刘权

IPC: H04N21/81 , H04N21/44 , G10L13/027 , G10L13/08

Abstract: 本申请公开了一种视频生成方法、装置、设备和存储介质，其中，视频生成方法包括：获取原始文稿和原始文稿的原始配图；获取响应于原始文稿和原始配图而分析得到且用于配音的参考数据；其中，参考数据包含文案文本、表征文案文本所蕴含情感信息的第一文本和至少表征文案文本需采用发音音色的第二文本；基于参考数据进行语音合成，得到视频配音；至少基于原始配图和视频配音，生成目标视频。上述方案，能够提高视频生成效率，降低视频生成成本。

53.

发明公开
图像生成方法、装置、电子设备和计算机可读存储介质有权

公开(公告)号：CN116580127A

公开(公告)日：2023-08-11

申请号：CN202310856919.X

申请日：2023-07-13

Applicant: 科大讯飞股份有限公司

Inventor： 疏坤 , 何山 , 殷兵 , 胡金水 , 刘聪

IPC: G06T11/20 , G06T11/60

Abstract: 本申请公开了一种图像生成方法、装置、电子设备和计算机可读存储介质，该方法包括：获取第一生成图像；响应于针对第一生成图像对应的待调整区域的图像编辑指令，获取与待调整区域关联的参考图像或第一提示词，作为第一生成信息；基于第一生成信息生成调整图像；利用调整图像对待调整区域进行调整，得到第二生成图像，上述方案，能够提高图像生成效率。

54.

发明授权
视频生成方法、装置、电子设备和存储介质有权

公开(公告)号：CN115996303B

公开(公告)日：2023-07-25

申请号：CN202310290547.9

申请日：2023-03-23

Applicant: 科大讯飞股份有限公司

Inventor： 雷新宇 , 何山 , 疏坤 , 周良 , 殷兵 , 刘聪

IPC: H04N21/44 , G06V40/16 , G06V10/80 , G06N3/0442 , G06N3/094 , H04N21/439 , H04N21/472 , G10L25/57

Abstract: 本发明涉及图像处理技术领域，提供一种视频生成方法、装置、电子设备和存储介质。方法包括：获取混合语音和多人画面，并对所述多人画面进行人脸检测，获得多个人脸图像，所述混合语音包括至少一人的语音；基于所述多个人脸图像的图像特征和所述混合语音的语音特征，生成多个目标人脸图像组，任一所述目标人脸图像组包括一个人在不同帧的目标人脸图像；将所述多个目标人脸图像组与所述多人画面进行融合，得到多帧目标多人同屏画面，并将所述多帧目标多人同屏画面与所述混合语音进行融合，得到多人会话视频。本发明无需对多个人的视频进行合成即可自动生成多人同屏的多人会话视频，从而节省人工成本，提高多人会话视频的制作效率。

55.

发明授权
重定向方法、装置、电子设备和存储介质有权

公开(公告)号：CN115471618B

公开(公告)日：2023-05-30

申请号：CN202211327163.1

申请日：2022-10-27

Applicant: 科大讯飞股份有限公司

Inventor： 杨硕 , 何山 , 殷兵 , 刘聪 , 周良 , 胡金水

IPC: G06T17/00 , G06T19/00 , G06T19/20

56.

发明公开
虚拟形象的生成方法、装置、设备及存储介质审中-实审

公开(公告)号：CN115908657A

公开(公告)日：2023-04-04

申请号：CN202211435654.8

申请日：2022-11-16

Applicant: 科大讯飞股份有限公司

Inventor： 吴小燕 , 何山 , 殷兵 , 刘聪 , 周良

IPC: G06T13/40 , G06T15/04 , G06T19/00 , G06N3/0455 , G06F40/30

Abstract: 本申请提供了一种虚拟形象的生成方法、装置、设备及存储介质，具体实现方案为：利用文本与纹理的特征库，确定所述待处理文本数据对应的纹理特征；其中，所述文本与纹理的特征库中记录有文本以及与文本对应的纹理特征；基于所述待处理文本数据和所述纹理特征生成虚拟形象的语义特征；基于所述语义特征生成虚拟形象。根据本申请的技术方案，能够降低虚拟形象的生成难度，提升虚拟形象的生成效率。

57.

发明授权
虚拟形象的生成方法、装置、电子设备和存储介质有权

公开(公告)号：CN115439614B

公开(公告)日：2023-03-14

申请号：CN202211326579.1

申请日：2022-10-27

Applicant: 科大讯飞股份有限公司

Inventor： 刘聪 , 胡诗卉 , 何山 , 周良 , 胡金水 , 殷兵

IPC: G06T17/00 , G06T13/40 , G06V10/774 , G06V10/80 , G06V20/40 , G06V40/16 , G10L25/03

Abstract: 本申请提出一种虚拟形象的生成方法、装置、电子设备和存储介质，能够从目标用户的音频数据中提取得到音素特征，以及从与音频数据同步的视频数据中提取得到面部表情特征。基于上述音素特征和面部表情特征，解算得到目标用户的面部表情参数序列。其中，面部动作较为复杂的部分集中在下半张脸的口唇区域，而用户说话的语音音素与口唇动作有较强的相关性，因此，本申请引入音素特征，根据音素特征和面部表情特征解算面部表情参数序列，利用面部表情参数序列驱动目标用户对应的三维虚拟形象模型生成的虚拟形象，能够精确还原目标用户面部的动作。

58.

发明授权
脸部绑定方法、装置、设备及存储介质有权

公开(公告)号：CN115393532B

公开(公告)日：2023-03-14

申请号：CN202211326540.X

申请日：2022-10-27

Applicant: 科大讯飞股份有限公司

Inventor： 胡诗卉 , 何山 , 周良 , 胡金水 , 殷兵 , 刘聪

IPC: G06T17/00 , G06T13/40 , G06V40/16

Abstract: 本申请提供了一种脸部绑定方法、装置、设备及存储介质，涉及人工智能技术领域，具体实现方案为：利用获取到的目标对象的脸部图像，在目标对象对应的三维人脸模型中确定三维人脸模型的脸部特征区域；在脸部特征区域中确定对应的三维人脸模型顶点与脸部骨骼点的目标连接关系和三维人脸模型顶点与脸部骨骼点的目标运动关系；根据三维人脸模型顶点与脸部骨骼点的目标连接关系和三维人脸模型顶点与脸部骨骼点的目标运动关系，确定目标对象的三维人脸模型顶点与脸部骨骼点的绑定关系根据本申请的技术方案，能够在三维建模软件中实现三维人脸模型顶点与脸部骨骼点的自动绑定，提高脸部绑定效率，进而提升虚拟形象的生成效率。

59.

发明公开
基于语音的动作生成方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN115762574A

公开(公告)日：2023-03-07

申请号：CN202211435101.2

申请日：2022-11-16

Applicant: 科大讯飞股份有限公司

Inventor： 何山 , 周良 , 殷兵 , 刘聪 , 戴礼荣

IPC: G10L25/57 , G10L25/03 , G06F18/25 , G06F18/2431 , G06N3/0455 , G06N3/0464 , G06N3/042 , G06N3/08

Abstract: 本申请提出一种基于语音的动作生成方法、装置、电子设备及存储介质，该方法包括：确定目标语音中包含的动作意图，并确定与所述动作意图相匹配的第一动作序列；以及，从所述目标语音中提取得到语音韵律特征，并基于所述语音韵律特征预测得到与所述语音韵律特征相匹配的第二动作序列；对所述第一动作序列和所述第二动作序列进行融合处理，生成与所述目标语音相匹配的动作序列。上述方案通过多维度的信息生成了与目标语音相匹配的动作序列，从而使得生成的与目标语音相匹配的动作序列更准确，并且更加自然、协调。

60.

发明公开
一种三维点云构建方法、装置、电子设备及存储介质有权

公开(公告)号：CN115393533A

公开(公告)日：2022-11-25

申请号：CN202211326575.3

申请日：2022-10-27

Applicant: 科大讯飞股份有限公司

Inventor： 孙晓俊 , 李林 , 周良 , 何山 , 胡金水 , 殷兵 , 刘聪

IPC: G06T17/00

Abstract: 本申请提供一种三维点云构建方法、装置、电子设备及存储介质，所述三维点云构建方法，通过对第一分辨率的三维点云进行点云区域划分，并在划分得到的点云区域的基础上，分别对各区域的点云进行第二分辨率的三维点云重建，上述的处理过程将高精度三维点云构建过程分为低精度三维点云构建，以及对低精度三维点云进行分区域的并行高精度点云重建，有效的避免了大规模点云在重建过程中对计算机的内存和性能造成的压力，同时通过并行对多个点云区域的三维点云重建，有效的提高了三维点云的重建效率，并且能够构建得到高精度的三维点云。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification