Patent search ap:("科大讯飞股份有限公司") AND inv:"何山" Page 3

21.

发明授权
一种视频浓缩方法及装置有权转让

公开(公告)号：CN109862313B

公开(公告)日：2022-01-14

申请号：CN201811518639.3

申请日：2018-12-12

Applicant: 科大讯飞股份有限公司

Inventor： 疏坤 , 吴小燕 , 殷兵 , 何山 , 柳林 , 刘聪 , 杨世清

IPC: H04N7/18 , G06F16/75

Abstract: 本申请公开了一种视频浓缩方法及装置，该方法包括：获取包括多个运动目标的待浓缩视频，随后为各个浓缩图像选择运动目标组合方式，该各个浓缩图像是对待浓缩视频进行浓缩后得到的各个帧图像，以便根据各个浓缩图像中的运动目标组合方式，对待浓缩视频进行视频浓缩。可见，本申请可以为每一帧浓缩图像选择一种合理的运动目标组合方式，从而使每帧浓缩图像中的各个运动目标能够最大限度的占据图像空间、并使每帧浓缩图像中的不同运动目标之间的重叠程度尽量小，进而提高浓缩视频的浓缩精度。

22.

发明公开
一种三维人脸处理方法及电子设备审中-实审

公开(公告)号：CN112734895A

公开(公告)日：2021-04-30

申请号：CN202011643370.9

申请日：2020-12-30

Applicant: 科大讯飞股份有限公司

Inventor： 屈雁秋 , 何山 , 胡金水 , 殷兵

IPC: G06T15/04 , G06T17/00

Abstract: 本申请提供一种三维人脸处理方法包括：重建视频序列中的三维人脸，以获取三维人脸参数集；以及使用三维人脸对应的二维人脸图像纹理，为所述三维人脸参数集添加时域约束，并优化所述三维人脸参数集，以使得所述三维人脸参数集在时域上与二维人脸图像纹理满足预设条件，其中所述时域约束由二维图像纹理的一致性表征。本申请还提供了相应的电子设备。通过上述方案，本申请保证重建后的三维人脸参数的时域连续，并保证三维人脸参数稳定平滑，并且不会造成迟滞问题。

23.

发明公开
虚假视频检测方法和装置、电子设备及存储介质无效

公开(公告)号：CN112686123A

公开(公告)日：2021-04-20

申请号：CN202011562921.9

申请日：2020-12-25

Applicant: 科大讯飞股份有限公司

Inventor： 何山 , 殷兵 , 胡金水 , 刘聪 , 戴礼荣 , 胡郁

IPC: G06K9/00 , G06K9/46 , G06N3/02

Abstract: 本申请公开了一种虚假视频检测方法和装置、电子设备及存储介质。该方法包括：获取待测试视频和第一历史视频，待测试视频包括多个第一视频帧，第一历史视频包括多个第二视频帧；分别将各第一视频帧中面部以外的人体区域与对应的第二视频帧中面部以外的人体区域进行比对，得到比对结果；判断比对结果是否满足第一预设条件；若满足，则认为待测试视频为虚假视频。通过上述方式，能够提高虚假视频判断结果的准确度。

24.

发明公开
神经网络的训练方法及基于神经网络的行人属性识别方法有权转让

公开(公告)号：CN109829356A

公开(公告)日：2019-05-31

申请号：CN201811482879.2

申请日：2018-12-05

Applicant: 科大讯飞股份有限公司

Inventor： 李倩玉 , 何山 , 殷兵 , 刘聪 , 柳林

IPC: G06K9/00 , G06K9/62

Abstract: 本发明提供了一种神经网络的训练方法及基于神经网络的行人属性识别方法，该识别方法包括：获取待识别的目标行人图像；对目标行人图像作身体区域分割，获取与不同身体区域对应的多个局部图像；将多个局部图像分别输入至预先经过训练的与不同身体区域相对应的多个属性识别网络，得到与不同身体区域对应的多组目标行人属性；其中，目标属性识别网络用于结合目标行人图像中行人的性别信息，以及目标局部图像中目标身体区域的方向信息，来识别目标行人图像中行人的全身属性，以及专属于目标身体区域的行人属性；对多组目标行人属性进行汇总处理，得到目标行人图像的多个目标行人属性。本发明能够在识别行人属性时，提升泛化能力以及识别准确度。

25.

发明公开
一种视频翻译方法及相关装置审中-实审

公开(公告)号：CN119629295A

公开(公告)日：2025-03-14

申请号：CN202411879800.5

申请日：2024-12-19

Applicant: 科大讯飞股份有限公司

Inventor： 疏坤 , 何山 , 殷兵 , 李如子 , 田定书

IPC: H04N5/265 , G10L13/02 , G10L13/08 , G06V40/16 , G06F40/205

Abstract: 本申请公开了一种视频翻译方法及相关装置，涉及视频处理技术领域，包括：获取待翻译的原始视频之后，先利用原始视频中说话者的声纹特征和情绪标签进行语音合成，得到目标语言的语音数据，再将目标语言的语音数据替换原始视频中的原始语音数据，得到初始翻译视频，然后利用目标语言的语音数据进行说话者嘴部区域图像合成，得到说话者嘴部区域的合成图像，最后将说话者嘴部区域的合成图像与初始翻译视频进行融合，得到最终翻译视频。该方案能够尽量还原视频原声，并尽量贴合原视频中人物的说话状态，而且能够保证最终翻译视频中，在口唇画面丢失或者出现前后画面的自然过渡，因此可以提升用户听觉感受和视觉感受。

26.

发明公开
一种图像处理方法、装置、设备和存储介质审中-实审

公开(公告)号：CN119559194A

公开(公告)日：2025-03-04

申请号：CN202411486415.4

申请日：2024-10-23

Applicant: 科大讯飞股份有限公司

Inventor： 范帆 , 李超龙 , 何山 , 殷兵 , 刘聪 , 高建清

IPC: G06T7/11 , G06T7/194 , G06T3/04 , G06V10/80

Abstract: 本申请公开了一种图像处理方法、装置、设备和存储介质，该方法包括：获取待抠图的目标图像、以及目标背景的描述信息；目标背景与目标图像中的背景不同；融合目标图像的图像特征和描述信息的描述特征，得到融合特征；基于融合特征进行解码，得到目标解码结果，目标解码结果包括目标图像的前景分割结果、以及目标图像中前景与目标背景的融合图像。通过上述方式，本申请能够为用户提供丰富的图像信息。

27.

发明公开
合成视频的方法、电子设备及计算机程序产品有权

公开(公告)号：CN119323625A

公开(公告)日：2025-01-17

申请号：CN202411866722.5

申请日：2024-12-18

Applicant: 科大讯飞股份有限公司

Inventor： 王众 , 李超龙 , 雷新宇 , 庄江腾 , 疏坤 , 周良 , 何山 , 殷兵 , 刘聪

IPC: G06T11/60 , G10L13/08 , G06V40/20 , G06F16/732 , G06F16/783

Abstract: 本申请提出一种合成视频的方法、电子设备及计算机程序产品。该合成视频的方法包括：获取包含第一虚拟对象的第一视频以及包含目标虚拟对象的肢体动作的第二视频，针对第一视频，去除目标视频段中第一虚拟对象的目标肢体部位，得到待合成视频，目标视频段为第一视频中对应动作插入时段的视频段；基于第二视频和目标视频段的时序对应关系，将第二视频各视频帧的目标肢体部位拼接到待合成视频各视频帧的目标肢体部位缺失处，生成合成视频。由于第二视频仅包含目标肢体部位，因此，可以做到虚拟对象与肢体动作的解耦。在虚拟对象为虚拟人物的情况下，制作第二视频/动作视频时，无需考虑人物主要身体部位的穿着打扮，甚至无需考虑人物的身份。

28.

发明授权
虚拟形象生成方法及相关装置、电子设备、存储介质有权

公开(公告)号：CN114913303B

公开(公告)日：2024-11-08

申请号：CN202210395741.9

申请日：2022-04-14

Applicant: 科大讯飞股份有限公司

Inventor： 左童春 , 何山 , 胡金水 , 刘聪 , 殷兵

IPC: G06T17/20 , G06V10/80

Abstract: 本申请公开了一种虚拟形象生成方法及相关装置、电子设备、存储介质，其中，虚拟形象生成方法包括：获取用户对期望虚拟形象的描述文本，并获取若干形象特征；基于各形象特征分别与描述文本的文本特征进行形象生成，得到候选虚拟形象；响应于用户选择候选虚拟形象作为目标虚拟形象，获取符合目标虚拟形象的特征分布的特征表示作为新的形象特征；基于新的形象特征和文本特征生成最终虚拟形象。上述方案，能够在满足个性化的虚拟形象生成需求基础上，减少虚拟形象生成的时长和成本，并降低对硬件设备的要求。

29.

发明授权
一种动画绘本生成方法、装置、设备和存储介质有权

公开(公告)号：CN114359446B

公开(公告)日：2024-11-01

申请号：CN202111658559.X

申请日：2021-12-30

Applicant: 科大讯飞股份有限公司

Inventor： 吴小燕 , 何山 , 殷兵 , 胡金水

IPC: G06T13/40 , G10L13/08 , G06V20/60 , G06V20/62 , G06V10/74 , G06V10/82

Abstract: 本申请公开了一种动画绘本生成方法、装置、设备和存储介质，该方法包括：识别静态绘本中的若干对象以及若干文本；确定各对象以及各文本之间的对应关系，其中，对应关系表示文本由与文本对应的对象讲述；生成各文本的语音数据，以及确定各文本对应的对象的画面变化内容，其中，画面变化内容表示在播放文本对应的语音数据过程中对象的预设部位的变化；基于语音数据和画面变化内容，生成静态绘本对应的动画绘本数据。通过上述方式，本申请能够将绘本中的静态人物转化为能说会动的动画人物。

30.

发明公开
三维人体重建方法、装置、设备及存储介质审中-实审

公开(公告)号：CN117808700A

公开(公告)日：2024-04-02

申请号：CN202311858003.4

申请日：2023-12-29

Applicant: 科大讯飞股份有限公司 , 科大讯飞(苏州)科技有限公司

Inventor： 张镇 , 李林 , 何山 , 周良 , 殷兵 , 刘聪

IPC: G06T5/70 , G06T7/50 , G06T7/80 , G06T7/13 , G06T5/50 , G06T17/00

Abstract: 本申请实施例公开了一种三维人体重建方法、装置、设备及存储介质，在获取从不同视角采集的同一人体的图像后，对各张图像进行特征提取，得到各张图像的特征信息；基于各张图像的特征信息，对各张图像的前景和背景分别进行预测，得到各个像素的预测信息，其中，任一像素的预测信息包括：任一像素属于前景的概率，对应前景的该任一像素的深度符合的第一概率分布函数，以及对应背景的该任一像素的深度符合的第二概率分布函数。基于各张图像的像素的预测信息确定各张图像的深度图像，将各张深度图像融合，得到人体的三维点云。本申请减少了人体非参数化模型的边缘的噪声。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification