Patent search ap:("科大讯飞股份有限公司") AND inv:"雷新宇" Page 1

1.

发明公开
过渡视频生成方法、虚拟角色视频切换方法、装置及设备审中-公开

公开(公告)号：CN119996766A

公开(公告)日：2025-05-13

申请号：CN202510036966.9

申请日：2025-01-09

Applicant: 科大讯飞股份有限公司

Inventor： 王耀 , 疏坤 , 雷新宇 , 何山 , 高建清 , 刘聪 , 庄江腾 , 王众

IPC: H04N21/44 , H04N21/845 , H04N21/81

Abstract: 本申请提出一种过渡视频生成方法、虚拟角色视频切换方法、装置及设备，应用于人工智能技术领域。其中，该过渡视频生成方法包括：获取第一动画视频和第二动画视频，第一动画视频和第二动画视频是同一虚拟角色的不同动画视频；在第一动画视频的时间轴上，确定打断时间点；根据打断时间点处的视频帧和第二动画视频中的视频帧，生成打断时间点对应的过渡视频，过渡视频用于从播放第一动画视频切换至播放第二动画视频的过渡阶段。从而，通过设置打断时间点和提前生成过渡视频的方式，提高虚拟角色动画视频切换的流畅性。

2.

发明公开
视频插帧方法、装置、电子设备、存储介质及产品审中-实审

公开(公告)号：CN119544905A

公开(公告)日：2025-02-28

申请号：CN202411674436.9

申请日：2024-11-21

Applicant: 科大讯飞股份有限公司

Inventor： 史明明 , 雷新宇 , 庄江腾 , 疏坤 , 王众 , 周良 , 何山 , 殷兵 , 刘聪

IPC: H04N7/01 , H04N21/2343 , H04N21/4402

Abstract: 本申请提出一种视频插帧方法、装置、电子设备、存储介质及产品，该方法基于运动模糊预测算法，预测第一图像帧和第二图像帧之间的插入帧的运动模糊权重；其中，第一图像帧和第二图像帧为待插帧视频中的相邻图像帧；基于插帧生成算法，利用运动模糊权重、第一图像帧的像素信息和第二图像帧的像素信息，生成插入帧的第一像素信息；运动模糊预测算法和插帧生成算法是以对第一样本图像帧和第二样本图像帧进行样本插入帧生成时的损失函数最小为目标训练确定的。本方案在确定相邻图像帧之间的插入帧时，对相邻图像帧进行运动模糊分析，运动模糊效果能够捕捉到运动路径和运动速度，从而能够提高插入帧生成准确度，保证插帧效果，进而提高视频流畅度。

3.

发明公开
手语生成方法、装置、电子设备、存储介质及产品审中-实审

公开(公告)号：CN119418714A

公开(公告)日：2025-02-11

申请号：CN202411485954.6

申请日：2024-10-23

Applicant: 科大讯飞股份有限公司

Inventor： 雷新宇 , 王众 , 何山 , 周良 , 殷兵 , 刘聪 , 高建清

IPC: G10L21/10 , G10L21/16 , G10L21/057 , G10L25/63 , G06V40/20 , G06V40/16 , G06N3/0455 , G06N3/098 , G06F18/24 , G10L21/06

Abstract: 本申请提出一种手语生成方法、装置、电子设备、存储介质及产品，该方法对说话人的语音音频中的每帧音频帧进行情感分类，确定语音音频对应的情感特征序列；基于语音音频和情感特征序列，对说话人动作图片帧中的说话人面部动作和手部动作进行调整，生成语音音频对应的说话人手语动作图片序列。采用本申请的技术方案，能够将语音音频结合语音音频的情感特征对说话人动作图片帧中的说话人面部动作和手部动作进行调整，使得说话人的手语动作和面部表情具有情感特征，提高了手语生成的情感度。另外，说话人手语动作图片序列中的说话人面部动作和手部动作的风格与听障人士的手语表达风格相同，提高了手语生成的准确度，更方便听障人士的理解。

4.

发明公开
合成视频的方法、电子设备及计算机程序产品有权

公开(公告)号：CN119323625A

公开(公告)日：2025-01-17

申请号：CN202411866722.5

申请日：2024-12-18

Applicant: 科大讯飞股份有限公司

Inventor： 王众 , 李超龙 , 雷新宇 , 庄江腾 , 疏坤 , 周良 , 何山 , 殷兵 , 刘聪

IPC: G06T11/60 , G10L13/08 , G06V40/20 , G06F16/732 , G06F16/783

Abstract: 本申请提出一种合成视频的方法、电子设备及计算机程序产品。该合成视频的方法包括：获取包含第一虚拟对象的第一视频以及包含目标虚拟对象的肢体动作的第二视频，针对第一视频，去除目标视频段中第一虚拟对象的目标肢体部位，得到待合成视频，目标视频段为第一视频中对应动作插入时段的视频段；基于第二视频和目标视频段的时序对应关系，将第二视频各视频帧的目标肢体部位拼接到待合成视频各视频帧的目标肢体部位缺失处，生成合成视频。由于第二视频仅包含目标肢体部位，因此，可以做到虚拟对象与肢体动作的解耦。在虚拟对象为虚拟人物的情况下，制作第二视频/动作视频时，无需考虑人物主要身体部位的穿着打扮，甚至无需考虑人物的身份。

5.

发明公开
一种图像渲染方法、装置、设备和存储介质审中-实审

公开(公告)号：CN119444955A

公开(公告)日：2025-02-14

申请号：CN202510032187.1

申请日：2025-01-09

Applicant: 科大讯飞股份有限公司

Inventor： 孙晓俊 , 王众 , 雷新宇 , 庄江腾 , 李林 , 周良 , 何山 , 殷兵 , 刘聪

IPC: G06T15/00 , G06T15/50 , G06T15/06

Abstract: 本申请公开了一种图像渲染方法、装置、设备和存储介质，该方法包括：获取三维点云，三维点云包括多个三维点，三维点的属性包括位置属性和色彩相关属性，色彩相关属性包括颜色信息，还包括透明度和反射率中的至少一者；从三维点云中确定目标视角下的渲染图中各像素点分别对应的点集；基于各像素点对应的点集中三维点的属性，确定各像素点的像素值。上述方案，能够提升渲染效果。

6.

发明公开
运动仿真方法、装置、电子设备和存储介质审中-实审

公开(公告)号：CN119417956A

公开(公告)日：2025-02-11

申请号：CN202411478902.6

申请日：2024-10-22

Applicant: 科大讯飞股份有限公司

Inventor： 雷新宇 , 疏坤 , 周良 , 何山 , 殷兵 , 高建清 , 刘聪

IPC: G06T13/40 , G06V40/20 , G06V10/82 , G06N3/044 , G06N3/0442

Abstract: 本发明提供一种运动仿真方法、装置、电子设备和存储介质，其中方法包括：基于虚拟运动参数，从各种步态序列中，选取出仿真所需的目标序列，所述各种步态序列是基于真实运动视频中各帧图像的步态识别结果，对所述真实运动视频进行划分得到的；基于所述目标序列，进行运动仿真。本发明提供的方法、装置、电子设备和存储介质，需基础的摄像机即可实现，无需成套的拍摄设备，且一条真实运动视频即可拆分各种步态序列以支持运动仿真，运动仿真所需的视频数据量大减，这使得运动仿真所需的成本大大降低，为运动仿真的实现提供了便利。另外，以步态识别结果拆分所得的步态序列，实现了针对运动仿真的精细化控制，有助于运动仿真的效果优化。

7.

发明授权
视频生成方法、装置、电子设备和存储介质有权

公开(公告)号：CN115996303B

公开(公告)日：2023-07-25

申请号：CN202310290547.9

申请日：2023-03-23

Applicant: 科大讯飞股份有限公司

Inventor： 雷新宇 , 何山 , 疏坤 , 周良 , 殷兵 , 刘聪

IPC: H04N21/44 , G06V40/16 , G06V10/80 , G06N3/0442 , G06N3/094 , H04N21/439 , H04N21/472 , G10L25/57

Abstract: 本发明涉及图像处理技术领域，提供一种视频生成方法、装置、电子设备和存储介质。方法包括：获取混合语音和多人画面，并对所述多人画面进行人脸检测，获得多个人脸图像，所述混合语音包括至少一人的语音；基于所述多个人脸图像的图像特征和所述混合语音的语音特征，生成多个目标人脸图像组，任一所述目标人脸图像组包括一个人在不同帧的目标人脸图像；将所述多个目标人脸图像组与所述多人画面进行融合，得到多帧目标多人同屏画面，并将所述多帧目标多人同屏画面与所述混合语音进行融合，得到多人会话视频。本发明无需对多个人的视频进行合成即可自动生成多人同屏的多人会话视频，从而节省人工成本，提高多人会话视频的制作效率。

8.

发明授权
合成视频的方法、电子设备及计算机程序产品有权

公开(公告)号：CN119323625B

公开(公告)日：2025-05-09

申请号：CN202411866722.5

申请日：2024-12-18

Applicant: 科大讯飞股份有限公司

Inventor： 王众 , 李超龙 , 雷新宇 , 庄江腾 , 疏坤 , 周良 , 何山 , 殷兵 , 刘聪

IPC: G06T11/60 , G10L13/08 , G06V40/20 , G06F16/732 , G06F16/783

Abstract: 本申请提出一种合成视频的方法、电子设备及计算机程序产品。该合成视频的方法包括：获取包含第一虚拟对象的第一视频以及包含目标虚拟对象的肢体动作的第二视频，针对第一视频，去除目标视频段中第一虚拟对象的目标肢体部位，得到待合成视频，目标视频段为第一视频中对应动作插入时段的视频段；基于第二视频和目标视频段的时序对应关系，将第二视频各视频帧的目标肢体部位拼接到待合成视频各视频帧的目标肢体部位缺失处，生成合成视频。由于第二视频仅包含目标肢体部位，因此，可以做到虚拟对象与肢体动作的解耦。在虚拟对象为虚拟人物的情况下，制作第二视频/动作视频时，无需考虑人物主要身体部位的穿着打扮，甚至无需考虑人物的身份。

9.

发明公开
视频生成方法、装置、电子设备和存储介质有权

公开(公告)号：CN115996303A

公开(公告)日：2023-04-21

申请号：CN202310290547.9

申请日：2023-03-23

Applicant: 科大讯飞股份有限公司

Inventor： 雷新宇 , 何山 , 疏坤 , 周良 , 殷兵 , 刘聪

IPC: H04N21/44 , G06V40/16 , G06V10/80 , G06N3/0442 , G06N3/094 , H04N21/439 , H04N21/472 , G10L25/57

Abstract: 本发明涉及图像处理技术领域，提供一种视频生成方法、装置、电子设备和存储介质。方法包括：获取混合语音和多人画面，并对所述多人画面进行人脸检测，获得多个人脸图像，所述混合语音包括至少一人的语音；基于所述多个人脸图像的图像特征和所述混合语音的语音特征，生成多个目标人脸图像组，任一所述目标人脸图像组包括一个人在不同帧的目标人脸图像；将所述多个目标人脸图像组与所述多人画面进行融合，得到多帧目标多人同屏画面，并将所述多帧目标多人同屏画面与所述混合语音进行融合，得到多人会话视频。本发明无需对多个人的视频进行合成即可自动生成多人同屏的多人会话视频，从而节省人工成本，提高多人会话视频的制作效率。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification