Patent search ap:("科大讯飞股份有限公司") AND inv:"王众" Page 1

1.

发明公开
一种图像渲染方法、装置、设备和存储介质审中-实审

公开(公告)号：CN119444955A

公开(公告)日：2025-02-14

申请号：CN202510032187.1

申请日：2025-01-09

Applicant: 科大讯飞股份有限公司

Inventor： 孙晓俊 , 王众 , 雷新宇 , 庄江腾 , 李林 , 周良 , 何山 , 殷兵 , 刘聪

IPC: G06T15/00 , G06T15/50 , G06T15/06

Abstract: 本申请公开了一种图像渲染方法、装置、设备和存储介质，该方法包括：获取三维点云，三维点云包括多个三维点，三维点的属性包括位置属性和色彩相关属性，色彩相关属性包括颜色信息，还包括透明度和反射率中的至少一者；从三维点云中确定目标视角下的渲染图中各像素点分别对应的点集；基于各像素点对应的点集中三维点的属性，确定各像素点的像素值。上述方案，能够提升渲染效果。

2.

发明公开
过渡视频生成方法、虚拟角色视频切换方法、装置及设备审中-公开

公开(公告)号：CN119996766A

公开(公告)日：2025-05-13

申请号：CN202510036966.9

申请日：2025-01-09

Applicant: 科大讯飞股份有限公司

Inventor： 王耀 , 疏坤 , 雷新宇 , 何山 , 高建清 , 刘聪 , 庄江腾 , 王众

IPC: H04N21/44 , H04N21/845 , H04N21/81

Abstract: 本申请提出一种过渡视频生成方法、虚拟角色视频切换方法、装置及设备，应用于人工智能技术领域。其中，该过渡视频生成方法包括：获取第一动画视频和第二动画视频，第一动画视频和第二动画视频是同一虚拟角色的不同动画视频；在第一动画视频的时间轴上，确定打断时间点；根据打断时间点处的视频帧和第二动画视频中的视频帧，生成打断时间点对应的过渡视频，过渡视频用于从播放第一动画视频切换至播放第二动画视频的过渡阶段。从而，通过设置打断时间点和提前生成过渡视频的方式，提高虚拟角色动画视频切换的流畅性。

3.

发明授权
合成视频的方法、电子设备及计算机程序产品有权

公开(公告)号：CN119323625B

公开(公告)日：2025-05-09

申请号：CN202411866722.5

申请日：2024-12-18

Applicant: 科大讯飞股份有限公司

Inventor： 王众 , 李超龙 , 雷新宇 , 庄江腾 , 疏坤 , 周良 , 何山 , 殷兵 , 刘聪

IPC: G06T11/60 , G10L13/08 , G06V40/20 , G06F16/732 , G06F16/783

Abstract: 本申请提出一种合成视频的方法、电子设备及计算机程序产品。该合成视频的方法包括：获取包含第一虚拟对象的第一视频以及包含目标虚拟对象的肢体动作的第二视频，针对第一视频，去除目标视频段中第一虚拟对象的目标肢体部位，得到待合成视频，目标视频段为第一视频中对应动作插入时段的视频段；基于第二视频和目标视频段的时序对应关系，将第二视频各视频帧的目标肢体部位拼接到待合成视频各视频帧的目标肢体部位缺失处，生成合成视频。由于第二视频仅包含目标肢体部位，因此，可以做到虚拟对象与肢体动作的解耦。在虚拟对象为虚拟人物的情况下，制作第二视频/动作视频时，无需考虑人物主要身体部位的穿着打扮，甚至无需考虑人物的身份。

4.

发明公开
视频生成方法、装置、电子设备和计算机程序产品审中-实审

公开(公告)号：CN119922351A

公开(公告)日：2025-05-02

申请号：CN202411771790.3

申请日：2024-12-04

Applicant: 科大讯飞股份有限公司

Inventor： 徐六一 , 疏坤 , 蔡佳佳 , 庄江腾 , 周良 , 何山 , 王众 , 殷兵 , 刘聪

IPC: H04N21/234 , G10L25/63 , G10L15/25 , G06T5/50

Abstract: 本申请提出一种视频生成方法、装置、电子设备和计算机程序产品，该方法能够基于复刻对象的音频和参考图像，生成复刻对象的虚拟形象视频。具体可以根据音频和参考图像，生成复刻对象口唇区域的动态图像，结合口唇区域的动态图像、参考图像和音频对应的情绪状态，得到复刻对象的动态图像；或者，从音频和参考图像中提取得到复刻特征，根据复刻特征和音频对应的情绪状态生成复刻对象的动态图像，然后根据音频和复刻对象的动态图像，生成复刻对象的虚拟形象视频，实现复刻特定对象的虚拟形象的目的。

5.

发明公开
图像生成方法、装置、电子设备和存储介质审中-公开

公开(公告)号：CN119784879A

公开(公告)日：2025-04-08

申请号：CN202510279975.0

申请日：2025-03-11

Applicant: 科大讯飞股份有限公司

Inventor： 杨硕 , 王众 , 金玥 , 何山 , 殷兵 , 刘聪 , 周良 , 胡金水 , 支洪平

IPC: G06T11/00 , G06V10/75 , G06V10/80

Abstract: 本发明涉及图像处理技术领域，提供了一种图像生成方法、装置、电子设备和存储介质，其中方法包括：获取图像描述文本，并确定所述图像描述文本中的领域知识和通用知识，以及领域知识和通用知识分别对应的路由权重；基于领域知识，从领域知识库中进行知识检索，得到参考图像；领域知识库动态更新；基于参考图像、通用知识，以及领域知识和通用知识分别对应的路由权重进行图像生成，得到生成的目标图像；其中，路由权重用于反映对应知识在目标图像上的呈现度，利用动态知识检索的优势进行特定领域的知识检索，可以为特定领域的知识生成提供参考，同时借助动态路由策略进行图像生成，不仅保证了生成的图像的准确性，也增强了多样性和细节丰富性。

6.

发明授权
一种解码网络生成方法、装置、设备及可读存储介质有权

公开(公告)号：CN109087645B

公开(公告)日：2021-04-30

申请号：CN201811244331.4

申请日：2018-10-24

Applicant: 科大讯飞股份有限公司

Inventor： 陆梦寒 , 王众 , 汪锦想 , 陈天峰 , 王从涛

IPC: G10L15/22 , G10L15/26 , G06F40/253

Abstract: 本申请实施例提供了一种解码网络生成方法、装置、设备及可读存储介质，本申请将可枚举的受限说法通过编写语法的形式表达，并获取该形成的语法文本，语法文本中包含至少一槽，与每一槽对应的至少一词条，以及每一槽的位置信息，进一步通过解析所述语法文本，根据每一槽的位置信息及每一槽对应的各词条，生成解码网络，用于对本地语音识别过程中，受限说法的词条进行识别。进一步，由于本申请获取的语法文本中包含每一槽的位置信息，且可以根据槽的位置信息及槽对应的词条来生成解码网络，后续若需要新增词条，可以根据该新增词条所属的槽的位置信息，便捷的将新增词条插入解码网络中，实现解码网络方便、快速的更新。

7.

发明公开
一种解码网络生成方法、装置、设备及可读存储介质有权

公开(公告)号：CN109087645A

公开(公告)日：2018-12-25

申请号：CN201811244331.4

申请日：2018-10-24

Applicant: 科大讯飞股份有限公司

Inventor： 陆梦寒 , 王众 , 汪锦想 , 陈天峰 , 王从涛

IPC: G10L15/22 , G10L15/26 , G06F17/27

Abstract: 本申请实施例提供了一种解码网络生成方法、装置、设备及可读存储介质，本申请将可枚举的受限说法通过编写语法的形式表达，并获取该形成的语法文本，语法文本中包含至少一槽，与每一槽对应的至少一词条，以及每一槽的位置信息，进一步通过解析所述语法文本，根据每一槽的位置信息及每一槽对应的各词条，生成解码网络，用于对本地语音识别过程中，受限说法的词条进行识别。进一步，由于本申请获取的语法文本中包含每一槽的位置信息，且可以根据槽的位置信息及槽对应的词条来生成解码网络，后续若需要新增词条，可以根据该新增词条所属的槽的位置信息，便捷的将新增词条插入解码网络中，实现解码网络方便、快速的更新。

8.

发明公开
合成视频的方法、电子设备及计算机程序产品有权

公开(公告)号：CN119323625A

公开(公告)日：2025-01-17

申请号：CN202411866722.5

申请日：2024-12-18

Applicant: 科大讯飞股份有限公司

Inventor： 王众 , 李超龙 , 雷新宇 , 庄江腾 , 疏坤 , 周良 , 何山 , 殷兵 , 刘聪

IPC: G06T11/60 , G10L13/08 , G06V40/20 , G06F16/732 , G06F16/783

Abstract: 本申请提出一种合成视频的方法、电子设备及计算机程序产品。该合成视频的方法包括：获取包含第一虚拟对象的第一视频以及包含目标虚拟对象的肢体动作的第二视频，针对第一视频，去除目标视频段中第一虚拟对象的目标肢体部位，得到待合成视频，目标视频段为第一视频中对应动作插入时段的视频段；基于第二视频和目标视频段的时序对应关系，将第二视频各视频帧的目标肢体部位拼接到待合成视频各视频帧的目标肢体部位缺失处，生成合成视频。由于第二视频仅包含目标肢体部位，因此，可以做到虚拟对象与肢体动作的解耦。在虚拟对象为虚拟人物的情况下，制作第二视频/动作视频时，无需考虑人物主要身体部位的穿着打扮，甚至无需考虑人物的身份。

9.

发明公开
语音识别方法、装置、设备及存储介质审中-实审转让

公开(公告)号：CN113920999A

公开(公告)日：2022-01-11

申请号：CN202111274880.8

申请日：2021-10-29

Applicant: 科大讯飞股份有限公司

Inventor： 李永超 , 朱晓斐 , 王众 , 方昕

IPC: G10L15/193 , G10L15/08 , G10L15/26 , G10L15/02 , G10L25/24

Abstract: 本申请提出一种语音识别方法、装置、设备及存储介质，该方法包括：获取待识别语音的声学状态序列；基于所述待识别语音所属场景下的垂类关键字集合及句式解码网络，构建语音识别解码网络，其中，所述句式解码网络通过对所述待识别语音所属场景下的文本语料进行句式归纳和语法槽定义处理构建得到；利用所述语音识别解码网络对所述声学状态序列进行解码，得到语音识别结果。通过构建上述的语音识别解码网络，并用于语音识别，能够准确识别待识别语音，尤其是能够准确识别涉及垂类关键字的特定场景下的语音，特别是能准确识别语音中的垂类关键字。

10.

发明公开
动作数据生成方法、装置、设备、存储介质和程序产品审中-实审

公开(公告)号：CN119741405A

公开(公告)日：2025-04-01

申请号：CN202510260633.4

申请日：2025-03-06

Applicant: 科大讯飞股份有限公司

Inventor： 刘佳丽 , 李超龙 , 王众 , 庄江腾 , 孙萍 , 杨硕 , 疏坤 , 吴小燕 , 何山 , 殷兵 , 刘聪 , 周良 , 胡金水 , 支洪平

IPC: G06T13/00 , G06F40/30 , G06N3/006 , G10L21/10

Abstract: 本申请公开了一种动作数据生成方法、装置、设备、存储介质和程序产品，涉及人工智能技术领域，包括：获得目标语音的音频特征以及目标语音对应的文本；基于对文本的语义理解，确定文本中需要数字人同步执行肢体动作的目标文本段，每个目标文本段对应的肢体动作的类别，以及每个目标文本段对应的待生成的骨架动作序列中的各个动作帧的位置编码；对应每个目标文本段，至少将音频特征、该目标文本段对应的肢体动作的类别以及该目标文本段对应的各个动作帧的位置编码作为扩散模型的控制条件，通过扩散模型生成与该目标文本段对应的骨架动作序列。本申请提高了基于骨架动作序列驱动的数字人的肢体动作与语音内容的匹配度。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification