-
公开(公告)号:CN117177024A
公开(公告)日:2023-12-05
申请号:CN202311030846.5
申请日:2023-08-14
Applicant: 科大讯飞股份有限公司
Inventor: 胡国平 , 付新勇 , 姚仕豪 , 高建清 , 郜静文 , 刘烨秋 , 王雨露 , 张若楠 , 管广鹏 , 吕磊 , 陈付国 , 金左雨 , 董飞 , 何山 , 殷兵 , 刘聪 , 魏思 , 王士进 , 刘权
IPC: H04N21/81 , H04N21/44 , G10L13/027 , G10L13/08
Abstract: 本申请公开了一种视频配音方法和相关装置、电子设备及存储介质。该方法包括:获取原始视频;获取基于原始视频的关键帧、用于指示视频配音的第一描述文本、原始文案中至少一种参考信息而得到的文案文本;获取由文案文本合成得到的视频配音;基于原始视频和视频配音,生成目标视频。上述方案,有助于提高对视频配音的效率,并降低视频配音的成本。
-
公开(公告)号:CN117336567A
公开(公告)日:2024-01-02
申请号:CN202311030837.6
申请日:2023-08-14
Applicant: 科大讯飞股份有限公司
Inventor: 高建清 , 左童春 , 姚仕豪 , 何山 , 郜静文 , 杨硕 , 殷保才 , 殷兵 , 刘烨秋 , 付新勇 , 王雨露 , 张若楠 , 管广鹏 , 吕磊 , 陈付国 , 金左雨 , 董飞 , 胡国平 , 刘聪 , 魏思 , 王士进 , 刘权
IPC: H04N21/81 , H04N21/44 , G10L13/027 , G10L13/08
Abstract: 本申请公开了一种视频生成方法、装置、设备和存储介质,其中,视频生成方法包括:获取原始文稿和原始文稿的原始配图;获取响应于原始文稿和原始配图而分析得到且用于配音的参考数据;其中,参考数据包含文案文本、表征文案文本所蕴含情感信息的第一文本和至少表征文案文本需采用发音音色的第二文本;基于参考数据进行语音合成,得到视频配音;至少基于原始配图和视频配音,生成目标视频。上述方案,能够提高视频生成效率,降低视频生成成本。
-
公开(公告)号:CN111738105B
公开(公告)日:2023-12-01
申请号:CN202010500183.9
申请日:2020-06-04
Applicant: 科大讯飞股份有限公司
IPC: G06V30/413 , G06V10/774
Abstract: 本发明实施例提供一种公式识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别公式图像;将待识别公式图像输入至公式识别模型,得到公式识别模型输出的多个候选识别结果;将任一候选识别结果中候选公式包含的每一子结构的类型输入至结构分析模型,得到结构分析模型输出的任一候选识别结果对应的结构置信度;基于每一候选识别结果及其对应的结构置信度,确定待识别公式图像对应的公式识别结果;其中,公式识别模型是基于样本公式图像及其对应的样本公式识别结果训练得到的;结构分析模型是基于样本公式包含的每一子结构的类型训练得到的。本发明实施例提供的公式识别方(56)对比文件Jianshu Zhang et al..Track, Attend,and Parse (TAP): An End-to-End Frameworkfor Online Handwritten MathematicalExpression Recognition《.IEEE TRANSACTIONSON MULTIMEDIA》.2019,第21卷(第1期),第221-233页.Francisco Álvaro et al..An integratedgrammar-based approach for mathematicalexpression recognition《.PatternRecognition》.2015,第135-142页.Francisco Alvaro et al..An integratedgrammar-based approach for mathematicalexpression recognition《.PatternRecognition》.2015,第135-142页.Jianshu Zhang et al..Watch, attendand parse: An end-to-end neural networkbased approach to handwrittenmathematical expression recognition.《Pattern Recognition》.第196-199页.
-
公开(公告)号:CN117177025A
公开(公告)日:2023-12-05
申请号:CN202311030930.7
申请日:2023-08-14
Applicant: 科大讯飞股份有限公司
Inventor: 刘聪 , 徐浩然 , 高建清 , 姚仕豪 , 何山 , 郜静文 , 杨硕 , 殷保才 , 殷兵 , 刘烨秋 , 付新勇 , 王雨露 , 张若楠 , 管广鹏 , 吕磊 , 陈付国 , 金左雨 , 董飞 , 胡国平 , 魏思 , 王士进 , 刘权
IPC: H04N21/81 , H04N21/44 , G10L13/027 , G10L13/08
Abstract: 本申请公开了一种视频生成方法、装置、设备和存储介质,其中,视频生成方法包括:基于用户关于期望输出文稿的语音数据,得到对应的识别文本;获取原始图像和用于指示视频生成的第一描述文本;获取至少响应于所述第一描述文本而生成的文案文本;获取由所述文案文本合成得到的视频配音;至少基于所述原始图像和所述视频配音,生成目标视频。通过该方式,能够缩短视频制作的时间,降低视频制作的成本,提高视频制作的工作效率。
-
公开(公告)号:CN111738105A
公开(公告)日:2020-10-02
申请号:CN202010500183.9
申请日:2020-06-04
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种公式识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别公式图像;将待识别公式图像输入至公式识别模型,得到公式识别模型输出的多个候选识别结果;将任一候选识别结果中候选公式包含的每一子结构的类型输入至结构分析模型,得到结构分析模型输出的任一候选识别结果对应的结构置信度;基于每一候选识别结果及其对应的结构置信度,确定待识别公式图像对应的公式识别结果;其中,公式识别模型是基于样本公式图像及其对应的样本公式识别结果训练得到的;结构分析模型是基于样本公式包含的每一子结构的类型训练得到的。本发明实施例提供的公式识别方法、装置、电子设备和存储介质,提高了公式识别的准确性。
-
-
-
-