-
公开(公告)号:CN119544905A
公开(公告)日:2025-02-28
申请号:CN202411674436.9
申请日:2024-11-21
Applicant: 科大讯飞股份有限公司
IPC: H04N7/01 , H04N21/2343 , H04N21/4402
Abstract: 本申请提出一种视频插帧方法、装置、电子设备、存储介质及产品,该方法基于运动模糊预测算法,预测第一图像帧和第二图像帧之间的插入帧的运动模糊权重;其中,第一图像帧和第二图像帧为待插帧视频中的相邻图像帧;基于插帧生成算法,利用运动模糊权重、第一图像帧的像素信息和第二图像帧的像素信息,生成插入帧的第一像素信息;运动模糊预测算法和插帧生成算法是以对第一样本图像帧和第二样本图像帧进行样本插入帧生成时的损失函数最小为目标训练确定的。本方案在确定相邻图像帧之间的插入帧时,对相邻图像帧进行运动模糊分析,运动模糊效果能够捕捉到运动路径和运动速度,从而能够提高插入帧生成准确度,保证插帧效果,进而提高视频流畅度。
-
公开(公告)号:CN118555421A
公开(公告)日:2024-08-27
申请号:CN202411026547.9
申请日:2024-07-30
Applicant: 科大讯飞股份有限公司
IPC: H04N21/234 , H04N21/44 , H04N21/6437 , H04N19/134
Abstract: 本申请公开了一种视频处理方法、装置、电子设备及存储介质,该方法包括:从视频中获取需传输的目标视频帧,目标视频帧中包含动态目标;提取目标视频帧中的动态区域对应的特征信息,动态区域表征动态目标的至少一个部位对应的区域;将特征信息打包至目标视频帧的目标传输协议数据包中;将目标视频帧的目标传输协议数据包传输给视频接收端,其中,视频接收端能够从目标传输协议数据包中获取特征信息并基于特征信息生成目标视频帧。通过上述方式,本申请能降低对编码的需求,进而降低视频处理成本。
-
公开(公告)号:CN114173067B
公开(公告)日:2024-07-12
申请号:CN202111574773.7
申请日:2021-12-21
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种视频生成方法、装置、设备及存储介质,该方法包括:通过从预先构建的视频资源库中确定与视频剧本中的各个剧本关键词相匹配的视频资源,确定与各个剧本关键词一一对应的各个播放标签;所述播放标签中至少包括与剧本关键词相匹配的视频资源的索引信息;根据各个播放标签对应的视频资源,确定特效标签;所述特效标签中包括视频资源播放特效标签和/或相邻视频资源之间的视频转场特效标签;至少根据各个播放标签和所述特效标签进行视频剪辑处理,得到视频文件。采用该方法能够自动生成视频文件,从而能够降低视频制作的人力成本和时间成本。
-
公开(公告)号:CN116580127B
公开(公告)日:2023-12-01
申请号:CN202310856919.X
申请日:2023-07-13
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种图像生成方法、装置、电子设备和计算机可读存储介质,该方法包括:获取第一生成图像;响应于针对第一生成图像对应的待调整区域的图像编辑指令,获取与待调整区域关联的参考图像或第一提示词,作为第一生成信息;基于第一生成信息生成调整图像;利用调整图像对待调整区域进行调整,得到第二生成图像,上述方案,能够提高图像生成效率。
-
公开(公告)号:CN119323625B
公开(公告)日:2025-05-09
申请号:CN202411866722.5
申请日:2024-12-18
Applicant: 科大讯飞股份有限公司
IPC: G06T11/60 , G10L13/08 , G06V40/20 , G06F16/732 , G06F16/783
Abstract: 本申请提出一种合成视频的方法、电子设备及计算机程序产品。该合成视频的方法包括:获取包含第一虚拟对象的第一视频以及包含目标虚拟对象的肢体动作的第二视频,针对第一视频,去除目标视频段中第一虚拟对象的目标肢体部位,得到待合成视频,目标视频段为第一视频中对应动作插入时段的视频段;基于第二视频和目标视频段的时序对应关系,将第二视频各视频帧的目标肢体部位拼接到待合成视频各视频帧的目标肢体部位缺失处,生成合成视频。由于第二视频仅包含目标肢体部位,因此,可以做到虚拟对象与肢体动作的解耦。在虚拟对象为虚拟人物的情况下,制作第二视频/动作视频时,无需考虑人物主要身体部位的穿着打扮,甚至无需考虑人物的身份。
-
公开(公告)号:CN119922351A
公开(公告)日:2025-05-02
申请号:CN202411771790.3
申请日:2024-12-04
Applicant: 科大讯飞股份有限公司
IPC: H04N21/234 , G10L25/63 , G10L15/25 , G06T5/50
Abstract: 本申请提出一种视频生成方法、装置、电子设备和计算机程序产品,该方法能够基于复刻对象的音频和参考图像,生成复刻对象的虚拟形象视频。具体可以根据音频和参考图像,生成复刻对象口唇区域的动态图像,结合口唇区域的动态图像、参考图像和音频对应的情绪状态,得到复刻对象的动态图像;或者,从音频和参考图像中提取得到复刻特征,根据复刻特征和音频对应的情绪状态生成复刻对象的动态图像,然后根据音频和复刻对象的动态图像,生成复刻对象的虚拟形象视频,实现复刻特定对象的虚拟形象的目的。
-
公开(公告)号:CN115996303A
公开(公告)日:2023-04-21
申请号:CN202310290547.9
申请日:2023-03-23
Applicant: 科大讯飞股份有限公司
IPC: H04N21/44 , G06V40/16 , G06V10/80 , G06N3/0442 , G06N3/094 , H04N21/439 , H04N21/472 , G10L25/57
Abstract: 本发明涉及图像处理技术领域,提供一种视频生成方法、装置、电子设备和存储介质。方法包括:获取混合语音和多人画面,并对所述多人画面进行人脸检测,获得多个人脸图像,所述混合语音包括至少一人的语音;基于所述多个人脸图像的图像特征和所述混合语音的语音特征,生成多个目标人脸图像组,任一所述目标人脸图像组包括一个人在不同帧的目标人脸图像;将所述多个目标人脸图像组与所述多人画面进行融合,得到多帧目标多人同屏画面,并将所述多帧目标多人同屏画面与所述混合语音进行融合,得到多人会话视频。本发明无需对多个人的视频进行合成即可自动生成多人同屏的多人会话视频,从而节省人工成本,提高多人会话视频的制作效率。
-
公开(公告)号:CN109862313B
公开(公告)日:2022-01-14
申请号:CN201811518639.3
申请日:2018-12-12
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种视频浓缩方法及装置,该方法包括:获取包括多个运动目标的待浓缩视频,随后为各个浓缩图像选择运动目标组合方式,该各个浓缩图像是对待浓缩视频进行浓缩后得到的各个帧图像,以便根据各个浓缩图像中的运动目标组合方式,对待浓缩视频进行视频浓缩。可见,本申请可以为每一帧浓缩图像选择一种合理的运动目标组合方式,从而使每帧浓缩图像中的各个运动目标能够最大限度的占据图像空间、并使每帧浓缩图像中的不同运动目标之间的重叠程度尽量小,进而提高浓缩视频的浓缩精度。
-
公开(公告)号:CN307949242S
公开(公告)日:2023-04-04
申请号:CN202230706378.9
申请日:2022-10-25
Applicant: 科大讯飞股份有限公司
Abstract: 1.本外观设计产品的名称:带虚拟人构建图形用户界面的显示屏幕面板。
2.本外观设计产品的用途:用于交互和显示。
3.本外观设计产品的设计要点:在于图形用户界面。
4.最能表明设计要点的图片或照片:主视图。
5.显示屏幕面板的其他视图无设计要点,故省略,省略显示屏幕面板的其他视图。
6.图形用户界面的用途:用于个性化构建3D虚拟人形象。
7.图形用户界面的人机交互方式:点击主视图中上传头像,选择头像后主视图右侧显示上传的头像图像,点击主视图中的添加声音跳转至界面变化状态图1;点击界面变化状态图1中的开始录音可以进行录音,点击试听录音以及保存使用可分别实现相应的功能;录音完毕后跳转至界面变化状态图2,点击界面变化状态图2中的重置、重置为默认以及确定可以分别实现相应的功能;点击主视图左侧的发型按钮跳转至界面变化状态图3,在界面变化状态图3中可以选择不同的发型样式和头发颜色,选择完毕后在界面变化状态图3右侧的头像图像中同步显示修改后的预览头像;点击主视图、界面变化状态图3中任意一个界面左侧的脸型按钮跳转至界面变化状态图4,调整界面变化状态图4中的各项参数可以在界面右侧同步显示修改后的预览头像;点击主视图、界面变化状态图3、界面变化状态图4中任意一个界面左侧的眉毛按钮跳转至界面变化状态图5,调整界面变化状态图5中的各项参数可以在界面右侧同步显示修改后的预览头像;点击主视图、界面变化状态图3、界面变化状态图4、界面变化状态图5中任意一个界面左侧的眼睛按钮跳转至界面变化状态图6,调整界面变化状态图6中的各项参数可以在界面右侧同步显示修改后的预览头像;点击主视图、界面变化状态图3、界面变化状态图4、界面变化状态图5、界面变化状态图6中任意一个界面左侧的鼻子按钮跳转至界面变化状态图7,调整界面变化状态图7中的各项参数可以在界面右侧同步显示修改后的预览头像;点击主视图、界面变化状态图3、界面变化状态图4、界面变化状态图5、界面变化状态图6、界面变化状态图7中任意一个界面左侧的嘴巴按钮跳转至界面变化状态图8,调整界面变化状态图8中的各项参数可以在界面右侧同步显示修改后的预览头像。
8.显示屏幕面板可用于手机、平板电脑、笔记本电脑、台式机、智能手表、美妆镜、虚拟现实设备、个人数字助理(Personal Digital Assistant,PDA)。
-
-
-
-
-
-
-
-