-
公开(公告)号:CN114359446B
公开(公告)日:2024-11-01
申请号:CN202111658559.X
申请日:2021-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种动画绘本生成方法、装置、设备和存储介质,该方法包括:识别静态绘本中的若干对象以及若干文本;确定各对象以及各文本之间的对应关系,其中,对应关系表示文本由与文本对应的对象讲述;生成各文本的语音数据,以及确定各文本对应的对象的画面变化内容,其中,画面变化内容表示在播放文本对应的语音数据过程中对象的预设部位的变化;基于语音数据和画面变化内容,生成静态绘本对应的动画绘本数据。通过上述方式,本申请能够将绘本中的静态人物转化为能说会动的动画人物。
-
公开(公告)号:CN115375809B
公开(公告)日:2023-03-14
申请号:CN202211310590.9
申请日:2022-10-25
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了虚拟形象的生成方法、装置、设备及存储介质,具体实现方案为:基于获取到的表达信息确定情绪特征以及脸部特征;基于所述情绪特征对特定视频序列进行情绪编辑处理,得到具有所述情绪特征的视频序列;其中,所述特定视频序列,包括特定对象的包含脸部的视频序列;至少基于具有所述情绪特征的视频序列以及所述脸部特征,生成目标对象的虚拟形象。根据本申请的技术方案,能够有效解决生成的虚拟形象表达情绪单一的问题。
-
公开(公告)号:CN117032869A
公开(公告)日:2023-11-10
申请号:CN202311030903.X
申请日:2023-08-14
Applicant: 科大讯飞股份有限公司
IPC: G06F9/451 , G06T11/60 , G06F40/106
Abstract: 本申请公开了一种图文内容生成方法、装置、设备及存储介质,本申请获取需要生成配图的文本信息,从文本信息中获取到关键信息,作为生成配图时的参考文本信息。调用预配置的文图生成模型,借助文图生成模型强大的基于文本生成匹配语义的图片的能力,可以基于获取的关键信息生成与关键信息匹配的图片,融合文本信息与生成的图片,得到图文内容。本申请方案借助AI文图生成模型的能力,可以自动生成与文本信息匹配的图片,且鉴于文图生成模型所生成图片的多样性和文本一致性,可以保证生成的图片的质量且与文本信息的语义是匹配的,最终得到内容质量较高的图文内容,整个过程不依赖于纸质书籍,生成成本大幅降低。
-
公开(公告)号:CN115375809A
公开(公告)日:2022-11-22
申请号:CN202211310590.9
申请日:2022-10-25
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了虚拟形象的生成方法、装置、设备及存储介质,具体实现方案为:基于获取到的表达信息确定情绪特征以及脸部特征;基于所述情绪特征对特定视频序列进行情绪编辑处理,得到具有所述情绪特征的视频序列;其中,所述特定视频序列,包括特定对象的包含脸部的视频序列;至少基于具有所述情绪特征的视频序列以及所述脸部特征,生成目标对象的虚拟形象。根据本申请的技术方案,能够有效解决生成的虚拟形象表达情绪单一的问题。
-
公开(公告)号:CN114359446A
公开(公告)日:2022-04-15
申请号:CN202111658559.X
申请日:2021-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种动画绘本生成方法、装置、设备和存储介质,该方法包括:识别静态绘本中的若干对象以及若干文本;确定各对象以及各文本之间的对应关系,其中,对应关系表示文本由与文本对应的对象讲述;生成各文本的语音数据,以及确定各文本对应的对象的画面变化内容,其中,画面变化内容表示在播放文本对应的语音数据过程中对象的预设部位的变化;基于语音数据和画面变化内容,生成静态绘本对应的动画绘本数据。通过上述方式,本申请能够将绘本中的静态人物转化为能说会动的动画人物。
-
公开(公告)号:CN114299225A
公开(公告)日:2022-04-08
申请号:CN202111524469.1
申请日:2021-12-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种动作图像生成方法、模型构建方法、计算机设备及存储介质,其中,该模型构建方法包括:获取目标人物的第一图像集和第二图像集,第一图像集和第二图像集包括关于目标人物动作的序列图像;根据第一图像集的序列图像进行三维重建,得到多个第一3D模型;获取目标人物的纹理图,根据纹理图对所述多个第一3D模型进行贴图,得到多个纹理贴图;对多个第一3D模型进行投影,得到多个2D投影图像;根据第二图像集的序列图像、2D投影图像和纹理贴图构建动作生成模型。该动作生成模型可以生成更为真实的动作图像,即动作图像包括更多细节,由此可以提高用户的体验度。
-
公开(公告)号:CN109862313B
公开(公告)日:2022-01-14
申请号:CN201811518639.3
申请日:2018-12-12
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种视频浓缩方法及装置,该方法包括:获取包括多个运动目标的待浓缩视频,随后为各个浓缩图像选择运动目标组合方式,该各个浓缩图像是对待浓缩视频进行浓缩后得到的各个帧图像,以便根据各个浓缩图像中的运动目标组合方式,对待浓缩视频进行视频浓缩。可见,本申请可以为每一帧浓缩图像选择一种合理的运动目标组合方式,从而使每帧浓缩图像中的各个运动目标能够最大限度的占据图像空间、并使每帧浓缩图像中的不同运动目标之间的重叠程度尽量小,进而提高浓缩视频的浓缩精度。
-
公开(公告)号:CN115393945A
公开(公告)日:2022-11-25
申请号:CN202211327173.5
申请日:2022-10-27
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种基于语音的图像驱动方法、装置、电子设备及存储介质,方法包括:预测目标语音对应的口唇偏移数据和目标语音对应的头部运动数据;根据目标语音对应的口唇偏移数据和目标语音对应的头部运动数据,对待驱动面部图像的各个面部关键点进行位置变换,得到待驱动面部图像的更新后的面部关键点位置;基于待驱动面部图像的更新后的面部关键点位置,生成驱动后的面部图像。采用本申请的技术方案,可以直接预测目标语音对应的口唇偏移数据和头部运动数据,然后根据口唇偏移数据和头部运动数据对待驱动面部图像进行驱动,无需利用目标语音对应的说话视频作为中间媒介,实现了端到端的语音驱动图像,提高了语音驱动图像的效率。
-
公开(公告)号:CN109862313A
公开(公告)日:2019-06-07
申请号:CN201811518639.3
申请日:2018-12-12
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种视频浓缩方法及装置,该方法包括:获取包括多个运动目标的待浓缩视频,随后为各个浓缩图像选择运动目标组合方式,该各个浓缩图像是对待浓缩视频进行浓缩后得到的各个帧图像,以便根据各个浓缩图像中的运动目标组合方式,对待浓缩视频进行视频浓缩。可见,本申请可以为每一帧浓缩图像选择一种合理的运动目标组合方式,从而使每帧浓缩图像中的各个运动目标能够最大限度的占据图像空间、并使每帧浓缩图像中的不同运动目标之间的重叠程度尽量小,进而提高浓缩视频的浓缩精度。
-
公开(公告)号:CN109783684A
公开(公告)日:2019-05-21
申请号:CN201910072964.X
申请日:2019-01-25
Applicant: 科大讯飞股份有限公司
IPC: G06F16/70
Abstract: 本申请提供了一种视频的情感识别方法、装置、设备及可读存储介质,方法包括:获取待识别视频,并基于指定的边界划分依据对待识别视频进行粗粒度的边界划分,获得粗粒度视频片段;基于粗粒度视频片段的时空语义信息,对粗粒度视频片段进行细粒度的边界划分,获得细粒度视频片段;确定细粒度视频片段的至少一种情感识别结果,并通过细粒度视频片段的至少一种情感识别结果获得待识别视频的情感识别结果。本申请提供的情感识别方法具有较高的识别准确度。
-
-
-
-
-
-
-
-
-