基于大模型的视频生成方法、装置、电子设备以及介质

    公开(公告)号:CN119136016A

    公开(公告)日:2024-12-13

    申请号:CN202411311894.6

    申请日:2024-09-19

    Inventor: 施刘远 柴文俊

    Abstract: 本公开提供了基于大模型的视频生成方法、装置、电子设备以及介质,涉及人工智能技术领域,尤其涉及大模型、多媒体、语音技术、视频技术等领域。该方法的具体实现方案为:利用第一大模型对初始文本进行解析,生成字幕信息,其中,字幕信息包括针对初始文本中的各角色用于演绎情节的信息;根据预定音频和字幕信息,合成各角色的音频信息;对字幕信息进行分镜处理,生成分镜画面信息;以及将字幕信息、音频信息和分镜画面信息,按照初始文本中情节的发展顺序,生成用于解说初始文本的目标视频。

Patent Agency Ranking