一种基于大语言模型的直播智能剪辑方法

    公开(公告)号:CN117336559A

    公开(公告)日:2024-01-02

    申请号:CN202310997166.4

    申请日:2023-08-09

    Applicant: 东南大学

    Inventor: 张芷境 熊润群

    Abstract: 本发明提出一种基于大语言模型的直播智能剪辑方法,该方法包括如下步骤(1)设置需要剪辑的视频和对视频剪辑的额外需求;(2)将视频信息先转换为语音,再语音转文本T;(3)对文本T进行分词预处理,通过计算词语的共存度和在文本T中出现的总次数来统计词语的分数,选取分数最高的15个词语作为文本T的关键词;(4)根据视频文本T和步骤(3)提取的关键词,以及对视频剪辑的额外需求,设计特定的提示词以使用大语言模型对文本T进行剪辑点提取;(5)将步骤(4)中得到的视频剪辑点与音频文件对应的时间戳对齐,进行视频剪辑。

Patent Agency Ranking