-
公开(公告)号:CN117336559A
公开(公告)日:2024-01-02
申请号:CN202310997166.4
申请日:2023-08-09
Applicant: 东南大学
IPC: H04N21/472 , H04N21/439 , H04N21/8547 , H04N21/44 , G10L15/26
Abstract: 本发明提出一种基于大语言模型的直播智能剪辑方法,该方法包括如下步骤(1)设置需要剪辑的视频和对视频剪辑的额外需求;(2)将视频信息先转换为语音,再语音转文本T;(3)对文本T进行分词预处理,通过计算词语的共存度和在文本T中出现的总次数来统计词语的分数,选取分数最高的15个词语作为文本T的关键词;(4)根据视频文本T和步骤(3)提取的关键词,以及对视频剪辑的额外需求,设计特定的提示词以使用大语言模型对文本T进行剪辑点提取;(5)将步骤(4)中得到的视频剪辑点与音频文件对应的时间戳对齐,进行视频剪辑。