-
公开(公告)号:CN116916089B
公开(公告)日:2024-09-20
申请号:CN202310704953.5
申请日:2023-06-14
Applicant: 西南交通大学
IPC: H04N21/44 , H04N21/439
Abstract: 本发明涉及视频剪辑技术领域,涉及一种融合人声特征与人脸特征的智能视频剪辑方法,包括:S1、场景镜头拆分,将输入的视频拆分成多个场景镜头片段,然后对每个场景镜头片段进行滑窗切片;S2、智能视频剪辑S2.1、对切片后的片段进行目标检测和显著性检测;S2.2、多主角类视频的判定:判定片段是否为多人物主角类,若是,则采用人声与人脸智能匹配方法;S2.3、通过人声与人脸智能匹配方法分析得到视频每段的说话人主体目标框,再通过按比例对视频进行裁剪,再对多片段和原语音进行合成,最后对视频进行平滑即可输出最后的裁剪的短视频结果。本发明能够应对多主角人物视频自动剪辑中的音画不匹配。
-
公开(公告)号:CN116916089A
公开(公告)日:2023-10-20
申请号:CN202310704953.5
申请日:2023-06-14
Applicant: 西南交通大学
IPC: H04N21/44 , H04N21/439
Abstract: 本发明涉及视频剪辑技术领域,涉及一种融合人声特征与人脸特征的智能视频剪辑方法,包括:S1、场景镜头拆分,将输入的视频拆分成多个场景镜头片段,然后对每个场景镜头片段进行滑窗切片;S2、智能视频剪辑S2.1、对切片后的片段进行目标检测和显著性检测;S2.2、多主角类视频的判定:判定片段是否为多人物主角类,若是,则采用人声与人脸智能匹配方法;S2.3、通过人声与人脸智能匹配方法分析得到视频每段的说话人主体目标框,再通过按比例对视频进行裁剪,再对多片段和原语音进行合成,最后对视频进行平滑即可输出最后的裁剪的短视频结果。本发明能够应对多主角人物视频自动剪辑中的音画不匹配。
-