音频拼接方法、装置及存储介质

    公开(公告)号:CN111613195A

    公开(公告)日:2020-09-01

    申请号:CN201910132652.3

    申请日:2019-02-22

    Applicant: 浙江大学

    Abstract: 本公开涉及音频拼接方法、装置及存储介质。该方法包括:确定各个待拼接音频的音频片段;对于各个待拼接音频中的第一待拼接音频的第一音频片段和第二待拼接音频的第二音频片段,根据第一音频片段的相邻音频片段和第二音频片段的相邻音频片段中的至少一项,确定第一音频片段与第二音频片段之间的和谐度;根据各个待拼接音频中的每两个待拼接音频的音频片段之间的和谐度,确定每两个待拼接音频之间的匹配的音频片段;根据每两个待拼接音频之间的匹配的音频片段,对各个待拼接音频的音频片段进行拼接。本公开能够自动化地进行音频拼接,并能够提高音频片段之间的拼接自然程度。

    音频拼接方法、装置及存储介质

    公开(公告)号:CN111613195B

    公开(公告)日:2022-12-09

    申请号:CN201910132652.3

    申请日:2019-02-22

    Applicant: 浙江大学

    Abstract: 本公开涉及音频拼接方法、装置及存储介质。该方法包括:确定各个待拼接音频的音频片段;对于各个待拼接音频中的第一待拼接音频的第一音频片段和第二待拼接音频的第二音频片段,根据第一音频片段的相邻音频片段和第二音频片段的相邻音频片段中的至少一项,确定第一音频片段与第二音频片段之间的和谐度;根据各个待拼接音频中的每两个待拼接音频的音频片段之间的和谐度,确定每两个待拼接音频之间的匹配的音频片段;根据每两个待拼接音频之间的匹配的音频片段,对各个待拼接音频的音频片段进行拼接。本公开能够自动化地进行音频拼接,并能够提高音频片段之间的拼接自然程度。

    一种以人为主体的视频景别分析方法和装置

    公开(公告)号:CN111160134A

    公开(公告)日:2020-05-15

    申请号:CN201911274443.9

    申请日:2019-12-12

    Applicant: 浙江大学

    Abstract: 本发明公开了一种以人为主体的视频景别分析方法和装置,包括:采集图像,并对图像进行景别标注,利用深度学习方法提取图像的人体特征向量,图像的人体特征向量与标注的景别组成一个训练样本,构成训练样本集;利用所述训练集训练随机森林模型,随机森林模型参数确定后,获得景别分析模型;读取待分析视频的每一帧图像,利用深度学习方法提取帧图像的人体特征向量,并利用所述景别分析模型基于输入的所述人体特征向量计算输出每一帧图像的景别分类结果。该方法和装置能够准确地识别出视频的景别,满足视频自动化分析与编辑对于快速准确景别计算的要求。

Patent Agency Ranking