-
公开(公告)号:CN117456431A
公开(公告)日:2024-01-26
申请号:CN202311799128.4
申请日:2023-12-26
Applicant: 南京邮电大学
IPC: G06V20/40 , G06V10/774 , G06V10/25 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及视频检索领域,尤其是涉及一种基于扩张卷积和密集连接的镜头边界检测方法。所述检测方法包括如下步骤:对视频进行预处理,将视频的帧转换为48×27像素大小,这样做计算量相对较小,可以加快模型的训练速度,并减少过拟合。对于训练集,训练脚本随机选择包含注释过渡的100帧序列。将处理后的帧序列输入训练好的神经网络模型;模型输出每一帧的镜头边界概率,根据设定的阈值得到镜头边界帧,用于分割镜头。本发明通过在视频帧上运用卷积神经网络,准确判定镜头边界,实现视频分割,有利于视频管理和检索。本发明所涉及方法综合运用扩张卷积、自注意力和密集连接等技术,强化了特征提取和传递,提高了镜头边界检测的准确性和效率。