-
公开(公告)号:CN117115703A
公开(公告)日:2023-11-24
申请号:CN202310950402.7
申请日:2023-07-31
Applicant: 哈尔滨理工大学
IPC: G06V20/40 , G06V10/82 , G06V10/764 , G06V10/774 , G06V10/80 , G06N3/0464
Abstract: 本发明涉及一种轻量化注意力机制的动态卷积分解的视频实例分割方法;该方法首先输入视频帧,主干网络独立提取视频中每一帧的特征图;然后经由主干网络提取的特征图进入HQT编解码模块,结合输出头精确定位每一帧中实例的位置变化,同时使用三个预测分支来监督模型训练;在本发明中,编码网络的卷积层采用动态卷积分解,不仅得到了一个更加紧凑的模型,而且使得模型训练会更加容易,所需参数量也会大大减少,进而提高训练速度,缩短训练时间;提出了一种轻量化的HQT编解码模块,有助于减少模型参数,提高效率;改进了损失函数,使模型训练更加稳定,提高收敛速度和收敛精度;缓解样本中前景背景不平衡以及长尾情况下前景类别间不平衡的问题。