-
公开(公告)号:CN117152436A
公开(公告)日:2023-12-01
申请号:CN202311141565.7
申请日:2023-09-06
Inventor: 张珣 , 张鑫 , 张佳亮 , 王福玲 , 阿布都热依木·热西丁
IPC: G06V10/26 , G06V10/774 , G06V10/42 , G06N3/0464 , G06N3/08
Abstract: 本发明公布了一种基于深度可分离卷积和金字塔池化的视频语义分割方法,构建基于深度可分离卷积和金字塔池化模块的街景视频语义分割模型,通过对时序记忆注意力网络TMANet的结构进行改进,采用深度可分离卷积网络结构,且在模型的分割头之前加入金字塔池化模块,再通过模型训练和测试实现视频语义分割。采用本发明的模型方法,使得分割街景视频在保证提取到时序信息的同时关注到每帧图像的上下文关系和全局特征,并减少计算量,从而解决了街景视频语义分割时分割精度不足和模型运算量大的问题,使街景视频处理精度更高,提升视频语义分割效果。