-
公开(公告)号:CN119810464A
公开(公告)日:2025-04-11
申请号:CN202510020558.4
申请日:2025-01-07
Applicant: 济南大学
IPC: G06V10/42 , G06V10/44 , G06V10/26 , G06V10/764 , G06V10/82 , G06N3/0499 , G06N3/08
Abstract: 本发明提出了一种基于无窗口高斯视觉Transformer的高效特征学习方法与系统,涉及计算机视觉领域。本发明设计无窗口高斯自注意力模块(WGSAB)作为神经网络WGViT的主要构建块,在图像处理任务中通过二维高斯分布采样token并进行交互,使得特征表达不受窗口的限制,实现神经网络捕获图像的长短距依赖,降低自注意力的计算复杂度,进行高效特征学习;堆叠多个WGSAB网络模块构成了神经网络WGViT,在WGSAB中高斯token采样(GTS)通过设置不同的均值、协方差和采样率来捕获不同的长短距依赖,所得到的神经网络模型可用于图像分类、目标检测、实例分割和语义分割等视觉任务的主干。