一种基于无窗口高斯视觉Transformer的高效特征学习方法与系统

    公开(公告)号:CN119810464A

    公开(公告)日:2025-04-11

    申请号:CN202510020558.4

    申请日:2025-01-07

    Applicant: 济南大学

    Abstract: 本发明提出了一种基于无窗口高斯视觉Transformer的高效特征学习方法与系统,涉及计算机视觉领域。本发明设计无窗口高斯自注意力模块(WGSAB)作为神经网络WGViT的主要构建块,在图像处理任务中通过二维高斯分布采样token并进行交互,使得特征表达不受窗口的限制,实现神经网络捕获图像的长短距依赖,降低自注意力的计算复杂度,进行高效特征学习;堆叠多个WGSAB网络模块构成了神经网络WGViT,在WGSAB中高斯token采样(GTS)通过设置不同的均值、协方差和采样率来捕获不同的长短距依赖,所得到的神经网络模型可用于图像分类、目标检测、实例分割和语义分割等视觉任务的主干。

Patent Agency Ranking