一种基于注意力引导机制的实时图像语义分割方法

    公开(公告)号:CN113066089B

    公开(公告)日:2023-07-11

    申请号:CN202110366778.4

    申请日:2021-04-06

    Abstract: 一种基于注意力引导机制的实时图像语义分割方法,包括下采样单元,上采样单元,极致高效残差模块,自适应注意力模块以及自适应融合模块。整体网络结构的特征提取单元为极致高效残差模块,使用自适应注意力模块ASAM有效减小了模块的计算复杂度,且能捕捉到有效像素点之间的相关性信息;并通过自适应融合模块ASFM将低级与高级特征连接起来,在语义分割中,将不同层次的特征连接起来;通过对以上五个组件进行堆叠,构建基于注意力机制的实时语义分割网络,其中编码器生成下采样的特征图,解码器对深层的特征图进行上采样以匹配输入图像分辨率,恢复图像的空间信息并向分割类别映射,最终生成与输入图像相同分辨率的语义分割结果图。

    一种基于光流场统计特征的场景分析方法及系统

    公开(公告)号:CN110472478B

    公开(公告)日:2022-09-20

    申请号:CN201910558959.X

    申请日:2019-06-26

    Inventor: 樊亚文 周全 康彬

    Abstract: 本发明涉及了一种基于光流统计特征的场景分析方法及系统,所述方法步骤为:对给定的监控视频,计算基本的光流场,并对其进行幅度和基于统计特征的去噪;提取光流场空间分布统计特征,空间位置量化;提取光流场方向分布统计特征,进行运动方向量化;基于量化结果构建视觉词典,将整个视频分成片段,将其中所包含的光流映射成视觉单词,每个片段由视觉单词累计表示成词袋;将词袋输入到HDP模型,提取每个视频片段对应的特征向量;采用谱聚类对所有的特征向量进行聚类,实现场景的分类。本发明可以有效地对光流去噪及量化,检测出同一场景中的不同运动模式,实现场景分类,对于视频监控中的场景分析具有重要的现实意义和实用价值。

    一种基于自适应阶数的交互行为分析方法

    公开(公告)号:CN110188608B

    公开(公告)日:2022-09-06

    申请号:CN201910331755.2

    申请日:2019-04-23

    Abstract: 本发明公开了一种基于自适应阶数的交互行为分析方法,包括以下步骤:步骤一:视频特征提取与表示;步骤二:利用分层狄利克雷过程模型对视频序列进行建模,检测出场景中包含的行为,并利用K‑means算法进行分类,实现多变量时间序列提取与分类;步骤三:进行多变量自回归模型阶数选择;步骤四:基于频域的多向量过程因果测量的组间交互行为分析;步骤五:基于频域的多标量过程因果测量的组内交互行为分析;步骤六:基于组间和组内因果测量的全局和局部行为交互网络构建。本发明的优点是:不仅能检测出场景中全局和局部交互行为,而且可以构建全局和局部行为交互网络。

    一种用于图像目标检测的轻量级双分支卷积神经网络及其检测方法

    公开(公告)号:CN114648684A

    公开(公告)日:2022-06-21

    申请号:CN202210294967.X

    申请日:2022-03-24

    Abstract: 一种用于图像目标检测的轻量级双分支卷积神经网络及其检测方法,通过构建双路径的网络以解决轻量化图像目标检测任务,由双路径骨干网、特征金字塔和轻量化检测头组成。骨干网核心模块为增强的混洗模块ESB,采用高效自注意力模块ESAM来捕捉特征全局依赖,同时保持非常少的模型参数和计算复杂度。骨干网采取双分支网络,一路分支保持高分辨率,另一路分支采用连续下采样获得抽象语义信息。在特征金字塔中将ESAM扩展为ECAM来捕捉不同分辨率之间特征的关系。检测头采用轻量化的深度可分离卷积来进行边框和类别的预测。实验结果表明,本网络架构以及检测方法实现了检测精度和实施效率之间的最佳平衡,成为解决轻量化图像目标检测任务的一种有效方法。

    一种基于注意力引导机制的实时图像语义分割网络

    公开(公告)号:CN113066089A

    公开(公告)日:2021-07-02

    申请号:CN202110366778.4

    申请日:2021-04-06

    Abstract: 一种基于注意力引导机制的实时图像语义分割网络,包括下采样单元,上采样单元,极致高效残差模块,自适应注意力模块以及自适应融合模块。整体网络结构的特征提取单元为极致高效残差模块,使用自适应注意力模块ASAM有效减小了模块的计算复杂度,且能捕捉到有效像素点之间的相关性信息;并通过自适应融合模块ASFM将低级与高级特征连接起来,在语义分割中,将不同层次的特征连接起来;通过对以上五个组件进行堆叠,构建基于注意力机制的实时语义分割网络,其中编码器生成下采样的特征图,解码器对深层的特征图进行上采样以匹配输入图像分辨率,恢复图像的空间信息并向分割类别映射,最终生成与输入图像相同分辨率的语义分割结果图。

    实时图像语义分割方法及系统

    公开(公告)号:CN110188768A

    公开(公告)日:2019-08-30

    申请号:CN201910384869.3

    申请日:2019-05-09

    Abstract: 一种实时图像语义分割方法及系统,所述方法包括:编码器基于分解卷积操作和并行分解卷积操作提取输入图像的图像特征,得到低分辨率的深层语义特征图并输出至解码器;所述解码器基于分解卷积操作和并行分解卷积操作对所述低分辨率的深层语义特征图进行细节精调,并将细节精调后的低分辨率的深层语义特征图上采样到所述输入图像大小,恢复输入图像的空间信息并向分割类别映射,最终生成与输入图像具有相同分辨率的语义分割结果图。上述的方案,可以在使用有限的计算资源进行实时图像语义分割时,提高分割的准确性。

    卷积神经网络中的一种语义图像分割方法

    公开(公告)号:CN109727249A

    公开(公告)日:2019-05-07

    申请号:CN201811500778.3

    申请日:2018-12-10

    Abstract: 本发明揭示了一种新的用于图像语义分割的深度卷积神经网络架构,包含骨干网与上下文融合网络两个部分。充分利用卷积网络中各卷积层特征信息,将浅层与深层上下文信息进行结合,从而得到更好的图像语义分割效果。与深层卷积特征相比,浅层卷积特征能保留较好的图像底层细节信息,而深层特征能够提取高层语义信息,把两者的卷积特性结合起来可同时兼顾图像中局部和全局的上下文特征,又决定了最终分割准确率的高低,为此本发明该网络架构可以对网络中浅层与深层的特征进行精炼提取。实验结果表明,与传统的深度卷积网络模型相比,该方法在分割的精度以及效率上都有了明显的提高。

    传感器网络中基于混合因子分析模型的分布式聚类方法

    公开(公告)号:CN104994170A

    公开(公告)日:2015-10-21

    申请号:CN201510414218.6

    申请日:2015-07-15

    CPC classification number: H04L67/12 H04W84/18

    Abstract: 本发明公开了传感器网络中基于混合因子分析模型的分布式聚类方法,该方法用混合因子分析模型来建模传感器网络中各节点处待聚类的数据,各节点基于自身数据计算局部充分统计量,而后将该量扩散广播给其邻居节点,当节点收到所有来自邻居节点的局部充分统计量之后,其可以获得联合充分统计量,并基于该统计量估计出混合因子分析模型中的各个参数,最终基于估计出的模型完成聚类。本发明建立混合因子分析模型可以在聚类的同时完成数据的降维,采用分布式聚类方式,避免传统的集中式处理方式中由中心节点带来的网络崩溃。在本发明分布式聚类方法中,各节点间传输的是充分统计量而不是数据,既大大节省了通信开销,又可以较好地保护数据中的隐私信息。

    一种联合局部和全局信息的图像重建系统及方法

    公开(公告)号:CN117522674A

    公开(公告)日:2024-02-06

    申请号:CN202311585339.8

    申请日:2023-11-24

    Abstract: 本发明属于图像处理领域,涉及一种联合局部和全局信息的图像重建系统及方法,所述系统包括生成器网络、边缘检测网络和深度检测网络;生成器网络将输入的部分信息损失的图像Y通过映射得到重建图像Z;采用端到端的边缘检测网络,输入图像后直接产生边缘图像作为输出;采用一个提取单幅图像的深度检测网络,输入整个图像后直接预测像素级的深度;构建本发明的联合局部和全局信息的图像重建系统并应用,与现有技术基于图像重建的掩码自编码模型相比,本发明提出的网络架构实现了图像重建准确率与计算效率之间的最佳平衡,能够提高图像重建的准确性和计算效率。

    一种多尺度孔洞邻域注意力计算骨干网络模型及其应用

    公开(公告)号:CN116246109A

    公开(公告)日:2023-06-09

    申请号:CN202310138042.0

    申请日:2023-02-20

    Abstract: 本发明属于图像识别领域,具体地说,是一种多尺度孔洞邻域注意力计算骨干网络模型及其应用,由输入、图像特征提取、输出组成。主体部分为图像特征提取,该部分共有4个阶段:第一阶段包括一个图像块嵌入层和一个孔洞Transformer模块,第二三四阶段结构相同,包括一个下采样层和一个DT模块。在DT模块的构成中,核心模块为孔洞邻域注意力计算模块,它用来对输入到该部分的特征图进行自注意力的计算,通过该模块的计算可以保证在获取图像局部信息的同时也可以获取到图像全局信息。与目前最先进的骨干网模型相比,本发明实现了自注意力计算中参数量和计算量的有效权衡,成为解决图像识别领域问题的有效网络模型。

Patent Agency Ranking