一种双金字塔结构引导的多粒度行人重识别方法及系统

    公开(公告)号:CN114627492B

    公开(公告)日:2024-08-13

    申请号:CN202210118669.5

    申请日:2022-02-08

    Abstract: 本发明公开了一种双金字塔结构引导的多粒度行人重识别方法及系统,首先在ResNet50中嵌入注意力金字塔,引导网络由粗到细依次挖掘不同粒度的特征,使网络更倾向于关注复杂环境中行人的显著区域;其次通过结构不对称的双重注意力特征金字塔分支,以提取多尺度的行人特征,丰富特征的多样性,同时双重注意力机制可使分支从浅层信息中捕获高细粒度的局部特征;最后将粒度较粗的全局特征与多层级细粒度的局部特征融合,两种金字塔相互作用,以此获得更多具有鉴别性的多粒度特征,以改善行人遮挡问题。本发明仅通过较少的计算量,便可有效地解决杂乱场景下难以提取行人关键信息和局部遮挡时全局特征方法失效而造成识别精度不高的问题。

    一种针对损坏图像的行人重识别方法及系统

    公开(公告)号:CN116206330A

    公开(公告)日:2023-06-02

    申请号:CN202310099180.2

    申请日:2023-01-30

    Abstract: 本发明公开了一种针对损坏图像的行人重识别方法及系统,本发明采用独创的针对损坏图像的行人重识别网络,能够输出相对原始非损坏图像不变的行人表征;本发明通过平滑风格归一化与恢复模块中的实例规范化过滤掉域中的风格变化,同时平滑极大单元能使该模块更充分地从删除的信息中提取行人相关特征并将其恢复至网络中,缓解损坏图像带来的风格差异。此外,全局注意力机制通过关注通道与空间之间的相互作用,以捕获三个维度上的显著行人特征,减少跨维信息的丢失,最终使使本模型在面对损坏但不丢失原始语义信息的行人图像时,能够更充分地捕捉到相对原始图像不变的行人表征。

    基于深度卷积神经网络的场景文本检测方法、系统及设备

    公开(公告)号:CN114724155A

    公开(公告)日:2022-07-08

    申请号:CN202210410471.4

    申请日:2022-04-19

    Abstract: 本发明公开了一种基于深度卷积神经网络的场景文本检测方法、系统及设备,首先将获取的场景文本图像,进行数据增强操作,得到预定大小的图像信息;接着将预处理后的图像信息输入深度卷积神经网络中,提取图像特征;然后采用协调注意力机制层将图像特征进行增强处理;最后将增强后的特征图,采用渐进尺度扩展层进行后处理,获得文本检测结果。本发明通过在ResNet50的骨干网络中引入校正卷积、通道注意力,于提取的特征图后引入协调注意力,有效地扩大了网络感受空间,避免了后续降维操作丢失更多的语义信息,降低了不同尺度的特征图自顶向下融合导致的特征图失真程度,使网络具有更准确的鉴别区域;通过平方Dice损失函数提升了文本检测的准确性和精确性。

    基于注意力机制的自然场景图像中文本识别方法及系统

    公开(公告)号:CN116434241A

    公开(公告)日:2023-07-14

    申请号:CN202310120821.8

    申请日:2023-02-13

    Abstract: 本发明公开了一种基于注意力机制的自然场景图像中文本识别方法及系统,一种无需校正或分割的方法,通过搭建多级Efficient Swin Transformer网络提取丰富的全局特征,实现不同窗口特征之间的信息交互,对全局信息进行建模,并且嵌入通道注意力突出某些重要通道的特征。后经注意力机制得到视觉特征,使得网络将关注的焦点置于特征图的文本区域,提高了网络的特征提取能力;其次通过语义推理模块考虑字符上下文信息,对文本序列进行建模得到语义特征,提升了网络的预测能力;最后使用双特征融合单元融合不同模态的视觉、语义特征,并分类得到最终的文本识别结果,有效地避免了分割字符的缺陷,同时考虑到了字符与字符之间的内在联系。

    一种双金字塔结构引导的多粒度行人重识别方法及系统

    公开(公告)号:CN114627492A

    公开(公告)日:2022-06-14

    申请号:CN202210118669.5

    申请日:2022-02-08

    Abstract: 本发明公开了一种双金字塔结构引导的多粒度行人重识别方法及系统,首先在ResNet50中嵌入注意力金字塔,引导网络由粗到细依次挖掘不同粒度的特征,使网络更倾向于关注复杂环境中行人的显著区域;其次通过结构不对称的双重注意力特征金字塔分支,以提取多尺度的行人特征,丰富特征的多样性,同时双重注意力机制可使分支从浅层信息中捕获高细粒度的局部特征;最后将粒度较粗的全局特征与多层级细粒度的局部特征融合,两种金字塔相互作用,以此获得更多具有鉴别性的多粒度特征,以改善行人遮挡问题。本发明仅通过较少的计算量,便可有效地解决杂乱场景下难以提取行人关键信息和局部遮挡时全局特征方法失效而造成识别精度不高的问题。

    一种基于改进CenterNet的绝缘子缺陷检测方法

    公开(公告)号:CN114359153B

    公开(公告)日:2024-08-02

    申请号:CN202111483734.6

    申请日:2021-12-07

    Abstract: 本发明属于计算机视觉技术,具体涉及一种基于改进CenterNet的绝缘子缺陷检测方法,为了使检测模型适应绝缘子及其缺陷特征尺度的差异,编码阶段采用特征分组和分离注意力的结构提取特征,并在之后加入空洞空间金字塔池化结构实现捕捉绝缘子及其缺陷的多尺度特征;为了减少解码网络中特征信息的丢失,将特征分组和分离注意力结构的不同层特征级联ECA注意力模块,并分别与经过SA空间金字塔注意力模块的各反卷积特征相加形成双重注意力特征融合;通过物体的热力图中心点回归物体的宽高、尺寸信息。该方法可以直接从数据学习得到特征,无需手工设计的特征,能够在背景复杂的巡检图像中实现准确的绝缘子缺陷检测。

    基于深度卷积神经网络的场景文本检测方法、系统及设备

    公开(公告)号:CN114724155B

    公开(公告)日:2024-09-06

    申请号:CN202210410471.4

    申请日:2022-04-19

    Abstract: 本发明公开了一种基于深度卷积神经网络的场景文本检测方法、系统及设备,首先将获取的场景文本图像,进行数据增强操作,得到预定大小的图像信息;接着将预处理后的图像信息输入深度卷积神经网络中,提取图像特征;然后采用协调注意力机制层将图像特征进行增强处理;最后将增强后的特征图,采用渐进尺度扩展层进行后处理,获得文本检测结果。本发明通过在ResNet50的骨干网络中引入校正卷积、通道注意力,于提取的特征图后引入协调注意力,有效地扩大了网络感受空间,避免了后续降维操作丢失更多的语义信息,降低了不同尺度的特征图自顶向下融合导致的特征图失真程度,使网络具有更准确的鉴别区域;通过平方Dice损失函数提升了文本检测的准确性和精确性。

    一种基于改进CenterNet的绝缘子缺陷检测方法

    公开(公告)号:CN114359153A

    公开(公告)日:2022-04-15

    申请号:CN202111483734.6

    申请日:2021-12-07

    Abstract: 本发明属于计算机视觉技术,具体涉及一种基于改进CenterNet的绝缘子缺陷检测方法,为了使检测模型适应绝缘子及其缺陷特征尺度的差异,编码阶段采用特征分组和分离注意力的结构提取特征,并在之后加入空洞空间金字塔池化结构实现捕捉绝缘子及其缺陷的多尺度特征;为了减少解码网络中特征信息的丢失,将特征分组和分离注意力结构的不同层特征级联ECA注意力模块,并分别与经过SA空间金字塔注意力模块的各反卷积特征相加形成双重注意力特征融合;通过物体的热力图中心点回归物体的宽高、尺寸信息。该方法可以直接从数据学习得到特征,无需手工设计的特征,能够在背景复杂的巡检图像中实现准确的绝缘子缺陷检测。

Patent Agency Ranking