一种基于可变形快速卷积的光伏组件缺陷识别方法

    公开(公告)号:CN117636050A

    公开(公告)日:2024-03-01

    申请号:CN202311686412.0

    申请日:2023-12-09

    Abstract: 本发明公开了一种基于可变形快速卷积的光伏组件缺陷识别方法,包括如下步骤:S1:将图像输入Ghost卷积神经网络,通过Ghost卷积神经网络提取图像的特征;S2:通过C2f模块将不同尺度的特征图进行融合;S3:为了更好地适应检测目标的几何形变,将DCN和C2f融合形成新的C2f_DCN可变形特征融合模块;S4:将特征输入Ghost卷积神经网络,3次交替通过Ghost卷积神经网络和C2f_DCN可变形特征融合模块进行卷积和特征融合,进一步贴近目标形状提取特征;S5:将特征输入SPPF特征提取层,用于捕捉图像中不同尺度目标的特征,并处理不同尺度的感受野。

    一种基于MRF超像素标记的人体姿态估计方法

    公开(公告)号:CN114170675A

    公开(公告)日:2022-03-11

    申请号:CN202111326022.3

    申请日:2021-11-10

    Abstract: 本发明属于图像识别领域,为一种基于MRF超像素标记的人体姿态估计方法,将目标图像分割为若干特征相似的超像素图像块,采用超像素MRF模型对超像素图像块的部位标记;以一个超像素为步长完成整幅图像的遍历,将超像素中心作为姿态估计算法中矩形部位检测器的匹配中心,构建以超像素中心点为中心的矩形区域集合,获得目标图像的部位搜索空间;计算K个部位检测器与部位搜索空间内所有矩形的部位匹配分数。根据部位形变模型计算相邻部位的距离分数;将所有部位的部位匹配分数与距离分数相加得到总体姿态估计得分,选择总分最高的姿态作为各个部位的识别结果。解决姿态估计算法部位搜索效率低、易受背景和其他人体部位干扰的问题。

    一种基于组合模型的视频人体姿态推理优化方法

    公开(公告)号:CN114170621A

    公开(公告)日:2022-03-11

    申请号:CN202111325974.3

    申请日:2021-11-10

    Abstract: 本发明属于视频技术领域,具体地而言为一种基于组合模型的视频人体姿态推理优化方法,包括将人体整体结构划分为若干树型组合部位,每个组合部位包含有多个线性的基本部位,对单个组合部位在视频中所有帧的一致性计算,求每个组合部位一致性计算结果的最大化获得候选部位集合,计算每一帧候选部位之间的距离得分,根据所有组合部位的得分总和最优化获得最佳姿态。解决视频中姿态估计的正确率较低、推理优化复杂度高的问题,简化姿态推理过程中的结构复杂度。

    一种光伏板缺陷识别方法

    公开(公告)号:CN117274773A

    公开(公告)日:2023-12-22

    申请号:CN202311213793.0

    申请日:2023-09-19

    Abstract: 本发明属于一种光伏板缺陷识别方法,包括如下步骤:对图像进行下采样,降低特征的维度并保留有效信息;对有效信息进行卷积,实现特征提取和分类,并提取丰富的特征表示;将DCN和C3融合形成新的C3_DCN可变形卷积层,能更好地适应检测目标的几何形变;将特征输入C3_DCN可变形卷积层;将特征输入特征提取层,用于处理不同尺度的感受野,并捕捉图像中不同尺度目标的特征;将特征输入上下文注意力网络;将特征经过上采样放大后输入上下文增强模块,结果为x1;将特征经过上采样放大后进行卷积,再进行检测结果为x2;将特征直接进行卷积,再进行检测结果为x3;采用非极大值抑制法在x1,x2,x3中筛选出最终结果。提高了精度以及计算效率。

    一种基于双流时空注意力机制的动作识别方法T-STAM

    公开(公告)号:CN111627052B

    公开(公告)日:2023-05-23

    申请号:CN202010360993.9

    申请日:2020-04-30

    Abstract: 本发明公开了一种基于双流时空注意力机制的动作识别方法T‑STAM,包括如下步骤:S1:对视频进行处理获取RGB帧的光流图;S2:将通道注意力网络SE‑Net融入到双流基础网络BN‑Inception中得到SE‑BN‑Inception;S3:将选取的RGB帧及光流场信息输入到SE‑BN‑Inception中,对特征中不同通道的依赖关系进行建模得到视频的特征向量X;S4:将特征X输入到基于CNN的时间注意力网络来计算每帧对应的时间注意力得分;S5:将特征X输入到多空间注意力网络,提取帧的多个运动空间显著区域;S6:融合时空特征进一步增强视频的特征表达,按不同权重融合两流输出得到动作识别结果。

    一种基于双流时空注意力机制的动作识别方法

    公开(公告)号:CN111627052A

    公开(公告)日:2020-09-04

    申请号:CN202010360993.9

    申请日:2020-04-30

    Abstract: 本发明公开了一种基于双流时空注意力机制的动作识别方法T-STAM,包括如下步骤:S1:对视频进行处理获取RGB帧的光流图;S2:将通道注意力网络SE-Net融入到双流基础网络BN-Inception中得到SE-BN-Inception;S3:将选取的RGB帧及光流场信息输入到SE-BN-Inception中,对特征中不同通道的依赖关系进行建模得到视频的特征向量X;S4:将特征X输入到基于CNN的时间注意力网络来计算每帧对应的时间注意力得分;S5:将特征X输入到多空间注意力网络,提取帧的多个运动空间显著区域;S6:融合时空特征进一步增强视频的特征表达,按不同权重融合两流输出得到动作识别结果。

    一种基于MRF超像素标记的人体姿态估计方法

    公开(公告)号:CN114170675B

    公开(公告)日:2024-10-25

    申请号:CN202111326022.3

    申请日:2021-11-10

    Abstract: 本发明属于图像识别领域,为一种基于MRF超像素标记的人体姿态估计方法,将目标图像分割为若干特征相似的超像素图像块,采用超像素MRF模型对超像素图像块的部位标记;以一个超像素为步长完成整幅图像的遍历,将超像素中心作为姿态估计算法中矩形部位检测器的匹配中心,构建以超像素中心点为中心的矩形区域集合,获得目标图像的部位搜索空间;计算K个部位检测器与部位搜索空间内所有矩形的部位匹配分数。根据部位形变模型计算相邻部位的距离分数;将所有部位的部位匹配分数与距离分数相加得到总体姿态估计得分,选择总分最高的姿态作为各个部位的识别结果。解决姿态估计算法部位搜索效率低、易受背景和其他人体部位干扰的问题。

Patent Agency Ranking