一种基于窗口自注意与多尺度机制的图像密集描述方法

    公开(公告)号:CN116543146B

    公开(公告)日:2023-09-26

    申请号:CN202310822911.1

    申请日:2023-07-06

    Applicant: 贵州大学

    Abstract: 本发明公开了一种基于窗口自注意与多尺度机制的图像密集描述方法,由一个目标检测器和一个区域描述生成器组合而成,在目标检测器内部,输入图像经由基于窗口注意力的特征编码器进行图像表征的学习和提取,该特征编码器由12层ViT模块堆叠而成,在各层模块内,图像特征图被划分为多个大小均等的窗口并进行窗口内的注意力运算,特征编码器计算出5种不同尺度的图像特征,并通过目标检测头预测出关键区域的位置信息,模型据此从多尺度特征中切割出区域特征,区域描述生成器采用预训练BERT模型作为核心,依据输入的全局表征和区域特征,以自回归的方式进行区域描述的生成。本发明能够准确捕捉图像多个关键对象并生成高质量描述。

    一种基于对比学习的少样本细粒度图像分类方法

    公开(公告)号:CN116612335A

    公开(公告)日:2023-08-18

    申请号:CN202310878846.4

    申请日:2023-07-18

    Applicant: 贵州大学

    Abstract: 本发明公开了一种基于对比学习的少样本细粒度图像分类方法,属于深度学习和计算机视觉领域,包括:将原始数据集进行划分,创建元训练集、元验证集和元测试集,对于每个任务,使用抽样技术从元训练集中划分出支持集和查询集,用一个共享权重的转换器作为支持集和查询集的嵌入特征提取器;对从转换器中提取支持集和查询集的嵌入特征进行处理,获得用于对比学习的特征表示,在生成对比学习特征之后,对这些特征进行正则化处理,去除数据增强对特征的影响;然后进行对比学习和损失计算及类别预测和模型训练。本发明具有较高识别精度。

    一种基于神经局域连接的线性分类方法

    公开(公告)号:CN115984683A

    公开(公告)日:2023-04-18

    申请号:CN202211311775.1

    申请日:2022-10-25

    Applicant: 贵州大学

    Abstract: 本发明公开了一种基于神经局域连接的线性分类方法,包括:从数据集中获取原始图像数据,经过去除全连接层和预测层的神经网络模型处理,得到特征向量X;对X进行分区,以区间长α按步长β向右移动,每滑动一次就进行一次矩阵乘法运算,直到最后一个区间;若n‑α能被β整除,则共有t份数据,经过运算后得到单个输出矩阵y1,y2,y3,…,yt;若n‑α不能被β整除,向下取整共有t份数据,经过矩阵乘法运算后得到单个输出矩阵y1,y2,y3,…,yt,向上取整共有t+1份数据,经过矩阵乘法运算后分别得到单个输出矩阵y1,y2,y3,…,yt+1;将所有输出矩阵连接起来得到新矩阵Y。本发明在学习相对较多特征时的图像时,能够降低参数量。

    一种基于可见光图像的农业多光谱视觉重构方法

    公开(公告)号:CN115587949A

    公开(公告)日:2023-01-10

    申请号:CN202211329001.1

    申请日:2022-10-27

    Applicant: 贵州大学

    Abstract: 本发明公开了一种基于可见光图像的农业多光谱视觉重构方法,包括:数据采集、单通道光谱图像矫正、RGB图像与单通道光谱图像对齐、多张单通道光谱图像合并、随机裁剪得到的裁剪图像作为数据集;构建网络模型:将数据集输入到所构建的网络模型中,训练网络模型,得到重构结果最佳的模型;将可见光图像输入到重构结果最佳的模型中,输出重构的农业多光谱图像。本发明能够较好地重构出对应多光谱图像,且能够运用到真实场景中。

    基于双目流深度估计的人体姿态关键角度计算方法

    公开(公告)号:CN119941821A

    公开(公告)日:2025-05-06

    申请号:CN202510203984.1

    申请日:2025-02-24

    Abstract: 本发明公开了基于双目流深度估计的人体姿态关键角度计算方法,属于计算机视觉技术领域,包括S1、获取双目左图像IL和双目右图像IR;S2、将双目左图像IL和双目右图像IR输入BFD系统中,通过双目光流深度估计获得空间点的深度信息;S3、同时,双目左图像IL和双目右图像IR通过YOLOv8模型进行关键点检测,并将获取的关键点图像与深度信息进行融合;S4、进行人体关键角度计算;本发明提供的基于双目流深度估计的人体姿态关键角度计算方法,能够有效地获取人体运动的深度信息和关键角度,不仅提高了运动分析的精度和实用性,还为相关领域的研究和应用提供了新的视角和工具。

    一种基于可见光图像的农业多光谱视觉重构方法

    公开(公告)号:CN115587949B

    公开(公告)日:2024-07-12

    申请号:CN202211329001.1

    申请日:2022-10-27

    Applicant: 贵州大学

    Abstract: 本发明公开了一种基于可见光图像的农业多光谱视觉重构方法,包括:数据采集、单通道光谱图像矫正、RGB图像与单通道光谱图像对齐、多张单通道光谱图像合并、随机裁剪得到的裁剪图像作为数据集;构建网络模型:将数据集输入到所构建的网络模型中,训练网络模型,得到重构结果最佳的模型;将可见光图像输入到重构结果最佳的模型中,输出重构的农业多光谱图像。本发明能够较好地重构出对应多光谱图像,且能够运用到真实场景中。

    一种基于特征向量的离散相似度匹配分类方法

    公开(公告)号:CN116524282B

    公开(公告)日:2023-09-05

    申请号:CN202310756831.0

    申请日:2023-06-26

    Applicant: 贵州大学

    Abstract: 本发明公开了一种基于特征向量的离散相似度匹配分类方法,包括以下步骤:双阶段神经网络训练:阶段一,载入神经网络模型,训练数个周期,不用训至收敛,记该模型为M,删除M的全连接层,记为M’;阶段二,继续训练,经过阶段二的训练之后,利用M’遍历数据集中所有样本的输出特征向量V,构建代表各类别的显著表达位置集合;并以样本的显著表达位置序列作为分类依据,与各类别的统计显著位置集合做匹配分数比较,进行分类推理。本发明采用上述基于特征向量的离散相似度匹配分类方法,使得网络模型在推理过程中无需全连接层实现分类目的,可在不降低卷积神经网络模型准确度的情况下提升推理速度。

    基于多粒度图文语义学习的文本引导图像修复模型及方法

    公开(公告)号:CN116523799A

    公开(公告)日:2023-08-01

    申请号:CN202310796408.3

    申请日:2023-07-03

    Applicant: 贵州大学

    Abstract: 本发明公开了基于多粒度图文语义学习的文本引导图像修复模型及方法,属于图像处理领域,包括依次设置的三阶段生成器、掩码重构模块和双鉴别器;三阶段生成器,用于分别在全局粗粒度修复阶段、局部细粒度修复阶段和全局细粒度修复阶段对受损图像进行修复;掩码重构模块,用于在模型训练阶段对受损图像中的目标对象的生成进行惩罚;双鉴别器,用于分别从全局和局部的角度对所修复图像进行判别。本发明采用上述基于多粒度图文语义学习的文本引导图像修复模型及方法,可根据给定的文本和受损图像,更好地预测受损区域中物体的视觉语义信息,生成更多的细粒度纹理,有效地提高图像修复的质量。

Patent Agency Ranking