一种缺陷检测与定位方法及装置
    1.
    发明公开

    公开(公告)号:CN118130465A

    公开(公告)日:2024-06-04

    申请号:CN202310984262.5

    申请日:2023-08-07

    Applicant: 清华大学

    Abstract: 本发明提出一种缺陷检测与定位方法及装置,属于缺陷检测领域。其中,所述方法包括:获取待检测对象的图像作为待测样本并输入预设的缺陷检测与定位模型,该模型采用包含具有翻转结构的老师子模型和学生子模型的师生蒸馏模型,输出待测样本在不同尺度下的特征级余弦相似度图谱;根据不同尺度下的特征级余弦相似度图谱,得到待测样本是否包含缺陷的检测结果,对包含缺陷的待测样本生成对应的缺陷热度图;基于缺陷热度图,得到待测样本的缺陷定位结果。本发明的缺陷检测与定位模型在训练时无需带缺陷的训练数据,并且在不获取旧任务数据的情况下持续地学习新任务,可弥补现有检测技术对序列型检测任务的灾难性遗忘问题,具有较高应用价值。

    一种反馈注意力增强的非模式图像分割方法及装置

    公开(公告)号:CN113516670A

    公开(公告)日:2021-10-19

    申请号:CN202110732029.9

    申请日:2021-06-29

    Applicant: 清华大学

    Abstract: 本公开提出一种反馈注意力增强的非模式图像分割方法及装置,属于图像识别技术领域。其中方法包括:获取真实环境的RGB图像;根据预设的非模式图像分割网络,对所述RGB图像进行多尺度预测,其中,所述预设的非模式图像分割网络输出图像中被识别对象可见部分和被遮挡部分的形状、边界和语义类别,以得到输入图像的非模式图像分割结果。本公开可克服以往由于物体之间相互遮挡导致的图像识别中对物体感知的不全面性,尽可能避免物体之间遮挡造成的识别和分割错误,增强其对周围环境的全面感知和理解。

    一种零样本图像异常检测方法及装置

    公开(公告)号:CN119130931A

    公开(公告)日:2024-12-13

    申请号:CN202411142402.5

    申请日:2024-08-20

    Applicant: 清华大学

    Abstract: 本发明提出一种零样本图像异常检测方法及装置,属于计算机视觉和图像异常检测领域。其中,所述方法包括:将待检测目标的图像输入预设的零样本图像异常检测网络,该网络包括图像编码器和文本编码器,通过多模态提示学习,图像编码器输出图像的局部视觉特征,文本编码器输出可学习提示嵌入的文本特征;通过计算局部视觉特征与文本特征的余弦相似度并插值得到相似图,并用相似度测量得到异常图,进而得到输入图像的异常检测结果。本发明通过构建多模态的提示学习来增强特征表示的灵活性和提示的泛化能力,可以降低人工设计提示工程的复杂性,并构建出更好的异常检测提示,从而提高零样本异常检测模型的效果。

    一种可持续学习的多种工业缺陷分类方法及装置

    公开(公告)号:CN115393648A

    公开(公告)日:2022-11-25

    申请号:CN202211088253.X

    申请日:2022-09-07

    Applicant: 清华大学

    Abstract: 本发明提出一种可持续学习的多种工业缺陷分类方法及装置,属于缺陷分类技术领域和持续学习技术领域。其中,所述方法包括:任意采集一张待分类产品图像,对所述图像标注对应的分类任务序号;将所述图像和所述分类任务序号输入预设的多任务缺陷分类网络,所述多任务缺陷分类网络输出在所述分类任务下所述图像是否属于缺陷图像的分类结果。本发明能够实现工业场景中多类缺陷的持续有效分类,适用于复杂的缺陷分类任务,显著提升缺陷分类的效率。

    一种基于视触融合的室外移动机器人地形识别方法

    公开(公告)号:CN110909637A

    公开(公告)日:2020-03-24

    申请号:CN201911088893.9

    申请日:2019-11-08

    Applicant: 清华大学

    Abstract: 本发明提出的一种基于视触融合的室外移动机器人地形识别方法,首先根据不同路面材质选择地形种类;针对不同地形采集触觉和视觉两种模态数据,并划分训练集和测试集;构建级联宽度学习网络并使用触觉训练样本集和视觉训练样本集对该网络进行训练,训练过程中,先进行触觉和视觉初步特征提取,再进行触觉和视觉融合特征提取,随后将融合后的触觉特征矩阵和视觉特征矩阵经宽度学习分类算法,通过岭回归的广义逆近似求得地形识别分类结果作为级联宽度学习网络的输出;最后将测试集输入训练完毕的级联宽度学习网络中,得到地形识别的分类结果。本发明基于宽度学习,将视触觉信息相融合,可实现小数据下的移动机器人地形识别,且鲁棒性和准确性高。

    一种反馈注意力增强的非模式图像分割方法及装置

    公开(公告)号:CN113516670B

    公开(公告)日:2024-06-25

    申请号:CN202110732029.9

    申请日:2021-06-29

    Applicant: 清华大学

    Abstract: 本公开提出一种反馈注意力增强的非模式图像分割方法及装置,属于图像识别技术领域。其中方法包括:获取真实环境的RGB图像;根据预设的非模式图像分割网络,对所述RGB图像进行多尺度预测,其中,所述预设的非模式图像分割网络输出图像中被识别对象可见部分和被遮挡部分的形状、边界和语义类别,以得到输入图像的非模式图像分割结果。本公开可克服以往由于物体之间相互遮挡导致的图像识别中对物体感知的不全面性,尽可能避免物体之间遮挡造成的识别和分割错误,增强其对周围环境的全面感知和理解。

Patent Agency Ranking