-
公开(公告)号:CN117422703A
公开(公告)日:2024-01-19
申请号:CN202311542530.4
申请日:2023-11-18
Applicant: 桂林电子科技大学
IPC: G06T7/00 , G06N3/0464 , G06T7/73 , G06V10/764 , G06V10/82
Abstract: 本发明属于热轧带钢缺陷检测领域,提供了一种基于去噪扩散隐式模型的热轧带钢缺陷检测方法,包括如下步骤:S1,获取钢材缺陷数据集;S2,将步骤S1中获取的钢材缺陷数据集作为训练集训练去噪扩散隐式模型,并在去噪扩散隐式模型中对原有的数据进行采样,生成可用数据;S3,将步骤S2中生成的可用数据人工标注后与步骤S1中获取的钢材缺陷数据集进行混合,构成带有标注信息的数据集;本发明通过使用去噪扩散隐式模型对原有的数据进行采样并生成高质量数据,解决了现有技术中只能在小数据集上训练产生虚假高精度的模型,导致鲁棒性差的问题,提高了钢材缺陷检测的精度,减少了漏检率。
-
公开(公告)号:CN118379774A
公开(公告)日:2024-07-23
申请号:CN202410537522.9
申请日:2024-04-30
Applicant: 桂林电子科技大学
IPC: G06V40/16 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于CNN融合transformer的人脸外观注视方向预测方法,属于图像处理技术领域,发明内容包括:获取待测对象的人脸外观图像;将所述待测对象的人脸图像输入可靠梯度传播的卷积神经网络中,提取人脸图像中的大尺度特征、中等尺度特征以及全局视觉特征;将提取的特征输入到transformer模块,聚合为多尺度特征;将聚合的多尺度特征以及全局视觉特征经过多头交叉注意力,输出注视方向。本发明融合CNN与transformer的优势,解决了现有注视方向预测技术信息丢失严重和多尺度特征利用率低的问题。
-