字符识别模型训练方法、装置、计算机设备及存储介质

    公开(公告)号:CN118447509A

    公开(公告)日:2024-08-06

    申请号:CN202410554317.3

    申请日:2024-05-07

    摘要: 本申请提供了一种字符识别模型训练方法、装置、计算机设备及存储介质。该方法包括:获取输入图像以及输入图像的标注字符串;通过预先部署在边缘设备上的字符识别模型对输入图像进行字符识别,得到输入图像的预测字符串;在预测字符串与标注字符串不一致的情况下,通过状态空间模型对字符识别模型中的分类头进行参数更新;该状态空间模型中包含状态方程以及观测方程,该状态方程用于指示分类头参数在不同时间步之间的演变关系;该观测方程用于基于分类头参数生成可观测的观测字符。通过上述方法,可以在边缘设备中实时进行深度OCR模型的学习训练,简化模型训练过程,降低学习成本,提高模型训练效率。

    缺陷检测方法、装置、计算机设备及存储介质

    公开(公告)号:CN118446982A

    公开(公告)日:2024-08-06

    申请号:CN202410554324.3

    申请日:2024-05-07

    IPC分类号: G06T7/00 G06V10/42 G06V10/80

    摘要: 本申请提供了一种缺陷检测方法、装置、计算机设备及存储介质。该方法包括:获取检测对象样本的RGB图像、深度图像以及样本标签;通过缺陷检测模型的特征提取网络对RGB图像和深度图像进行特征图提取以及特征图融合,得到融合特征图;通过缺陷检测模型的特征重构网络基于融合特征图进行缺陷检测,得到缺陷分数图;该缺陷分数图是基于全局缺陷检测网络生成的全局缺陷分数图以及局部缺陷检测网络生成的局部缺陷分数图融合得到的;基于缺陷分数图以及样本标签,对缺陷检测模型进行参数更新;其中,训练完成的缺陷检测模型用于基于待检测对象的RGB图像以及深度图像,对待检测对象进行缺陷检测。通过上述方法,可以提高缺陷检测的全面性和准确性。