文字识别模型及其识别方法、装置、设备和介质

    公开(公告)号:CN115690793B

    公开(公告)日:2023-06-06

    申请号:CN202310000574.8

    申请日:2023-01-03

    Abstract: 本公开提供了一种文字识别模型及其识别方法、装置、设备和介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可用于OCR等场景。具体实现方案为:获取分别包括文字信息的第一样本图片和第二样本图片,以及第二样本图片对应的样本文字标签;根据第一样本图片对特征编码网络进行自监督预训练;根据预训练好的特征编码网络、第二样本图片和相应样本文字标签,对特征解码网络进行有监督预训练;根据预训练好的特征编码网络和特征解码网络,生成文字识别模型,用于对待预测图像进行文字识别。根据本公开的技术,提高了文字识别模型的识别结果准确度。

    文字识别模型训练方法、装置以及设备

    公开(公告)号:CN115965075A

    公开(公告)日:2023-04-14

    申请号:CN202211605781.8

    申请日:2022-12-14

    Abstract: 本公开提供了一种文字识别模型训练方法、装置以及设备,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。该方法的一具体实施方式包括:获取第一有标签样本集合和无标签样本集合;利用第一有标签样本集合对第一模型进行训练,得到辅助模型;利用辅助模型对无标签样本集合进行样本筛选和标签标注,得到第二有标签样本集合;利用第一有标签样本集合和第二有标签样本集合对第二模型进行训练,得到文字识别模型,其中,第一模型的规模大于第二模型。该实施方式能够在有标签样本数量缺乏的情况下充分利用无标签样本,提升文字识别模型对手写文本图像的识别精度。

    文本识别方法、装置、设备和介质

    公开(公告)号:CN113313111B

    公开(公告)日:2024-02-13

    申请号:CN202110594748.9

    申请日:2021-05-28

    Abstract: 本公开提供了一种文本识别方法、装置、设备和介质,涉及人工智能领域,具体涉及计算机视觉和深度学习技术,可应用于OCR场景下。该文本识别方法包括:获取待检测图像;将待检测图像输入训练好的文本检测网络模型,获取文本检测网络模型输出的一个或多个检测框,一个或多个检测框中的每一个检测框包围待检测图像中符合预设规则的目标文本;以及对待检测图像中的位于一个或多个检测框内的目标文本进行识别。

    深度学习模型的训练方法、文本识别方法、装置和设备

    公开(公告)号:CN114998881B

    公开(公告)日:2023-11-07

    申请号:CN202210596310.9

    申请日:2022-05-27

    Abstract: 本公开提供了一种深度学习模型的训练方法,涉及人工智能技术领域,尤其涉及深度学习、图像处理和计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:获取样本图像,其中,样本图像设置有标签,标签指示样本图像中的文本信息以及文本信息的语种信息;将样本图像输入到深度学习模型,得到针对多个解码分支的文本识别结果,其中,多个解码分支与多个语种各自对应;根据标签指示的语种信息,从多个解码分支的文本识别结果中确定目标文本识别结果;以及根据标签指示的文本信息与目标文本识别结果之间的差异,调整深度学习模型的参数。本公开还提供了一种文本识别方法、装置、电子设备和存储介质。

    用于文本检测的深度学习模型训练方法及文本检测方法

    公开(公告)号:CN113642583B

    公开(公告)日:2022-06-28

    申请号:CN202110932789.4

    申请日:2021-08-13

    Abstract: 本公开提供了用于文本检测的深度学习模型训练方法及文本检测方法,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于OCR光学字符识别等场景。给出了用于文本检测的深度学习模型训练方法,单字符分割子网络输出的单字符分割预测结果,文本行分割子网络输出的文本行分割预测结果,训练后的深度学习模型可以用于文本区域的检测;并且可以同时实现单字符分割及文本行分割的预测,从而能够结合两种文本分割方式来进行文本检测,能够进一步提高文本区域检测的准确性。

Patent Agency Ranking