文本分类模型的训练方法、文本内容的识别方法及装置

    公开(公告)号:CN114120305B

    公开(公告)日:2023-07-07

    申请号:CN202111425339.2

    申请日:2021-11-26

    Abstract: 本公开提供了一种文本分类模型的训练方法、文本内容的识别方法及装置,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于光学字符识别、文字识别等场景,训练方法包括:获取待训练图像集合,待训练图像集合中包括至少一个样本图像,根据每一样本图像,确定每一样本图像中每一文本行的预测位置信息和预测的属性信息,依据每一样本图像的每一文本行的标注位置信息和标注的属性信息、以及每一样本图像中每一文本行的预测位置信息和预测的属性信息,训练得到文本分类模型,文本分类模型用于检测待识别图像中每一文本行的属性信息,提高训练的准确性,使得在基于文本分类模型对文本行的属性信息进行确定时,提高分类的可靠性。

    图像方向的确定方法、装置、电子设备和介质

    公开(公告)号:CN116052181A

    公开(公告)日:2023-05-02

    申请号:CN202211732802.2

    申请日:2022-12-30

    Abstract: 本公开提供了一种图像方向的确定方法、装置、电子设备和介质,涉及深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。实现方案为:从待识别图像中提取至少一个文本行区域,将各文本行区域旋转第一设定角度,并从旋转后的各文本行区域中提取设定个数的第一文本行区域;获取各第一文本行区域的字符识别的第一置信度;将各第一文本行区域旋转第二设定角度,并获取旋转后的各第一文本行区域的字符识别的第二置信度;根据各第一置信度和各第二置信度,确定待识别图像的方向。由此,仅根据待识别图像中的部分文本行区域,确定待识别图像的方向,而无需根据待识别图像中的所有像素点,来预测待识别图像的方向,可以提升计算速度。

    一种文本识别、模型训练方法、装置、设备及存储介质

    公开(公告)号:CN115019321A

    公开(公告)日:2022-09-06

    申请号:CN202210800458.X

    申请日:2022-07-06

    Abstract: 本公开提供了一种文本识别、模型训练方法、装置、设备及存储介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:对待识别图像进行缩放处理,得到基准尺寸的第一图像;提取所述第一图像的图像特征;根据所述图像特征确定所述第一图像中文本的最小文本高度;基于所述最小文本高度和所述基准尺寸对应的基准文本高度,获取对所述第一图像进行缩放处理后保持文本清晰的缩放系数;按照所述缩放系数对所述第一图像进行缩放处理,得到第二图像;对所述第二图像进行文本识别。应用本公开实施例搜提供的方案能够针对各种尺寸的图像进行文本识别。

    文字识别模型的训练方法、识别文字的方法和装置

    公开(公告)号:CN113657391A

    公开(公告)日:2021-11-16

    申请号:CN202110934328.0

    申请日:2021-08-13

    Abstract: 本公开提供了一种文字识别模型的训练方法、识别文字的方法、装置、设备、存储介质以及程序产品,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:根据多个单语种语料,确定多个第一样本图片以及所述多个第一样本图片的内容标签和语种标签;根据多个混合语种语料,确定多个第二样本图片以及所述多个第二样本图片的内容标签和语种标签;以及根据所述多个第一样本图片、所述多个第一样本图片的内容标签和语种标签、所述多个第二样本图片以及所述多个第二样本图片的内容标签和语种标签,对文字识别模型进行训练。

    文本检测方法和文本检测模型的训练方法、装置

    公开(公告)号:CN115578735B

    公开(公告)日:2023-09-15

    申请号:CN202211205551.2

    申请日:2022-09-29

    Abstract: 本公开提供了一种文本检测方法和文本检测模型的训练方法、装置,涉及人工智能领域,具体涉及计算机视觉、深度学习和图像处理等技术领域,可应用于OCR等场景。文本检测方法包括:提取文本图像的图像特征;采用解码器来根据预定查询特征序列对图像特征进行解码,得到解码特征序列;根据解码特征序列,预测得到多个预测结果;每个预测结果包括位置信息、与位置信息对应的分类信息、以及位置信息指示位置处的字符与多个预测结果中位置信息指示位置处的多个字符之间的关联信息;以及根据关联信息和分类信息,确定指示位置处有字符的位置信息并对多个字符中具有关联关系的字符的位置信息进行整合,得到文本检测结果。

Patent Agency Ranking