一种光学字符识别模型的优化方法、装置、设备及介质

    公开(公告)号:CN114495123A

    公开(公告)日:2022-05-13

    申请号:CN202210041824.8

    申请日:2022-01-14

    Abstract: 本公开提供了一种光学字符识别模型的优化方法、装置、设备及介质,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉技术领域。具体实现方案为:获取多个线上业务数据的编码向量;采用编码器和两个解码器,对多个线上业务数据的编码向量进行处理,得到每个线上业务数据的两个解码向量;根据每个线上业务数据的编码向量和两个解码向量,确定每个线上业务数据对应的两个损失值;从多个线上业务数据中,获取坐标在预设坐标范围外的线上业务数据,作为困难样本,每个线上业务数据的坐标由该线上业务数据对应的两个损失值构成;利用困难样本,优化光学字符识别模型。

    神经网络模型的压缩方法、设备和存储介质

    公开(公告)号:CN114282670A

    公开(公告)日:2022-04-05

    申请号:CN202210044856.3

    申请日:2022-01-14

    Abstract: 本公开提供了一种神经网络模型的压缩方法、设备和存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于图像处理等场景。具体实现方案为:在对初始神经网络模型进行压缩的过程中,结合初始神经网络模型中各层神经网络的剪枝比例,对各层神经网络分别进行剪枝处理,以得到中间神经网络模型,并基于训练数据对中间神经网络模型进行训练,并对训练后的所述中间神经网络模型进行量化,以及结合训练数据对量化后的中间神经网络模型进行训练,以得到最终的目标神经网络模型。由此,在保证神经网络模型的性能的情况下,节省了计算资源、存储和硬件资源等。

    签名识别模型训练方法、装置及电子设备

    公开(公告)号:CN114049686A

    公开(公告)日:2022-02-15

    申请号:CN202111345986.2

    申请日:2021-11-15

    Abstract: 本公开提供了签名识别模型训练方法、装置及电子设备,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域。具体方案为:从预定的样本库中,获取待利用样本以及对应的姓名标注信息;其中,所述样本库包括第一类样本和对应的姓名标注信息;第一类样本为在基于该签名识别模型进行签名识别时,经反馈识别结果错误的签名图片;获取待利用样本对应的文本行图片,其中,文本行图片为待利用样本中的签名区域;基于待利用样本对应的文本行图片和姓名标注信息,对签名识别模型进行更新训练。通过本方案,可以自动进行训练迭代签名识别模型,大大减少了迭代签名识别模型的人力成本。

    一种模型训练、字符识别方法、装置、设备及存储介质

    公开(公告)号:CN113971806A

    公开(公告)日:2022-01-25

    申请号:CN202111248583.6

    申请日:2021-10-26

    Abstract: 本公开提供了一种模型训练、字符识别方法、装置、设备及存储介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于OCR光学字符识别等场景下。具体实现方案为:获得场景图像、所述场景图像中的第二实际字符和第二构建图像;采用所述待训练模型对所述场景图像进行字符识别,得到字符识别过程中提取的字符的第一特征和第一识别字符;采用所述辅助训练模型对所述第二构建图像进行字符识别,得到字符识别过程中提取的字符的第二特征;基于所述第一识别字符、第二实际字符、第一特征和第二特征,对所述待训练模型的模型参数进行调整,得到字符识别模型。应用本公开实施例提供的方案能够训练得到用于进行字符识别的模型。

    文字识别方法、装置、电子设备以及存储介质

    公开(公告)号:CN113780098A

    公开(公告)日:2021-12-10

    申请号:CN202110945259.3

    申请日:2021-08-17

    Abstract: 本公开提供了文字识别方法、装置、电子设备以及存储介质,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:采用骨干网络对待识别的目标图像进行特征提取,得到特征图;将特征图输入第一网络,以预测特征图中的各特征点是否属于文本框,以及所属的文本框在目标图像中的位置;将特征图输入第二网络,以预测特征图中各特征点所属文本框之间的关联关系;根据各文本框的位置,对目标图像中对应图像内容进行文字识别,得到各文本框对应的文字内容;根据各文本框之间的关联关系,对各文本框对应的文字内容进行组织得到结构化信息。由此,提高了文字识别的准确性。

    一种文字定位模型的训练方法及文字定位方法

    公开(公告)号:CN113762109A

    公开(公告)日:2021-12-07

    申请号:CN202110970305.5

    申请日:2021-08-23

    Abstract: 本公开提供了一种文字定位方法及文字定位模型的训练方法,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于光学字符识别OCR等场景。具体实现方案为:获取样本图像;将样本图像输入至待训练的文字定位模型中,输出预测文本框;获取样本先验锚点框;根据样本先验锚点框、标注文本框和预测文本框,对文字定位模型的模型参数进行调整,并使用下一个样本图像对调整后的文字定位模型继续训练,直至模型训练结束生成目标文字定位模型。由此,本公开能够通过结合先验锚点框进行文字定位模型的训练,不再需要在模型训练过程中从零开始进行回归预测,降低了模型训练过程中的耗时及难度,提高了模型训练结果的可靠性。

    用于检测图像质量的方法、装置、设备、介质和产品

    公开(公告)号:CN113643260A

    公开(公告)日:2021-11-12

    申请号:CN202110930170.X

    申请日:2021-08-13

    Abstract: 本公开提供了用于检测图像质量的方法、装置、设备、介质和产品,涉及涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图形处理和图像识别等场景下。具体实现方案为:获取目标图像;确定与目标图像对应的至少一个模型;基于目标图像和至少一个模型,确定目标图像对应的图像参数;图像参数至少包括以下一项:清晰度参数、完整性参数、类型参数;基于图像参数,确定目标图像的图像质量结果。本实现方式可以提高图像质量检测效率。

    文本结构化处理方法、处理装置、电子设备以及存储介质

    公开(公告)号:CN113627439A

    公开(公告)日:2021-11-09

    申请号:CN202110921811.5

    申请日:2021-08-11

    Abstract: 本公开提供了一种文本结构化处理方法、处理装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:对文本图像进行文本检测,得到与文本图像对应的至少一个文本检测框的类别信息,其中,类别信息包括关键字类别或数值类别;确定与至少一个文本检测框中的目标文本检测框对应的文本图像;对与目标文本检测框对应的文本图像进行文本识别,得到与目标文本检测框对应的文本图像的文本识别结果;对文本识别结果进行文本分类,得到与文本识别结果对应的语义类别结果;生成文本结构化结果,其中,文本结构化结果包括与关键字类别对应的值和与数值类别对应的值。

Patent Agency Ranking