文本识别方法、视觉特征提取模型的训练方法及装置

    公开(公告)号:CN113657395B

    公开(公告)日:2024-02-13

    申请号:CN202110944388.0

    申请日:2021-08-17

    Abstract: 本公开提供了一种文本识别方法、视觉特征提取模型的训练方法及装置,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于光学字符识别等场景,包括:获取待识别图像中待识别文本分别对应的先验特征和视觉特征,先验特征是基于待识别图像的先验知识确定的,对先验特征和视觉特征进行融合处理,得到融合特征,对融合特征进行编码处理得到编码特征,对编码特征进行解码处理,得到与待识别文本对应的文本内容,使得文本识别过程不再为孤立和片面的过程,而具有全面性和完整性,以通过充分考虑可能影响文本识别的信息(用于确定先验特征的信息、用于确定视觉特征的信息)确定文本内容,以提高文本识别的可靠性、准确性、及精度。

    任务处理方法、处理装置、电子设备及存储介质

    公开(公告)号:CN114428677A

    公开(公告)日:2022-05-03

    申请号:CN202210110164.4

    申请日:2022-01-28

    Abstract: 本公开提供了一种任务处理方法、处理装置、电子设备及存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:响应于接收到任务处理请求,根据任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据,其中,任务标注数据的标签信息与任务类型标识相匹配,任务标注数据包括第一任务标注数据和第二任务标注数据;利用第一任务标注数据训练待训练模型,得到多个候选模型,其中,待训练模型是根据任务类型标识确定的;根据利用第二任务标注数据对多个候选模型进行性能评估得到的性能评估结果,从多个候选模型中确定目标模型。

    生成样本图像的方法以及文字识别模型的训练方法

    公开(公告)号:CN114998897B

    公开(公告)日:2023-08-29

    申请号:CN202210662775.X

    申请日:2022-06-13

    Abstract: 本公开提供了生成样本图像的方法以及文字识别模型的训练方法,涉及人工智能领域,尤其涉及深度学习、图像处理、计算机视觉等技术领域,可应用于光学字符识别等场景。具体实现方案为:根据初始图像,生成第一背景图像和第一文字;其中,第一背景图像为初始图像中的所述第一文字被替换为目标图像所得到的。对第一背景图像进行调整,生成与第一背景图像相似的第二背景图像;对第一文字进行调整,生成与第一文字相似的第二文字。根据第二背景图像和第二文字,生成第一样本图像;对第一样本图像进行真实化处理,得到第二样本图像,进而增加最终得到的第二样本图像,提高训练得到的文字识别模型的准确度。

    模型的半监督训练、分类方法装置、设备、介质及产品

    公开(公告)号:CN115471717B

    公开(公告)日:2023-06-20

    申请号:CN202211142519.4

    申请日:2022-09-20

    Abstract: 本公开提供了模型的半监督训练、分类方法装置、设备、介质及产品,涉及人工智能领域,尤其涉及计算机视觉、深度学习领域。具体实现方案为:采用有标签图像样本对待训练的图像分类模型进行训练,获得第一分类模型,所述第一分类模型为第一次训练后的分类模型;确定两个无标签图像样本为一组,获得目标图像样本组;以所述目标图像样本组中两个无标签图像样本互为标签对所述第一分类模型进行训练,获得第二分类模型,所述第二分类模型为第二次训练后的分类模型。

    一种模型训练、字符识别方法、装置、设备及存储介质

    公开(公告)号:CN113971806B

    公开(公告)日:2023-05-05

    申请号:CN202111248583.6

    申请日:2021-10-26

    Abstract: 本公开提供了一种模型训练、字符识别方法、装置、设备及存储介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于OCR光学字符识别等场景下。具体实现方案为:获得场景图像、所述场景图像中的第二实际字符和第二构建图像;采用所述待训练模型对所述场景图像进行字符识别,得到字符识别过程中提取的字符的第一特征和第一识别字符;采用所述辅助训练模型对所述第二构建图像进行字符识别,得到字符识别过程中提取的字符的第二特征;基于所述第一识别字符、第二实际字符、第一特征和第二特征,对所述待训练模型的模型参数进行调整,得到字符识别模型。应用本公开实施例提供的方案能够训练得到用于进行字符识别的模型。

    模型压缩方法、图像处理方法、装置和电子设备

    公开(公告)号:CN114881227A

    公开(公告)日:2022-08-09

    申请号:CN202210520999.7

    申请日:2022-05-13

    Abstract: 本公开提供了一种模型压缩方法、图像处理方法、装置和电子设备,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉技术领域。具体实现方案为:基于第一训练样本对初始模型进行训练,得到训练后的第一目标模型,第一目标模型包括N个第一网络层和M个第二网络层;对N个第一网络层进行剪枝,得到N个第三网络层;将第i个第三网络层对应的第i个第一网络层作为老师层,基于第一目标模型对应的第二训练样本,对第i个第三网络层进行蒸馏学习,得到第i个第四网络层;根据N个第四网络层和M个第二网络层,生成第二目标模型。由此,可对第一网络层分别进行剪枝,并对第三网络层分别进行蒸馏学习,提升了模型压缩的性能。

    文字识别模型的样本确定的方法及装置

    公开(公告)号:CN118629054A

    公开(公告)日:2024-09-10

    申请号:CN202410749748.5

    申请日:2024-06-11

    Abstract: 本公开提供了文字识别模型的样本确定的方法及装置。本公开涉及人工智能技术领域,具体涉及计算机视觉、深度学习、图像处理、文字识别等技术领域,可应用于智慧城市、智慧金融等场景。基于初始的第一文字识别模型,得到更新后的第一训练集;使用更新后的第一训练集对初始的第一文字识别模型进行再训练,得到更新后的第一文字识别模型;基于更新后的第一文字识别模型,得到再次更新后的第一训练集;基于再次更新后的第一训练集,对该更新后的第一文字识别模型进行再训练,直到满足第一预设条件;根据训练得到目标第一文字识别模型采用的第一训练集,确定第一类样本集。

    文字识别模型的训练方法和识别图像中文字的方法

    公开(公告)号:CN113313022B

    公开(公告)日:2023-11-10

    申请号:CN202110587936.9

    申请日:2021-05-27

    Abstract: 本公开提供了一种文字识别模型的训练方法和识别图像中文字的方法、装置、电子设备和存储介质,应用于人工智能技术领域,具体应用于计算机视觉和深度学习技术领域,可应用于图像识别场景下。文字识别模型的训练方法的具体实现方案为:以第一目标图像作为第一文字识别模型的输入,获得第一特征图;以样本图像作为第二文字识别模型的输入,获得第二特征图,其中,第二文字识别模型以第一文字识别模型作为初始模型;基于第一特征图和第二特征图的差异,确定第一损失值;以及基于第一损失值,对第二文字识别模型进行训练。其中,第一目标图像与样本图像包括相同的文字,且第一目标图像以目标格式表示文字。

    模型的半监督训练、分类方法装置、设备、介质及产品

    公开(公告)号:CN115471717A

    公开(公告)日:2022-12-13

    申请号:CN202211142519.4

    申请日:2022-09-20

    Abstract: 本公开提供了模型的半监督训练、分类方法装置、设备、介质及产品,涉及人工智能领域,尤其涉及计算机视觉、深度学习领域。具体实现方案为:采用有标签图像样本对待训练的图像分类模型进行训练,获得第一分类模型,所述第一分类模型为第一次训练后的分类模型;确定两个无标签图像样本为一组,获得目标图像样本组;以所述目标图像样本组中两个无标签图像样本互为标签对所述第一分类模型进行训练,获得第二分类模型,所述第二分类模型为第二次训练后的分类模型。

Patent Agency Ranking