文字检测和模型训练方法、装置、设备及存储介质

    公开(公告)号:CN114724133B

    公开(公告)日:2024-02-02

    申请号:CN202210404529.4

    申请日:2022-04-18

    Abstract: 中的文字以文本实例为单元进行检测得到检测本公开提供了一种文字检测和模型训练方 结果,文字检测的准确性较高。法、装置、设备及存储介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于光学字符识别等场景。具体实现方案为:获取训练样本,训练样本中包括样本图像和标签图像,标签图像为对所述样本图像上的文本实例进行标注得到的图像;将样本图像输入至文字检测模型,得到文字检测模型输出的分割图像和分割图像的图像类别,其中,图像类别指(56)对比文件CN 112634292 A,2021.04.09CN 105741294 A,2016.07.06CN 113887394 A,2022.01.04陈志毅等.基于deepFM和卷积神经网络的集成式多模态谣言检测方法.计算机科学.2022,第49卷(第1期),101-107.H. T. Basavaraju等.Arbitrary orientedmultilingual text detection andsegmentation using level set and Gaussianmixture model.EvolutionaryIntelligence.2021,881–894.胥杏培;宋余庆;陆虎.一种结合深度学习特征和社团划分的图像分割方法.小型微型计算机系统.2018,(11),2533-2537.梁礼明;黄朝林;石霏;吴健;江弘九;陈新建.融合形状先验的水平集眼底图像血管分割.计算机学报.2016,(07),1678-1692.

    图像质量检测方法、装置、电子设备及存储介质

    公开(公告)号:CN115690016A

    公开(公告)日:2023-02-03

    申请号:CN202211287536.7

    申请日:2022-10-20

    Abstract: 本公开提供了图像质量检测方法、装置、电子设备及存储介质,涉及深度学习、计算机视觉以及图像处理等人工智能领域,其中的方法可包括:对待处理图像进行切分操作,得到M个图像块,M为大于一的正整数,任意两个图像块之间均不存在重叠区域;将M个图像块作为网络分类模型的输入,得到输出的待处理图像的质量分类结果,网络分类模型中包括至少两层卷积层,其中,第一层卷积层为采用深度可分离卷积方式的卷积层。应用本公开所述方案,可提升分类结果的准确性等。

    任务处理方法、处理装置、电子设备及存储介质

    公开(公告)号:CN114428677A

    公开(公告)日:2022-05-03

    申请号:CN202210110164.4

    申请日:2022-01-28

    Abstract: 本公开提供了一种任务处理方法、处理装置、电子设备及存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:响应于接收到任务处理请求,根据任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据,其中,任务标注数据的标签信息与任务类型标识相匹配,任务标注数据包括第一任务标注数据和第二任务标注数据;利用第一任务标注数据训练待训练模型,得到多个候选模型,其中,待训练模型是根据任务类型标识确定的;根据利用第二任务标注数据对多个候选模型进行性能评估得到的性能评估结果,从多个候选模型中确定目标模型。

    票据识别方法、装置、设备以及存储介质

    公开(公告)号:CN112837466A

    公开(公告)日:2021-05-25

    申请号:CN202011501307.1

    申请日:2020-12-18

    Abstract: 本申请公开了一种票据识别方法、装置、设备以及存储介质,涉及计算机视觉、自然语言处理和深度学习等人工智能技术领域。该方法的一具体实施方式包括:获取票据图像;将票据图像输入预先训练的票据识别模型的特征提取网络层中,得到票据图像的票据关键字段特征图和票据关键字段值特征图;将票据关键字段特征图输入票据识别模型的第一头部网络层中,得到票据关键字段;利用票据识别模型的第二头部网络层对票据关键字段值特征图进行处理,得到票据关键字段值,其中,特征提取网络层分别与第一头部网络层和第二头部网络层连接;基于票据关键字段和票据关键字段值,生成票据图像的结构化信息。

    结构化文档信息标注的方法、装置及电子设备

    公开(公告)号:CN111695518A

    公开(公告)日:2020-09-22

    申请号:CN202010538181.9

    申请日:2020-06-12

    Abstract: 本申请公开了结构化文档信息标注的方法、装置及电子设备,涉及人工智能领域、深度学习领域以及大数据领域。具体实现方案为:获取结构化文档的模板图像以及所述模板图像的至少一个待填充字段的标注信息,所述标注信息包括所述待填充字段的属性值、历史内容以及所述待填充字段在所述模板图像中的历史位置。根据所述待填充字段的属性值、所述待填充字段的历史内容以及所述待填充字段在模板图像中的历史位置,生成所述待填充字段的目标填充信息。根据所述待填充字段的目标填充信息,得到标注的结构化文档的图像。该方法能够实现结构化文档的快速准确的标注。

    一种文字定位模型的训练方法及文字定位方法

    公开(公告)号:CN113762109B

    公开(公告)日:2023-11-07

    申请号:CN202110970305.5

    申请日:2021-08-23

    Abstract: 本公开提供了一种文字定位方法及文字定位模型的训练方法,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于光学字符识别OCR等场景。具体实现方案为:获取样本图像;将样本图像输入至待训练的文字定位模型中,输出预测文本框;获取样本先验锚点框;根据样本先验锚点框、标注文本框和预测文本框,对文字定位模型的模型参数进行调整,并使用下一个样本图像对调整后的文字定位模型继续训练,直至模型训练结束生成目标文字定位模型。由此,本公开能够通过结合先验锚点框进行文字定位模型的训练,不再需要在模型训练过程中从零开始进行回归预测,降低了模型训练过程中的耗时及难度,提高了模型训练结果的可靠性。

Patent Agency Ranking