信息提取方法、装置、电子设备和介质

    公开(公告)号:CN114863439A

    公开(公告)日:2022-08-05

    申请号:CN202210546057.6

    申请日:2022-05-19

    Abstract: 本公开提供了一种信息提取方法、装置、电子设备和介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉等技术领域,可应用于OCR等场景。实现方案为:对第一文档图像进行编码,以得到多个尺度的目标特征图,并对查询信息进行编码,以得到目标文本特征;对目标特征图和目标文本特征进行融合,以得到目标融合特征;根据目标融合特征,提取第一文档图像中与查询信息中的设定实体词匹配的结构化信息。由此,可以实现从文档图像中提取与查询信息中用户所需的实体词匹配的结构化信息,以满足用户的实际提取需求,改善用户的使用体验;并且,通过自动提取结构化信息,可以提高待办事件的处理效率,支持企业办公智能化进程。

    文字识别方法、装置、电子设备以及存储介质

    公开(公告)号:CN113780098A

    公开(公告)日:2021-12-10

    申请号:CN202110945259.3

    申请日:2021-08-17

    Abstract: 本公开提供了文字识别方法、装置、电子设备以及存储介质,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:采用骨干网络对待识别的目标图像进行特征提取,得到特征图;将特征图输入第一网络,以预测特征图中的各特征点是否属于文本框,以及所属的文本框在目标图像中的位置;将特征图输入第二网络,以预测特征图中各特征点所属文本框之间的关联关系;根据各文本框的位置,对目标图像中对应图像内容进行文字识别,得到各文本框对应的文字内容;根据各文本框之间的关联关系,对各文本框对应的文字内容进行组织得到结构化信息。由此,提高了文字识别的准确性。

    一种文字定位模型的训练方法及文字定位方法

    公开(公告)号:CN113762109A

    公开(公告)日:2021-12-07

    申请号:CN202110970305.5

    申请日:2021-08-23

    Abstract: 本公开提供了一种文字定位方法及文字定位模型的训练方法,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于光学字符识别OCR等场景。具体实现方案为:获取样本图像;将样本图像输入至待训练的文字定位模型中,输出预测文本框;获取样本先验锚点框;根据样本先验锚点框、标注文本框和预测文本框,对文字定位模型的模型参数进行调整,并使用下一个样本图像对调整后的文字定位模型继续训练,直至模型训练结束生成目标文字定位模型。由此,本公开能够通过结合先验锚点框进行文字定位模型的训练,不再需要在模型训练过程中从零开始进行回归预测,降低了模型训练过程中的耗时及难度,提高了模型训练结果的可靠性。

    表格生成方法、装置、电子设备、存储介质及产品

    公开(公告)号:CN113657274A

    公开(公告)日:2021-11-16

    申请号:CN202110945523.3

    申请日:2021-08-17

    Abstract: 本公开提供了一种表格生成方法、装置、电子设备、存储介质及产品,涉及人工智能领域;具体为计算机视觉和深度学习技术领域,可应用于智慧城市和智慧金融场景下。具体实现方案为:识别待识别图像中的至少一个表格对象,获得所述至少一个表格对象分别对应的表格属性;其中,任一个表格对象的表格属性包括单元格属性或非单元格属性;确定所述至少一个表格对象中具有单元格属性的至少一个目标对象;确定所述至少一个目标对象分别对应的单元格区域,获得所述至少一个目标对象分别对应的单元格位置信息;根据所述至少一个目标对象分别对应的单元格位置信息,生成所述待识别图像对应的电子表格。本公开的技术方案提高了表格生成精度。

    用于检测图像质量的方法、装置、设备、介质和产品

    公开(公告)号:CN113643260A

    公开(公告)日:2021-11-12

    申请号:CN202110930170.X

    申请日:2021-08-13

    Abstract: 本公开提供了用于检测图像质量的方法、装置、设备、介质和产品,涉及涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图形处理和图像识别等场景下。具体实现方案为:获取目标图像;确定与目标图像对应的至少一个模型;基于目标图像和至少一个模型,确定目标图像对应的图像参数;图像参数至少包括以下一项:清晰度参数、完整性参数、类型参数;基于图像参数,确定目标图像的图像质量结果。本实现方式可以提高图像质量检测效率。

    文本结构化处理方法、处理装置、电子设备以及存储介质

    公开(公告)号:CN113627439A

    公开(公告)日:2021-11-09

    申请号:CN202110921811.5

    申请日:2021-08-11

    Abstract: 本公开提供了一种文本结构化处理方法、处理装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:对文本图像进行文本检测,得到与文本图像对应的至少一个文本检测框的类别信息,其中,类别信息包括关键字类别或数值类别;确定与至少一个文本检测框中的目标文本检测框对应的文本图像;对与目标文本检测框对应的文本图像进行文本识别,得到与目标文本检测框对应的文本图像的文本识别结果;对文本识别结果进行文本分类,得到与文本识别结果对应的语义类别结果;生成文本结构化结果,其中,文本结构化结果包括与关键字类别对应的值和与数值类别对应的值。

    光学字符识别模型训练和识别方法、装置、设备及介质

    公开(公告)号:CN113033431A

    公开(公告)日:2021-06-25

    申请号:CN202110341261.X

    申请日:2021-03-30

    Abstract: 本公开公开了一种光学字符识别模型训练和识别方法、装置、设备及介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术,可用于OCR场景下。具体实现方案为:对样本图像进行特征提取,得到样本特征数据;将所述样本特征数据输入至光学字符识别模型,以确定所述样本特征数据中的文字区域对应的局部特征数据,并提取所述局部特征数据中的语义信息,根据所述语义信息,确定所述文字区域的预测类别;根据所述预测类别和所述文字区域的标签类别,对所述光学字符识别模型进行训练。本公开提高了光学字符识别模型的类别预测结果的准确度。

    文档版面分析方法、装置、电子设备及可读存储介质

    公开(公告)号:CN112989970A

    公开(公告)日:2021-06-18

    申请号:CN202110223894.0

    申请日:2021-02-26

    Abstract: 本公开公开了文档版面分析方法、装置、电子设备及可读存储介质,涉及计算机视觉和深度学习等人工智能领域,可应用于光学字符识别等场景下,其中的方法可包括:针对待处理的文档,分别获取其中的N个文本行的预定信息,所述预定信息包括文本信息和图像信息,根据预定信息生成各文本行对应的第一特征向量;对N个第一特征向量进行编码操作,得到N个编码结果;根据N个编码结果以及预先获取的M个对象分别对应的第二特征向量,通过解码操作得到M个对象分别对应的第三特征向量;根据M个第三特征向量确定出文档的版面分析结果。应用本公开所述方案,可提升分析结果的准确性等。

    一种图像分类方法、装置、电子设备及存储介质

    公开(公告)号:CN112966522A

    公开(公告)日:2021-06-15

    申请号:CN202110235776.1

    申请日:2021-03-03

    Abstract: 本公开公开了一种图像分类方法,装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习方面。具体实现方案为:将待分类的文档图像输入到预先训练好的神经网络模型中,通过神经网络模型得到待分类的文档图像的各个文本框的特征子图;将各个文本框的特征子图与各个文本框的文本信息对应的语义特征和位置信息对应的位置特征输入至多模态特征融合模型中,通过多模态特征融合模型将三者融合为各个文本框对应的多模态特征;基于各个文本框对应的多模态特征对待分类的文档图像进行分类。本申请实施例能够很好地利用文档图像中存在的语义特征和位置特征,最终达到提升文档图像的分类精度的目的。

Patent Agency Ranking