-
公开(公告)号:CN114724156A
公开(公告)日:2022-07-08
申请号:CN202210419150.0
申请日:2022-04-20
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/412 , G06V30/413 , G06V30/19 , G06V10/766 , G06V10/82 , G06N3/04 , G06K9/62
Abstract: 本公开提供了一种表单识别方法、装置及电子设备,涉及人工智能技术领域,具体涉及深度学习、图像处理、计算机视觉技术领域。具体实现方案为:获取待识别图像,所述待识别图像包括目标表单的图像内容,所述目标表单包括M个文本实体单元;基于所述待识别图像获取所述目标表单的第一特征;基于所述第一特征,对所述M个文本实体单元进行实体分类,得到每个文本实体单元的实体类别;基于所述第一特征,对所述M个文本实体单元中不同文本实体单元之间的关联关系进行预测,得到所述M个文本实体单元的关系信息,所述关联关系用于表征不同文本实体单元之间是否存在关联;基于所述实体类别和所述关系信息,输出所述目标表单的表单信息。
-
公开(公告)号:CN114724133A
公开(公告)日:2022-07-08
申请号:CN202210404529.4
申请日:2022-04-18
Applicant: 北京百度网讯科技有限公司
IPC: G06V20/62 , G06V30/146 , G06V30/148 , G06V30/19 , G06V30/414 , G06V10/82 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本公开提供了一种文字检测和模型训练方法、装置、设备及存储介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于光学字符识别等场景。具体实现方案为:获取训练样本,训练样本中包括样本图像和标签图像,标签图像为对所述样本图像上的文本实例进行标注得到的图像;将样本图像输入至文字检测模型,得到文字检测模型输出的分割图像和分割图像的图像类别,其中,图像类别指示分割图像中包括文本实例,或者,不包括文本实例;根据分割图像、分割图像的图像类别和标注图像对文字检测模型的参数进行调整。对图像中的文字以文本实例为单元进行检测得到检测结果,文字检测的准确性较高。
-
公开(公告)号:CN114708580A
公开(公告)日:2022-07-05
申请号:CN202210367897.6
申请日:2022-04-08
Applicant: 北京百度网讯科技有限公司
IPC: G06V20/62 , G06V30/22 , G06V30/226 , G06V30/186 , G06V30/19 , G06V10/82 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本公开提供了文本识别、模型训练方法、装置、设备、存储介质及程序,涉及人工智能领域,尤其涉及深度学习、图像处理、计算机视觉技术领域,可用于OCR场景。具体实现方案为:获取待识别的文本图像,对所述文本图像进行特征提取,得到所述文本图像对应的图像特征;所述图像特征在高度和宽度方向上的特征维度数均大于1,根据所述图像特征,确定所述文本图像中的多个采样点对应的采样特征,根据所述多个采样点对应的采样特征,确定所述文本图像对应的字符识别结果。本公开提供的技术方案,针对包含任意形态字符的文本图像,均能够提高字符识别结果的准确性。
-
公开(公告)号:CN113642583B
公开(公告)日:2022-06-28
申请号:CN202110932789.4
申请日:2021-08-13
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/148 , G06V10/26 , G06V10/22 , G06K9/62 , G06V10/774
Abstract: 本公开提供了用于文本检测的深度学习模型训练方法及文本检测方法,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于OCR光学字符识别等场景。给出了用于文本检测的深度学习模型训练方法,单字符分割子网络输出的单字符分割预测结果,文本行分割子网络输出的文本行分割预测结果,训练后的深度学习模型可以用于文本区域的检测;并且可以同时实现单字符分割及文本行分割的预测,从而能够结合两种文本分割方式来进行文本检测,能够进一步提高文本区域检测的准确性。
-
公开(公告)号:CN114494686A
公开(公告)日:2022-05-13
申请号:CN202210110162.5
申请日:2022-01-28
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种文本图像矫正方法、装置、电子设备以及存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于光学字符识别等场景。具体实现方案为:从待矫正文本图像的待矫正文本区域的边界中确定至少一个第一备选控制点序列;根据至少一个第一备选控制点序列包括的多个第一备选控制点各自的位置信息和与待矫正文本图像对应的预期文本图像的预期控制点序列包括的多个预期控制点各自的位置信息,得到至少一个备选矫正文本图像的备选矫正文本图像数据;根据对至少一个备选矫正文本图像的备选矫正文本图像数据进行评估得到的评估结果,从至少一个备选矫正文本图像中确定目标矫正文本图像。
-
公开(公告)号:CN114492733A
公开(公告)日:2022-05-13
申请号:CN202111647444.0
申请日:2021-12-29
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种文本检测方法、装置、设备及存储介质,涉及计算机技术领域,尤其涉及光学字符识别(OCR,Optical Character Recognition)领域。具体实现方案为:获取待检测图像;对所述待检测图像进行特征提取,得到第一特征图;根据所述待检测图像和所述第一特征图得到主体检测结果;对所述第一特征图进行光学字符识别OCR处理,得到文字检测结果,所述文字检测结果包括所述待检测图像中每一文本行的坐标;根据所述主体检测结果和所述文字检测结果,确定所述待检测图像的文本中心行坐标。本公开通过主体检测与文字检测相结合的检测方法,可以提高文本中心行的检测精度。
-
公开(公告)号:CN114445833A
公开(公告)日:2022-05-06
申请号:CN202210110387.0
申请日:2022-01-28
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种文本识别方法,涉及人工智能技术领域,尤其涉及深度学习技术和计算机视觉技术。具体实现方案为:根据待处理图像的文本特征,得到文本特征图;对待处理图像进行视觉特征提取,得到视觉特征;根据文本特征图和视觉特征,得到待处理图像中的融合文档特征;以及根据融合文档特征,识别待处理图像中的文本。本公开还提供了一种文本识别装置、电子设备和存储介质。
-
公开(公告)号:CN114429637A
公开(公告)日:2022-05-03
申请号:CN202210041761.6
申请日:2022-01-14
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种文档分类方法、装置、设备及存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:获得待分类文档的图像;提取所述图像的图像特征,并对所述图像进行文本检测,得到所述图像中的文本以及文本位置信息;获得所得文本的文本特征;按照各文本特征所对应文本的文本位置信息,将各文本特征融合至所述图像特征,得到融合特征;基于所述融合特征,对所述待分类文档进行分类。应用本公开实施例提供的方案,能够实现对文档的分类。
-
公开(公告)号:CN114419636A
公开(公告)日:2022-04-29
申请号:CN202210023777.4
申请日:2022-01-10
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了文本识别方法、装置、设备以及存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可用于OCR等场景。具体实现方案为:获取第一图像,所述第一图像中包括N种类型的字符;在第一图像中确定出多个子图像,并确定各子图像的字符类型,每个子图像中包括一种类型的字符;针对每个子图像,通过所述字符类型对应的字符识别模型对所述子图像进行字符识别处理,得到所述子图像对应的字符集合,所述字符集合中包括至少一个字符;根据所述多个子图像各自对应的字符集合,确定所述第一图像对应的文本信息。本公开方案能够提高文本识别结果的准确性。
-
公开(公告)号:CN114359932A
公开(公告)日:2022-04-15
申请号:CN202210028960.3
申请日:2022-01-11
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种文本检测方法、文本识别方法及装置,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于光学字符识别等场景,文本检测方法为:获取待识别图像中文本条的图像特征,对待识别图像进行视觉增强处理,得到待识别图像的增强特征图,对文本条的图像特征与增强特征图进行相似性比对,得到在增强特征图上的文本条的目标包围盒。增强特征图从更多的维度对待识别图像的特征进行表征,使得确定出的包围盒具有较高的准确性和可靠性,且通过从文本条的包围盒和增强特征图的相似性比对确定文本条的包围盒,可以避免包围盒与文本条之间不匹配,使得包围盒具有较强的可靠性。
-
-
-
-
-
-
-
-
-