-
公开(公告)号:CN111695518A
公开(公告)日:2020-09-22
申请号:CN202010538181.9
申请日:2020-06-12
Applicant: 北京百度网讯科技有限公司
IPC: G06K9/00 , G06K9/62 , G06F40/186 , G06F40/30
Abstract: 本申请公开了结构化文档信息标注的方法、装置及电子设备,涉及人工智能领域、深度学习领域以及大数据领域。具体实现方案为:获取结构化文档的模板图像以及所述模板图像的至少一个待填充字段的标注信息,所述标注信息包括所述待填充字段的属性值、历史内容以及所述待填充字段在所述模板图像中的历史位置。根据所述待填充字段的属性值、所述待填充字段的历史内容以及所述待填充字段在模板图像中的历史位置,生成所述待填充字段的目标填充信息。根据所述待填充字段的目标填充信息,得到标注的结构化文档的图像。该方法能够实现结构化文档的快速准确的标注。
-
公开(公告)号:CN111695518B
公开(公告)日:2023-09-29
申请号:CN202010538181.9
申请日:2020-06-12
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/40 , G06V30/19 , G06F40/186 , G06F40/30
Abstract: 本申请公开了结构化文档信息标注的方法、装置及电子设备,涉及人工智能领域、深度学习领域以及大数据领域。具体实现方案为:获取结构化文档的模板图像以及所述模板图像的至少一个待填充字段的标注信息,所述标注信息包括所述待填充字段的属性值、历史内容以及所述待填充字段在所述模板图像中的历史位置。根据所述待填充字段的属性值、所述待填充字段的历史内容以及所述待填充字段在模板图像中的历史位置,生成所述待填充字段的目标填充信息。根据所述待填充字段的目标填充信息,得到标注的结构化文档的图像。该方法能够实现结构化文档的快速准确的标注。
-
公开(公告)号:CN111680628B
公开(公告)日:2023-04-28
申请号:CN202010518207.3
申请日:2020-06-09
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请实施例公开了文字框融合方法、装置、设备以及存储介质,涉及深度学习、文字检测技术领域。该方法的一具体实施方式包括:获取待融合文字候选框;计算待融合文字候选框的特征点与四角点的归一化距离,作为待融合文字候选框的初始化权重;基于待融合文字候选框的初始化权重融合待融合文字候选框,得到融合文字候选框。该实施方式采用特征点与四角点的归一化距离作为权重,以融合文字候选框,能够为每个角点分配不同的权重值,显著提升了对长文字行的融合效果。
-
公开(公告)号:CN113627350A
公开(公告)日:2021-11-09
申请号:CN202110923843.9
申请日:2021-08-12
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种表格检测方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及深度学习、大数据等领域。具体实现方案为:获取待处理图像;将待处理图像输入预先训练好的深度学习模型,通过深度学习模型输出全表检测分支结果、列检测分支结果和表头检测分支结果;全表检测分支结果表示针对待处理图像中全表的检测结果,列检测分支结果表示针对待处理图像中表格中列的检测结果,表头检测分支结果表示针对待处理图像中表头的检测结果;基于全表检测分支结果、列检测分支结果和表头检测分支结果,得到待处理图像中表格的检测结果。本公开实施例提供的表格检测方法、装置、设备以及存储介质,能够提高表格检测的准确性。
-
公开(公告)号:CN111695517A
公开(公告)日:2020-09-22
申请号:CN202010538176.8
申请日:2020-06-12
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请实施例公开了一种图像的表格提取方法、装置、电子设备、存储介质及表格提取模型的训练方法,涉及人工智能和云计算技术领域,包括:获取待处理图像,根据表格提取模型,生成待处理图像的表格,其中,表格提取模型为根据样本图像的字段位置特征、图像特征及文本特征得到的,将待处理图像的文本信息填入至表格,一方面,通过字段位置特征,可以确定各字段在位置上的关联关系,可以适用于至少部分虚线框表格的图像,实现了提高表格识别的灵活性和广泛性的技术效果;另一方面,由于充分考虑了字段位置特征、图像特征及文本特征,即通过对待处理图像从多个维度进行分析,得到多个维度的特征,从而可以提高表格识别的准确性和可靠性的技术效果。
-
公开(公告)号:CN119580058A
公开(公告)日:2025-03-07
申请号:CN202411464285.4
申请日:2024-10-18
Applicant: 北京百度网讯科技有限公司
Inventor: 李乔伊
IPC: G06V10/82 , G06V30/148 , G06N3/0455 , G06N3/0985
Abstract: 本公开提供了一种文本识别模型的训练方法、使用方法、装置、设备及介质。涉及图像处理、文本识别、以及人工智能等技术领域。具体实现方案为:获取训练数据组,所述训练数据组中包括训练文本图片和对应的标注文本信息;获取掩码概率,所述掩码概率用于标识对所述标注文本信息的文本编码特征进行随机掩码的概率;基于所述掩码概率以及所述训练数据组中的训练文本图片和所述标注文本信息,对文本识别模型进行训练;所述文本识别模型包括图片编码器、文本编码器和解码器。本公开的技术,能够有效地提高训练得到的文本识别模型的准确性。
-
公开(公告)号:CN111626027B
公开(公告)日:2023-03-24
申请号:CN202010432633.5
申请日:2020-05-20
Applicant: 北京百度网讯科技有限公司
IPC: G06F40/18 , G06V30/412 , G06V30/14 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种表格结构还原方法、装置、设备、系统和可读存储介质,涉及计算机视觉技术领域。具体实现方案为:获取目标图像,所述目标图像显示有待还原表格;提取所述目标图像的特征图;根据所述特征图,识别所述目标图像中每个像素点相对于表格结构的相对位置关系,根据所述相对位置关系还原所述待还原表格的表格结构。本申请实施例可以提高表格结构还原的可用性和泛化能力。
-
公开(公告)号:CN111626027A
公开(公告)日:2020-09-04
申请号:CN202010432633.5
申请日:2020-05-20
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种表格结构还原方法、装置、设备、系统和可读存储介质,涉及计算机视觉技术领域。具体实现方案为:获取目标图像,所述目标图像显示有待还原表格;提取所述目标图像的特征图;根据所述特征图,识别所述目标图像中每个像素点相对于表格结构的相对位置关系,根据所述相对位置关系还原所述待还原表格的表格结构。本申请实施例可以提高表格结构还原的可用性和泛化能力。
-
公开(公告)号:CN113627350B
公开(公告)日:2022-08-02
申请号:CN202110923843.9
申请日:2021-08-12
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/40 , G06V30/148 , G06N20/00
Abstract: 本公开提供了一种表格检测方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及深度学习、大数据等领域。具体实现方案为:获取待处理图像;将待处理图像输入预先训练好的深度学习模型,通过深度学习模型输出全表检测分支结果、列检测分支结果和表头检测分支结果;全表检测分支结果表示针对待处理图像中全表的检测结果,列检测分支结果表示针对待处理图像中表格中列的检测结果,表头检测分支结果表示针对待处理图像中表头的检测结果;基于全表检测分支结果、列检测分支结果和表头检测分支结果,得到待处理图像中表格的检测结果。本公开实施例提供的表格检测方法、装置、设备以及存储介质,能够提高表格检测的准确性。
-
公开(公告)号:CN113643260A
公开(公告)日:2021-11-12
申请号:CN202110930170.X
申请日:2021-08-13
Applicant: 北京百度网讯科技有限公司
IPC: G06T7/00
Abstract: 本公开提供了用于检测图像质量的方法、装置、设备、介质和产品,涉及涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图形处理和图像识别等场景下。具体实现方案为:获取目标图像;确定与目标图像对应的至少一个模型;基于目标图像和至少一个模型,确定目标图像对应的图像参数;图像参数至少包括以下一项:清晰度参数、完整性参数、类型参数;基于图像参数,确定目标图像的图像质量结果。本实现方式可以提高图像质量检测效率。
-
-
-
-
-
-
-
-
-