-
公开(公告)号:CN111695518A
公开(公告)日:2020-09-22
申请号:CN202010538181.9
申请日:2020-06-12
Applicant: 北京百度网讯科技有限公司
IPC: G06K9/00 , G06K9/62 , G06F40/186 , G06F40/30
Abstract: 本申请公开了结构化文档信息标注的方法、装置及电子设备,涉及人工智能领域、深度学习领域以及大数据领域。具体实现方案为:获取结构化文档的模板图像以及所述模板图像的至少一个待填充字段的标注信息,所述标注信息包括所述待填充字段的属性值、历史内容以及所述待填充字段在所述模板图像中的历史位置。根据所述待填充字段的属性值、所述待填充字段的历史内容以及所述待填充字段在模板图像中的历史位置,生成所述待填充字段的目标填充信息。根据所述待填充字段的目标填充信息,得到标注的结构化文档的图像。该方法能够实现结构化文档的快速准确的标注。
-
公开(公告)号:CN111695518B
公开(公告)日:2023-09-29
申请号:CN202010538181.9
申请日:2020-06-12
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/40 , G06V30/19 , G06F40/186 , G06F40/30
Abstract: 本申请公开了结构化文档信息标注的方法、装置及电子设备,涉及人工智能领域、深度学习领域以及大数据领域。具体实现方案为:获取结构化文档的模板图像以及所述模板图像的至少一个待填充字段的标注信息,所述标注信息包括所述待填充字段的属性值、历史内容以及所述待填充字段在所述模板图像中的历史位置。根据所述待填充字段的属性值、所述待填充字段的历史内容以及所述待填充字段在模板图像中的历史位置,生成所述待填充字段的目标填充信息。根据所述待填充字段的目标填充信息,得到标注的结构化文档的图像。该方法能够实现结构化文档的快速准确的标注。
-
公开(公告)号:CN111680628B
公开(公告)日:2023-04-28
申请号:CN202010518207.3
申请日:2020-06-09
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请实施例公开了文字框融合方法、装置、设备以及存储介质,涉及深度学习、文字检测技术领域。该方法的一具体实施方式包括:获取待融合文字候选框;计算待融合文字候选框的特征点与四角点的归一化距离,作为待融合文字候选框的初始化权重;基于待融合文字候选框的初始化权重融合待融合文字候选框,得到融合文字候选框。该实施方式采用特征点与四角点的归一化距离作为权重,以融合文字候选框,能够为每个角点分配不同的权重值,显著提升了对长文字行的融合效果。
-
公开(公告)号:CN111695517A
公开(公告)日:2020-09-22
申请号:CN202010538176.8
申请日:2020-06-12
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请实施例公开了一种图像的表格提取方法、装置、电子设备、存储介质及表格提取模型的训练方法,涉及人工智能和云计算技术领域,包括:获取待处理图像,根据表格提取模型,生成待处理图像的表格,其中,表格提取模型为根据样本图像的字段位置特征、图像特征及文本特征得到的,将待处理图像的文本信息填入至表格,一方面,通过字段位置特征,可以确定各字段在位置上的关联关系,可以适用于至少部分虚线框表格的图像,实现了提高表格识别的灵活性和广泛性的技术效果;另一方面,由于充分考虑了字段位置特征、图像特征及文本特征,即通过对待处理图像从多个维度进行分析,得到多个维度的特征,从而可以提高表格识别的准确性和可靠性的技术效果。
-
公开(公告)号:CN109902152A
公开(公告)日:2019-06-18
申请号:CN201910217161.9
申请日:2019-03-21
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请实施例公开了用于检索信息的方法和装置。该方法的一具体实施方式包括:获取待检索文本;对待检索文本进行分析,生成关键词集合;从关键词集合中筛选物品名称词集合和物品特征词集合;从物品名称词集合和物品特征词集合中确定检索词;基于检索词进行检索,得到检索词关联的物品的信息。该实施方式提高了信息检索的效率。
-
公开(公告)号:CN111626027B
公开(公告)日:2023-03-24
申请号:CN202010432633.5
申请日:2020-05-20
Applicant: 北京百度网讯科技有限公司
IPC: G06F40/18 , G06V30/412 , G06V30/14 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种表格结构还原方法、装置、设备、系统和可读存储介质,涉及计算机视觉技术领域。具体实现方案为:获取目标图像,所述目标图像显示有待还原表格;提取所述目标图像的特征图;根据所述特征图,识别所述目标图像中每个像素点相对于表格结构的相对位置关系,根据所述相对位置关系还原所述待还原表格的表格结构。本申请实施例可以提高表格结构还原的可用性和泛化能力。
-
公开(公告)号:CN111626027A
公开(公告)日:2020-09-04
申请号:CN202010432633.5
申请日:2020-05-20
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种表格结构还原方法、装置、设备、系统和可读存储介质,涉及计算机视觉技术领域。具体实现方案为:获取目标图像,所述目标图像显示有待还原表格;提取所述目标图像的特征图;根据所述特征图,识别所述目标图像中每个像素点相对于表格结构的相对位置关系,根据所述相对位置关系还原所述待还原表格的表格结构。本申请实施例可以提高表格结构还原的可用性和泛化能力。
-
公开(公告)号:CN111611990A
公开(公告)日:2020-09-01
申请号:CN202010444345.1
申请日:2020-05-22
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请实施例公开了用于识别图像中表格的方法和装置,可用于图像处理技术领域。具体实现方案为:获取待处理图片;识别待处理图片包括的字段名和字段值;获取字段名的语义向量和字段值的语义向量;基于字段名的语义向量和字段值的语义向量与预先训练的匹配模型,确定字段名和字段值的匹配关系;根据字段名和字段值的匹配关系生成表格。该实施方式提高了识别图像中表格的效率。
-
公开(公告)号:CN110287910A
公开(公告)日:2019-09-27
申请号:CN201910575809.X
申请日:2019-06-28
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开的实施例公开了用于获取信息的方法及装置,涉及云计算领域。该方法的一具体实施方式包括:对待处理文字信息进行文字匹配,从上述待处理文字信息中筛选出待修正词条;查询与上述待修正词条对应的基准词条,将上述待修正词条和基准词条中的差别文字构成至少一个文字组;将上述文字组导入文字相似度计算模型,得到上述文字组的相似度;响应于相似度大于设定阈值,将上述待处理文字信息中的待修正词条替换为上述基准词条,得到对应上述待处理文字信息的目标文字信息。该实施方式提高了获取目标文字信息的准确性。
-
公开(公告)号:CN111611990B
公开(公告)日:2023-10-31
申请号:CN202010444345.1
申请日:2020-05-22
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/14 , G06V30/148 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/08
Abstract: 本申请实施例公开了用于识别图像中表格的方法和装置,可用于图像处理技术领域。具体实现方案为:获取待处理图片;识别待处理图片包括的字段名和字段值;获取字段名的语义向量和字段值的语义向量;基于字段名的语义向量和字段值的语义向量与预先训练的匹配模型,确定字段名和字段值的匹配关系;根据字段名和字段值的匹配关系生成表格。该实施方式提高了识别图像中表格的效率。
-
-
-
-
-
-
-
-
-