结构化文档信息标注的方法、装置及电子设备

    公开(公告)号:CN111695518A

    公开(公告)日:2020-09-22

    申请号:CN202010538181.9

    申请日:2020-06-12

    Abstract: 本申请公开了结构化文档信息标注的方法、装置及电子设备,涉及人工智能领域、深度学习领域以及大数据领域。具体实现方案为:获取结构化文档的模板图像以及所述模板图像的至少一个待填充字段的标注信息,所述标注信息包括所述待填充字段的属性值、历史内容以及所述待填充字段在所述模板图像中的历史位置。根据所述待填充字段的属性值、所述待填充字段的历史内容以及所述待填充字段在模板图像中的历史位置,生成所述待填充字段的目标填充信息。根据所述待填充字段的目标填充信息,得到标注的结构化文档的图像。该方法能够实现结构化文档的快速准确的标注。

    结构化文档信息标注的方法、装置及电子设备

    公开(公告)号:CN111695518B

    公开(公告)日:2023-09-29

    申请号:CN202010538181.9

    申请日:2020-06-12

    Abstract: 本申请公开了结构化文档信息标注的方法、装置及电子设备,涉及人工智能领域、深度学习领域以及大数据领域。具体实现方案为:获取结构化文档的模板图像以及所述模板图像的至少一个待填充字段的标注信息,所述标注信息包括所述待填充字段的属性值、历史内容以及所述待填充字段在所述模板图像中的历史位置。根据所述待填充字段的属性值、所述待填充字段的历史内容以及所述待填充字段在模板图像中的历史位置,生成所述待填充字段的目标填充信息。根据所述待填充字段的目标填充信息,得到标注的结构化文档的图像。该方法能够实现结构化文档的快速准确的标注。

    文字框融合方法、装置、设备以及存储介质

    公开(公告)号:CN111680628B

    公开(公告)日:2023-04-28

    申请号:CN202010518207.3

    申请日:2020-06-09

    Abstract: 本申请实施例公开了文字框融合方法、装置、设备以及存储介质,涉及深度学习、文字检测技术领域。该方法的一具体实施方式包括:获取待融合文字候选框;计算待融合文字候选框的特征点与四角点的归一化距离,作为待融合文字候选框的初始化权重;基于待融合文字候选框的初始化权重融合待融合文字候选框,得到融合文字候选框。该实施方式采用特征点与四角点的归一化距离作为权重,以融合文字候选框,能够为每个角点分配不同的权重值,显著提升了对长文字行的融合效果。

    图像的表格提取方法、装置、电子设备及存储介质

    公开(公告)号:CN111695517A

    公开(公告)日:2020-09-22

    申请号:CN202010538176.8

    申请日:2020-06-12

    Abstract: 本申请实施例公开了一种图像的表格提取方法、装置、电子设备、存储介质及表格提取模型的训练方法,涉及人工智能和云计算技术领域,包括:获取待处理图像,根据表格提取模型,生成待处理图像的表格,其中,表格提取模型为根据样本图像的字段位置特征、图像特征及文本特征得到的,将待处理图像的文本信息填入至表格,一方面,通过字段位置特征,可以确定各字段在位置上的关联关系,可以适用于至少部分虚线框表格的图像,实现了提高表格识别的灵活性和广泛性的技术效果;另一方面,由于充分考虑了字段位置特征、图像特征及文本特征,即通过对待处理图像从多个维度进行分析,得到多个维度的特征,从而可以提高表格识别的准确性和可靠性的技术效果。

    用于获取信息的方法及装置
    9.
    发明公开

    公开(公告)号:CN110287910A

    公开(公告)日:2019-09-27

    申请号:CN201910575809.X

    申请日:2019-06-28

    Abstract: 本公开的实施例公开了用于获取信息的方法及装置,涉及云计算领域。该方法的一具体实施方式包括:对待处理文字信息进行文字匹配,从上述待处理文字信息中筛选出待修正词条;查询与上述待修正词条对应的基准词条,将上述待修正词条和基准词条中的差别文字构成至少一个文字组;将上述文字组导入文字相似度计算模型,得到上述文字组的相似度;响应于相似度大于设定阈值,将上述待处理文字信息中的待修正词条替换为上述基准词条,得到对应上述待处理文字信息的目标文字信息。该实施方式提高了获取目标文字信息的准确性。

Patent Agency Ranking