一种图表数据的提取方法和装置
    1.
    发明公开

    公开(公告)号:CN118673175A

    公开(公告)日:2024-09-20

    申请号:CN202310274582.1

    申请日:2023-03-17

    Abstract: 本发明公开了一种图表数据的提取方法和装置。所述图表数据的提取方法,包括:对文档进行分割,得到多个段落列表;依次取出所述段落列表中的每个段落;针对取出的每个段落,执行图片提取操作或表格提取操作,获得图片数据或者表格数据;或者执行提取图片标签或表格标签的操作,以获得图片标签或表格标签;将从各段落提取的图片数据与图片标签进行匹配,得到所述图片数据及对应的图片标签;或者将提取的表格数据与表格标签进行匹配,得到表格数据及对应的表格标签。本发明实现了图片数据和表格数据的自动提取和对齐,极大地减少人工处理文档中图片、表格和对应标签的工作,提升数据的处理效率。

    一种知识融合的方法和装置
    3.
    发明公开

    公开(公告)号:CN118779460A

    公开(公告)日:2024-10-15

    申请号:CN202310369898.9

    申请日:2023-04-07

    Abstract: 本发明公开了一种知识融合的方法和装置。所述方法包括:根据第一本体的第一本体概念的描述信息和第一本体关系的路径信息、第二本体的第二本体概念的描述信息和第二本体关系的路径信息,确定两个本体的概念相似度和关系相似度;根据概念相似度和关系相似度对齐两个本体,生成包括第三本体概念的第三本体;从第一本体对应的第一实体集合中和第二本体对应的第二实体集合中,获取指向同一第三本体概念的实体,得到第三实体集合;确定第三实体集合中每两个实体的实体综合相似度,对齐实体综合相似度符合预设的实体相似条件的两个实体。能够在少量标注数据的情况下进行知识融合,并更准确地融合文本差异较大的相匹配元素,提高知识融合的准确率。

Patent Agency Ranking