文档识别方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN118865424A

    公开(公告)日:2024-10-29

    申请号:CN202410894080.3

    申请日:2024-07-04

    摘要: 本申请公开了一种文档识别方法、装置、设备、存储介质及程序产品,涉及图像处理技术领域,公开的文档识别方法,包括:获取待识别文档图像;利用目标检测模型,提取待识别文档图像中文档元素的第一布局信息和/或表格元素的第二布局信息;根据第一布局信息和/或第二布局信息,对待识别文档图像进行区域划分,获得至少一个元素分区;从至少一个元素分区中,识别待识别文档图像中的文字内容。本申请解决了文档识别方法基于预定义的解析规则和模板来匹配文档元素,准确性低的技术问题,提高了文档识别方法的准确性。

    信息检索方法、设备、存储介质以及计算机程序产品

    公开(公告)号:CN118939763A

    公开(公告)日:2024-11-12

    申请号:CN202410929042.7

    申请日:2024-07-11

    摘要: 本申请公开了一种信息检索方法、设备、存储介质以及计算机程序产品,涉及智能问答技术领域,方法通过基于预先获取的专业知识文档生成本地向量知识库;响应于随机复杂信息的输入,通过意图识别模型对所述随机复杂信息进行意图解析,得到关键意图信息;根据所述关键意图信息确定主题查询模式;根据所述主题查询模式调用目标信息检索接口,在所述本地向量知识库中对目标知识库进行检索,得到目标检索信息集,通过上述方案,具体通过构建本地向量知识库,并解析出输入的复杂信息的意图,直接根据意图分类调用目标信息接口检索对应知识库,获取目标检索信息集,提高了信息检索的准确度和效率。