-
公开(公告)号:CN115050025A
公开(公告)日:2022-09-13
申请号:CN202210459319.5
申请日:2022-04-27
Applicant: 北京邮电大学
IPC: G06V30/10 , G06V30/146 , G06V30/26 , G06F40/284
Abstract: 本发明提供一种基于公式识别的知识点抽取方法及装置,涉及计算机信息处理技术领域,该方法包括:检测目标图像中的公式,以提取目标图像中的公式区域;对所述公式区域及公式区域以外的文本区域采用OCR技术识别并整合,以得到所述目标图像对应的文本文档;在所述文本文档的公式区域的上下文中查找与公式对应的知识点,以建立公式与知识点的关联关系。本发明提高了公式关联知识点的抽取效率,即使后续需要人为校准,也很大程度地降低了人力成本。