一种大尺寸复杂pdf工程图纸文本检测与识别方法

    公开(公告)号:CN115035541B

    公开(公告)日:2025-03-14

    申请号:CN202210735421.3

    申请日:2022-06-27

    Abstract: 本发明提供了一种大尺寸复杂pdf工程图纸文本检测与识别方法,包括以下步骤:步骤S1:预处理pdf工程图纸,生成对应的高分辨率图像;步骤S2:将高分辨率图像切割为若干低分辨率的子图,并根据位置记录子图对应顺序;步骤S3:进行第一次子图文本检测,初步定位子图中的文本区域范围,输出范围对应的位置坐标;步骤S4:将子图中的文本区域位置坐标映射到原大图中,去除其中的重复数据,并根据去重后的位置坐标获取对应文本区域图像;步骤S5:进行第二次文本检测,精确定位文本区域中的文本,并裁剪对应的文本块;步骤S6:对文本块进行文本识别,提取文本块中的文本内容,以及对应的坐标位置。本发明提供的方法提高了复杂图纸的文本识别准确率。

    核电站电子文档检索方法及装置
    2.
    发明公开

    公开(公告)号:CN116894081A

    公开(公告)日:2023-10-17

    申请号:CN202310648526.X

    申请日:2023-06-02

    Abstract: 本公开属于核电技术领域,具体涉及一种核电站电子文档检索方法及装置。本公开的核电站电子文档检索方法,通过拓扑结构图进行关联检索,可以将历史存在的施工、制造、调试、维修文档与系统拓扑结构图进行关联,用户在输入检索关键词后,可以根据所述关联图谱确定与所述检索关键词关联的历史文档,将与所述检索关键词关联的历史文档按照相关度由大到小的顺序,依序排列形成检索结果,由此更全面、准确地匹配检索到核电设备从制造到安装、调试、维修阶段的历史文件,同时还可以准确全面地得知该设备与其余设备之间存在的联动风险,可以有效的提高后续运行维护的安全性,可以确保设备运行的稳定性。

    一种大尺寸复杂pdf工程图纸文本检测与识别方法

    公开(公告)号:CN115035541A

    公开(公告)日:2022-09-09

    申请号:CN202210735421.3

    申请日:2022-06-27

    Abstract: 本发明提供了一种大尺寸复杂pdf工程图纸文本检测与识别方法,包括以下步骤:步骤S1:预处理pdf工程图纸,生成对应的高分辨率图像;步骤S2:将高分辨率图像切割为若干低分辨率的子图,并根据位置记录子图对应顺序;步骤S3:进行第一次子图文本检测,初步定位子图中的文本区域范围,输出范围对应的位置坐标;步骤S4:将子图中的文本区域位置坐标映射到原大图中,去除其中的重复数据,并根据去重后的位置坐标获取对应文本区域图像;步骤S5:进行第二次文本检测,精确定位文本区域中的文本,并裁剪对应的文本块;步骤S6:对文本块进行文本识别,提取文本块中的文本内容,以及对应的坐标位置。本发明提供的方法提高了复杂图纸的文本识别准确率。

Patent Agency Ranking