一种大尺寸复杂pdf工程图纸文本检测与识别方法

    公开(公告)号:CN115035541B

    公开(公告)日:2025-03-14

    申请号:CN202210735421.3

    申请日:2022-06-27

    Abstract: 本发明提供了一种大尺寸复杂pdf工程图纸文本检测与识别方法,包括以下步骤:步骤S1:预处理pdf工程图纸,生成对应的高分辨率图像;步骤S2:将高分辨率图像切割为若干低分辨率的子图,并根据位置记录子图对应顺序;步骤S3:进行第一次子图文本检测,初步定位子图中的文本区域范围,输出范围对应的位置坐标;步骤S4:将子图中的文本区域位置坐标映射到原大图中,去除其中的重复数据,并根据去重后的位置坐标获取对应文本区域图像;步骤S5:进行第二次文本检测,精确定位文本区域中的文本,并裁剪对应的文本块;步骤S6:对文本块进行文本识别,提取文本块中的文本内容,以及对应的坐标位置。本发明提供的方法提高了复杂图纸的文本识别准确率。

    核电站数据清洗方法及装置
    4.
    发明公开

    公开(公告)号:CN115495444A

    公开(公告)日:2022-12-20

    申请号:CN202210719803.7

    申请日:2022-06-23

    Abstract: 本公开属于核电技术领域,具体涉及一种核电站数据清洗方法及装置。本公开主要依托各业务对象的数据标准,并通过给各生产业务对象属性配置数据清洗规则,以实现在对相关的生产业务对象数据采集时,按配置的规则进行数据清洗。在本公开提供的技术方案中,提供多种多样的数据清洗规则,规则支持自定义拓展,可根据自身业务诉求,进行自定义数据清洗规则拓展,灵活地满足核电厂数据相关人员不同的数据清洗需求。此外,本公开可与生产业务对象数据标准进行交互,保证数据的标准性、准确性、一致性。

    一种大尺寸复杂pdf工程图纸文本检测与识别方法

    公开(公告)号:CN115035541A

    公开(公告)日:2022-09-09

    申请号:CN202210735421.3

    申请日:2022-06-27

    Abstract: 本发明提供了一种大尺寸复杂pdf工程图纸文本检测与识别方法,包括以下步骤:步骤S1:预处理pdf工程图纸,生成对应的高分辨率图像;步骤S2:将高分辨率图像切割为若干低分辨率的子图,并根据位置记录子图对应顺序;步骤S3:进行第一次子图文本检测,初步定位子图中的文本区域范围,输出范围对应的位置坐标;步骤S4:将子图中的文本区域位置坐标映射到原大图中,去除其中的重复数据,并根据去重后的位置坐标获取对应文本区域图像;步骤S5:进行第二次文本检测,精确定位文本区域中的文本,并裁剪对应的文本块;步骤S6:对文本块进行文本识别,提取文本块中的文本内容,以及对应的坐标位置。本发明提供的方法提高了复杂图纸的文本识别准确率。

Patent Agency Ranking