一种大尺寸复杂pdf工程图纸文本检测与识别方法

    公开(公告)号:CN115035541B

    公开(公告)日:2025-03-14

    申请号:CN202210735421.3

    申请日:2022-06-27

    Abstract: 本发明提供了一种大尺寸复杂pdf工程图纸文本检测与识别方法,包括以下步骤:步骤S1:预处理pdf工程图纸,生成对应的高分辨率图像;步骤S2:将高分辨率图像切割为若干低分辨率的子图,并根据位置记录子图对应顺序;步骤S3:进行第一次子图文本检测,初步定位子图中的文本区域范围,输出范围对应的位置坐标;步骤S4:将子图中的文本区域位置坐标映射到原大图中,去除其中的重复数据,并根据去重后的位置坐标获取对应文本区域图像;步骤S5:进行第二次文本检测,精确定位文本区域中的文本,并裁剪对应的文本块;步骤S6:对文本块进行文本识别,提取文本块中的文本内容,以及对应的坐标位置。本发明提供的方法提高了复杂图纸的文本识别准确率。

    核电站数据清洗方法及装置
    2.
    发明公开

    公开(公告)号:CN115495444A

    公开(公告)日:2022-12-20

    申请号:CN202210719803.7

    申请日:2022-06-23

    Abstract: 本公开属于核电技术领域,具体涉及一种核电站数据清洗方法及装置。本公开主要依托各业务对象的数据标准,并通过给各生产业务对象属性配置数据清洗规则,以实现在对相关的生产业务对象数据采集时,按配置的规则进行数据清洗。在本公开提供的技术方案中,提供多种多样的数据清洗规则,规则支持自定义拓展,可根据自身业务诉求,进行自定义数据清洗规则拓展,灵活地满足核电厂数据相关人员不同的数据清洗需求。此外,本公开可与生产业务对象数据标准进行交互,保证数据的标准性、准确性、一致性。

    绘图方法及装置
    3.
    发明公开

    公开(公告)号:CN114972582A

    公开(公告)日:2022-08-30

    申请号:CN202210749191.6

    申请日:2022-06-28

    Abstract: 本公开属于核电技术领域,具体涉及一种绘图方法及装置。本公开根据不同业务标准预设的数据实体在绘图上的展示样式,从而使用被选择的标准模板初始化所述绘图多个标准模板,标准模板为根据业务标准预设的数据实体在绘图上的展示样式同时在初始化绘图时,从而内置核电厂对概念数据模型的样式要求,减少人员的绘图学习及使用成本。此外,使用本公开的方法可以图形化方法进行表达,提供可视化编辑界面,可直观的表达核电厂业务数据之间的逻辑关系,方便供核电厂的进一步数字化应用。

    一种文档字符串编码模糊匹配方法

    公开(公告)号:CN115964457A

    公开(公告)日:2023-04-14

    申请号:CN202111192730.2

    申请日:2021-10-13

    Abstract: 本发明涉及数据处理技术领域,具体公开了一种文档字符串编码模糊匹配方法。该方法包括:构建带有标签的字符串编码信息库;获取文档字符串编码信息,对其进行预处理和特征选择,形成特征集合;对所述特征集合中的特征项进行特征提取,构建编码向量;构建支持向量机分类器,通过所述编码向量对支持向量机进行训练并获得文档编码的分类结果标签;对文档字符串进行模糊匹配时,对所查询的字符串进行划分并添加索引;在字符串编码查询时,进行字符串编码长度过滤及匹配过滤,将所述字符串添加到结果合集中。该方法能够提高文本分类效率和分类准确精度,且能够反映不同长度段落对匹配结果不影响的差异,同时编辑距离验证操作次数较少。

    核电厂电子工作包执行方法及装置

    公开(公告)号:CN114169849A

    公开(公告)日:2022-03-11

    申请号:CN202111389650.6

    申请日:2021-11-22

    Abstract: 本公开属于核电技术领域,具体涉及一种核电厂电子工作包执行方法及装置。本公开的方法包括接收登录账户对应的工单任务的电子工作包信息,所述电子工作包信息用于描述所述工单任务;在所述账户的用户界面中展示所述工单任务的电子工作包信息;在检测到所述用户界面展示的需要被确认的电子工作包信息被执行用于表示确认的触发操作的情况下,在所述用户界面展示用于描述所述工单任务被确认和/或执行的信息。避免了重复性数据登记输入,便于工作人员快速查找所需的参考文件、图纸、视频资料和提出工作指令、质量计划等修改申请,避免工作文件损坏遗失等问题。确保现场工作顺利执行,文件归档不受影响。

    字符串匹配方法及装置
    8.
    发明授权

    公开(公告)号:CN114168807B

    公开(公告)日:2025-03-14

    申请号:CN202111387749.2

    申请日:2021-11-22

    Abstract: 本公开属于核电技术领域,具体涉及一种字符串匹配方法及装置。本公开中,在每读取一页文档的情况下,判断该页文档全部字符在位图对应位的范围内目标数值的个数是否符合所述特定字符串字符的个数,在判断该页文档全部字符在位图对应位的范围内目标数值的个数符合所述特定字符串字符的个数时,根据位图对应位值为目标数值的字符在该页文档中出现的位置,判断该页文档中是否存在特定字符串,本公开运用位图算法的思想,使计算机能够进行快速匹配的同时消耗较小的内存。此外,本公开设计将位图与对应的键值对键值对集合结合起来,达到实现特定字符串匹配的目的。

    绘图方法及装置
    9.
    发明授权

    公开(公告)号:CN114972582B

    公开(公告)日:2024-07-16

    申请号:CN202210749191.6

    申请日:2022-06-28

    Abstract: 本公开属于核电技术领域,具体涉及一种绘图方法及装置。本公开根据不同业务标准预设的数据实体在绘图上的展示样式,从而使用被选择的标准模板初始化所述绘图多个标准模板,标准模板为根据业务标准预设的数据实体在绘图上的展示样式同时在初始化绘图时,从而内置核电厂对概念数据模型的样式要求,减少人员的绘图学习及使用成本。此外,使用本公开的方法可以图形化方法进行表达,提供可视化编辑界面,可直观的表达核电厂业务数据之间的逻辑关系,方便供核电厂的进一步数字化应用。

    一种大尺寸复杂pdf工程图纸文本检测与识别方法

    公开(公告)号:CN115035541A

    公开(公告)日:2022-09-09

    申请号:CN202210735421.3

    申请日:2022-06-27

    Abstract: 本发明提供了一种大尺寸复杂pdf工程图纸文本检测与识别方法,包括以下步骤:步骤S1:预处理pdf工程图纸,生成对应的高分辨率图像;步骤S2:将高分辨率图像切割为若干低分辨率的子图,并根据位置记录子图对应顺序;步骤S3:进行第一次子图文本检测,初步定位子图中的文本区域范围,输出范围对应的位置坐标;步骤S4:将子图中的文本区域位置坐标映射到原大图中,去除其中的重复数据,并根据去重后的位置坐标获取对应文本区域图像;步骤S5:进行第二次文本检测,精确定位文本区域中的文本,并裁剪对应的文本块;步骤S6:对文本块进行文本识别,提取文本块中的文本内容,以及对应的坐标位置。本发明提供的方法提高了复杂图纸的文本识别准确率。

Patent Agency Ranking