发明公开
- 专利标题: 基于空间语义修正的水电工程文档文本矢量化转化方法
-
申请号: CN202410648421.9申请日: 2024-05-23
-
公开(公告)号: CN118675178A公开(公告)日: 2024-09-20
- 发明人: 邓旭方 , 李文伟 , 李明超 , 黄家志 , 陈正虎 , 李新宇 , 吕沅庚 , 田丹 , 张思佳 , 刘乐平 , 任秋兵 , 钟恒 , 郭昊旻 , 邓伦 , 吴辉特
- 申请人: 中国长江电力股份有限公司 , 中国长江三峡集团有限公司 , 天津大学
- 申请人地址: 湖北省武汉市江岸区三阳路88号三阳中心; ;
- 专利权人: 中国长江电力股份有限公司,中国长江三峡集团有限公司,天津大学
- 当前专利权人: 中国长江电力股份有限公司,中国长江三峡集团有限公司,天津大学
- 当前专利权人地址: 湖北省武汉市江岸区三阳路88号三阳中心; ;
- 代理机构: 宜昌市三峡专利事务所
- 代理商 李登桥
- 主分类号: G06V30/142
- IPC分类号: G06V30/142 ; G06V30/18 ; G06V30/19 ; G06V30/41 ; G06V10/82
摘要:
本发公开了基于空间语义修正的水电工程文档文本矢量化转化方法,构建水电工程文档自动扫描仪器,实现纸质文档向图片格式的自动转化。构建水电工程施工文本解译数据集和基于领域知识的专业语料库DKPC,获取水电工程施工文档的文本类别以及版面背景;开发基于像素级分割的文本检测模型HC‑PSENet,引入PP‑HGNet主干网络增强模型的特征提取性能;建立基于特征增强的文本识别模型HC‑CRNN,采用ResNet主干网络和C‑CTC Loss增强模型识别字符的准确性;采用基于参数的迁移学习策略训练模型,以避免样本类间不均衡和模型过拟合的问题。最后,基于仪器和算法形成水电工程施工纸质文档的自动化解译装置,提高文本解译的智能化水平。