基于空间语义修正的水电工程文档文本矢量化转化方法
摘要:
本发公开了基于空间语义修正的水电工程文档文本矢量化转化方法,构建水电工程文档自动扫描仪器,实现纸质文档向图片格式的自动转化。构建水电工程施工文本解译数据集和基于领域知识的专业语料库DKPC,获取水电工程施工文档的文本类别以及版面背景;开发基于像素级分割的文本检测模型HC‑PSENet,引入PP‑HGNet主干网络增强模型的特征提取性能;建立基于特征增强的文本识别模型HC‑CRNN,采用ResNet主干网络和C‑CTC Loss增强模型识别字符的准确性;采用基于参数的迁移学习策略训练模型,以避免样本类间不均衡和模型过拟合的问题。最后,基于仪器和算法形成水电工程施工纸质文档的自动化解译装置,提高文本解译的智能化水平。
0/0