-
公开(公告)号:CN119418356A
公开(公告)日:2025-02-11
申请号:CN202411264810.8
申请日:2024-09-10
Applicant: 中国长江电力股份有限公司
IPC: G06V30/412 , G06V30/42 , G06V30/413 , G06V30/148
Abstract: 本发明公开了一种PDF文档提取处理文本数据的方法,包括文字处理,将PDF文档中文字对象的数据内容分为字符、纸张坐标和打印大小三种属性,根据三种属性区分处理从而获取到文字在文章中的规范数据;从PDF文档中提取出文字对象,提出坐标在表格范围区域的文字后,按序存入文字对象集合;进行表格处理,将PDF文档中表格的数据内容分为表格结构对象、纸张坐标和打印大小,表格结构对象划分为单元格文字、单元格大小和行列位置;提取出每一页中的表格对象,按序存入表格对象集合;解决了现有技术的标书PDF文档中表格和文字提取不准确,表格跨页时无法准确识别的问题,可对常见公告、论文、方案类PDF文档进行处理,还原出准确的文章结构数据。
-
公开(公告)号:CN119418340A
公开(公告)日:2025-02-11
申请号:CN202411264812.7
申请日:2024-09-10
Applicant: 中国长江电力股份有限公司
IPC: G06V30/148 , G06V30/42 , G06V30/413
Abstract: 本发明公开了一种基于OCR引擎的标书文档标题结构抽取方法,包括将pdf格式的标书文件转换为图像文件;利用OCR识别对标书图像文件进行文本内容识别;根据OCR识别结果的文本块位置信息整理标书文字识别结果,获取标书文本内容;对标书文本段落内容进行标题结构抽取;利用页眉页脚规则和标题特征对标题段落进行优化;该方法解决了现有技术效率较低,人工依赖性较强的问题,能够快速、准确地提取文档的标题信息,提高了标题抽取的效率和准确性,适用于各种类型的文档。
-
公开(公告)号:CN214427772U
公开(公告)日:2021-10-19
申请号:CN202120415482.2
申请日:2021-02-25
Applicant: 中国长江电力股份有限公司
IPC: G05B17/02
Abstract: 一种水轮机调速器液压系统仿真装置,仿真控制器与人机界面通讯连接,仿真控制器与液压控制柜电连接,仿真控制器接收液压控制柜的输出信号并对液压系统的阀体动作、压力/油位动态控制进行仿真模拟,仿真模拟后的计算结果输出至液压控制柜进行实际控制信号输出。通过在仿真控制器内对水轮机调速器液压系统的阀体和系统压力/油位进行仿真模拟,并输出相应信号与液压控制柜进行交互,液压仿真装置采用触摸屏智能控制和智能显示,可以通过触摸屏查看液压系统的液压、液位、泵的运行情况、流量监视以及阀的开度等相关数据,也可通过触摸屏对液压控制系统实施故障模拟,完全仿真现场液压系统的动作情况。
-
-