-
公开(公告)号:CN115935944A
公开(公告)日:2023-04-07
申请号:CN202211002609.3
申请日:2022-08-19
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
IPC: G06F40/205 , G06F40/226 , G06F40/186 , G06F16/903 , G06F16/958
Abstract: 本发明公开一种跨平台的标准文件树形结构生成方法与展示控件。其步骤是:获取输入数据数组;遍历输入数据数组,根据每一条数据标题层级生成树形数据;将树形数据输入到控件预设数据接收接口;触发界面渲染,将所述树形数据根据层级从根节点开始,依次遍历所有子节点数据展示到页面上。本发明提供的树形控件至少应包含一个节点,渲染过程中采用懒加载机制,不必一次性将所有节点渲染完,等到监听到点击事件时才进行剩余部分的渲染。这样保证了不会因为一次渲染太多节点而导致页面阻塞。本发明适用标准文件数字化领域,用以解决标准文件关键信息提取效率低下、内容阅读体验差的缺点,具有提取准确度高、结构化清晰、渲染性能高的优点。
-
公开(公告)号:CN114842483B
公开(公告)日:2023-11-28
申请号:CN202210732053.7
申请日:2022-06-27
Applicant: 齐鲁工业大学
IPC: G06V30/19 , G06V30/10 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/084
Abstract: 本发明涉及计算机和标准化领域,本发明的基于神经网络和模板匹配的标准文件信息提取方法及系统,包括:S1.获取目标识别图片,将图片输入到ocr模型中将图片中的文字识别成包含待提取关键指标信息文本;S2.根据预先设定的标题类别选择不同的规则模板将标识唯一的信息匹配,将某一指标同类信息归类后用一个数组存储;S3.将归类后的数组结构化,形成结构化数据并存储;S4.根据所述规则模板和结构化的文本数据,将结构化后的文本数据使用一个表格组件显示。本方案将不可编辑的pdf文件数字化从而形成计算机可处理的结构化数据,实现了标准文件处理的信息化,极大减少了人工录入成本提(56)对比文件杨恒杰;闫铮;邬宗玲;方定邦;段放.基于循环神经网络的图像特定文本抽取方法.激光与光电子学进展.(24),全文.黄胜;王博博;朱菁.基于文档结构与深度学习的金融公告信息抽取.计算机工程与设计.2020,(01),全文.
-
公开(公告)号:CN114842483A
公开(公告)日:2022-08-02
申请号:CN202210732053.7
申请日:2022-06-27
Applicant: 齐鲁工业大学
Abstract: 本发明涉及计算机和标准化领域,本发明的基于神经网络和模板匹配的标准文件信息提取方法及系统,包括:S1.获取目标识别图片,将图片输入到ocr模型中将图片中的文字识别成包含待提取关键指标信息文本;S2.根据预先设定的标题类别选择不同的规则模板将标识唯一的信息匹配,将某一指标同类信息归类后用一个数组存储;S3.将归类后的数组结构化,形成结构化数据并存储;S4.根据所述规则模板和结构化的文本数据,将结构化后的文本数据使用一个表格组件显示。本方案将不可编辑的pdf文件数字化从而形成计算机可处理的结构化数据,实现了标准文件处理的信息化,极大减少了人工录入成本提高了效率。
-
-