-
公开(公告)号:CN112560859A
公开(公告)日:2021-03-26
申请号:CN202011316963.4
申请日:2020-11-20
Applicant: 中电鸿信信息科技有限公司
IPC: G06K9/34 , G06F40/295 , G06K9/32 , G06K9/38 , G06K9/40
Abstract: 本发明提供了基于机器视觉及自然语言处理的智能学历信息提取方法,包括以下步骤:一:获取学历证书的图像文件,对图像进行自适应阈值的二值化;二:确定二值化后的图像的倾斜角度,对原RGB图像进行初步校正;三:对校正后的图像中的边缘进行裁切,从图像中将图像四周的边缘切除;四:根据检测的文字角度对原始图像进行旋转,并对图像进行小角度微调;五:使用深度残差网络对学历证书进行分类,区分是否为学历证书影像;六:对学历证书图像中的文字进行检测,进行一行中多子行字段融合;并对检测区域进行识别;七:对识别结果使用NLP模型进行命名实体识别;八:对已识别的字段进行类别优化及字典优化。本发明分类速度快,信息提取准确率高。
-
公开(公告)号:CN119862868A
公开(公告)日:2025-04-22
申请号:CN202411721135.7
申请日:2024-11-28
Applicant: 中电鸿信信息科技有限公司
IPC: G06F40/186 , G06F40/205 , G06F40/16
Abstract: 本发明提供了一种基于流程模板的财务RPA规则生成方法、装置、设备及存储介质,涉及计算机技术领域。该方法包括:基于一个预定的流程模板,构建财务场景下的任务数据;将任务数据分类为任务逻辑提取任务和动作逻辑提取任务,利用文本解析模型解析任务内容,输出解析结果;对解析结果进行二次调整,利用二次调整后的解析结果迭代优化文本解析模型;从经过二次调整后的解析结果中提取出财务RPA规则,将财务RPA规则构建为可自动执行的工作流;后续直接调用该工作流完成财务RPA应用。本发明在传统规则库的基础上,结合财务实际业务需求,增加语义理解、规则解析、拼接等能力,实现财务稽核要求的快速入库与应用。
-
公开(公告)号:CN117851592A
公开(公告)日:2024-04-09
申请号:CN202311778387.9
申请日:2023-12-22
Applicant: 中电鸿信信息科技有限公司
IPC: G06F16/35 , G06F16/33 , G06F16/332 , G06F40/30 , G06F18/2431 , G06F18/2415 , G06N3/0442 , G06N3/049 , G06N3/084
Abstract: 本发明公开了一种基于任务导向的自适应多重网络文本解析方法,包括:收集相关的文本文档的待解析文本,并将待解析内容根据算数任务、关系任务和逻辑任务的类型进行标注,输出待解析文本相对应的文本‑任务标签对,并将所得的文本‑任务标签对划分为训练文本集和验证集;构建任务分类模型进行预测,输出待解析文本对应的任务标签;使用元网络提取模型提取元数据对;通过自适应反馈优化元网络内元数据对的置信度,输出最终元数据对;根据任务标签,循环遍历任务提取模型,并融合输出。本发明通过算数、关系、逻辑运算三种分类模型,将文本需求拆分为算数、关系与逻辑任务,利用三种网络信息融合的方法对文本进行任务分类与解析,提高了解析效率。
-
公开(公告)号:CN117648093A
公开(公告)日:2024-03-05
申请号:CN202311830148.3
申请日:2023-12-28
Applicant: 中电鸿信信息科技有限公司
Abstract: 本发明公开了一种基于大模型和自定制需求模板的RPA流程自动化生成方法,包括如下步骤:基于人机协同标注方式,对文档解析大模型和代码生成大模型进行训练;之后,利用训练好的文档解析大模型,进行自定制需求模板生成;再基于自定制需求模板和已训练的代码生成大模型,进行RPA代码生成;最后,基于生成的RPA代码,使用RPA设计器对所生成的代码进行编译,从而实现组件组的自动化生成。本发明方案通过对于大模型的有效利用,解决现有RPA组件化自动生成过程中所存在的组件操作流程图生成不准确、适用范围狭窄、难以产生高匹配的RPA组件执行代码等问题,有效的减轻了人为工作量。
-
公开(公告)号:CN114220100A
公开(公告)日:2022-03-22
申请号:CN202010916733.5
申请日:2020-09-03
Applicant: 中电鸿信信息科技有限公司
IPC: G06V30/146 , G06V30/148 , G06V30/41 , G06V30/18
Abstract: 本发明提供一种基于融合直线与深度学习的图像倾斜校正方法,首先,分析图像二值化的直线特征,其次,通过霍夫直线进行直线检测,采用种子区域生长算法将角度差小于α、距离差小于d的线段进行区域生长,融合区域内的直线,得到融合后的线段长度top k,然后,采用滑动窗口进行直线归类,将top k直线中角度差小于β的直线归为一类,寻找直线密集区,根据密集区的密集度判断直线角度是否可信,若密集度可信,则通过密集度最高直线的角度进行校正,若密集度不可信,则通过文字倾斜角度计算,进行倾斜校正,为防止影像翻转为垂直方向,将校正后的图像进行抬头轮廓的获取,根据抬头位置判断结果,进行对应旋转,图像倾斜校正完成。
-
公开(公告)号:CN115239574A
公开(公告)日:2022-10-25
申请号:CN202210605531.8
申请日:2022-05-31
Applicant: 中电鸿信信息科技有限公司
IPC: G06T5/00 , G06T7/13 , G06N3/04 , G06N3/08 , G06V30/414
Abstract: 本发明公开了一种基于时间序列的背景重构与反向注入的幻灯片还原方法,包括:将幻灯片图片文件进行图像增强,增强幻灯片图片清晰度;将清晰度增强的幻灯片图片通过幻灯片轮廓检测算法,获取幻灯片图片的边缘轮廓,再通过双线性插值算法对幻灯片的边缘轮廓进行矫正,得到幻灯片矫正轮廓;幻灯片矫正轮廓通过卷积神经网络提取幻灯片的图像特征,再通过循环神经网络学习幻灯片的时序特征,提取幻灯片的背景模板;通过改进目标检测算法,将提取的背景模板反向注入,对幻灯片图片进行篇章分析,划分文字区域和图片区域;在提取的幻灯片的背景模板中,将图片区域的图片贴于原先的图片位置,将文字区域的文字写入原先的文字位置,实现幻灯片图片的还原。
-
-
-
-
-