-
公开(公告)号:CN113065404B
公开(公告)日:2023-02-24
申请号:CN202110249213.8
申请日:2021-03-08
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
IPC分类号: G06V30/412 , G06V30/146 , G06V30/19 , G06V10/82 , G06N3/0442
摘要: 本发明属于票据文本检测领域,具体涉及一种基于等宽文字片段的内容检测系统和方法。其中系统包括,特征提取模块,用于读取独立图片并输出该独立图片的特征图;第一预测模块,用于读取特征图并输出第一候选区信息;第一输出模块,用于读取第一候选区信息并输出第一文本区域;第二预测模块,用于读取特征图并输出第二候选区信息;以及,第二输出模块,用于读取第一文本区域并使用第二候选区信息修正后输出第二文本区域。其中方法是使用具有文本核标注的独立图片组成训练集对系统中特征提取模块、第一预测模块和第二预测模块调用的深度学习神经网络进行训练;在应用阶段仅使用第一预测模块获得的第一文本区域作为系统输出。
-
公开(公告)号:CN113065550B
公开(公告)日:2022-11-11
申请号:CN202110268438.8
申请日:2021-03-12
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
IPC分类号: G06V20/62 , G06V30/146 , G06V10/82 , G06N3/04
摘要: 本发明属于于场景文本识别领域,涉及一种基于自注意力机制的文本识别方法,由处理器执行一卷积神经网络算法指令实现,其包括:接收包含文本内容的场景图片;使用卷积神经网络其第一卷积模块提取场景图片的第一特征图M,其自注意力机制模块将第一特征图M编码为第二特征图Matt,其第二卷积模块提取第二特征图Matt通道方向的一维特征向量F;使用卷积神经网络其第三卷积模块根据第二特征图Matt和一维特征向量F获得场景图片的文本内容识别结果;第三卷积模块包含以一维特征向量F为初始隐含层的循环卷积模块以及用于对第二特征图Matt解码并设于循环卷积模块中循环单元输出的二维注意力机制模块。该方法能够对弯曲、倾斜等不规则文本实现较好的识别。
-
公开(公告)号:CN113064978A
公开(公告)日:2021-07-02
申请号:CN202110251849.6
申请日:2021-03-08
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
IPC分类号: G06F16/332 , G06F16/33 , G06F40/284 , G06F40/289 , G06Q10/06 , G06Q30/02
摘要: 本发明公开了基于特征词匹配的项目工期合理性判断方法及装置,涉及自然语言处理技术领域;方法包括S1历史项目关键词抽取,处理器从历史项目内容信息文本中抽取历史项目关键词,S2构建多层级项目信息库,处理器根据历史项目关键词构建多层级项目信息库,S3项目信息库分级搜索,处理器从项目进展报告中抽取新项目关键词,将新项目关键词遍历多层级项目信息库与历史项目关键词进行分级搜索匹配并获得匹配结果,S4项目工期合理性判断,根据匹配结果判断合理性;装置包括历史项目关键词抽取模块、构建多层级项目信息库模块、项目信息库分级搜索模块和项目工期合理性判断模块;其通过步骤S1至S4等,实现了新项目工期价格合理性判断。
-
公开(公告)号:CN113065406B
公开(公告)日:2022-11-11
申请号:CN202110249694.2
申请日:2021-03-08
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
IPC分类号: G06V30/412 , G06V10/82 , G06Q40/00 , G06N3/04
摘要: 本发明公开了一种基于编解码结构识别发票文本的报账智能平台,涉及财务报账平台技术领域;其包括图片生成器和终端以及文本图片特征提取模块、卷积神经网络特征编码模块和门控循环神经网络序列解码模块,文本图片特征提取模块,用于第一卷积神经网络对制式图片特征提取并获得三维特征向量矩阵F;卷积神经网络特征编码模块,用于第二卷积神经网络将三维特征向量矩阵F转换为可供门控循环神经网络序列解码输入的待解码特征向量G;门控循环神经网络序列解码模块,用于门控循环神经网络将待解码特征向量G解码并获得发票文本图片中对应的文字;其通过图片生成器和终端以及上述程序模块等,实现了财务报账平台识别发票图片中的长文本。
-
公开(公告)号:CN113158776A
公开(公告)日:2021-07-23
申请号:CN202110249695.7
申请日:2021-03-08
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
摘要: 本发明公开了基于编解码结构的发票文本识别方法及装置,涉及票据文本识别技术领域;方法包括S2文本图片特征提取,处理器将预处理图片处理为统一尺寸的制式图片,第一卷积神经网络对制式图片进行特征提取并获得三维特征向量矩阵F;S3卷积神经网络特征编码,第二卷积神经网络将三维特征向量矩阵F转换为可供门控循环神经网络序列解码输入的待解码特征向量G;S4门控循环神经网络序列解码,门控循环神经网络将待解码特征向量G解码并获得发票文本图片中对应的文字;装置包括文本图片特征提取模块、卷积神经网络特征编码模块和门控循环神经网络序列解码模块;其通过步骤S2至步骤S4等,实现了识别发票图片中的长文本。
-
公开(公告)号:CN113065548A
公开(公告)日:2021-07-02
申请号:CN202110262507.4
申请日:2021-03-10
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
摘要: 本发明公开了基于特征的文本检测方法及装置,涉及自然场景下文本检测技术领域;方法包括S1语义分割,通过第一神经网络从图片中获取含有全局特征的第一特征图;S2特征融合,获取到相同大小的如下特征图,第二特征图为带有检测需要信息的感兴趣区域,第三特征图为带有掩码需要信息的感兴趣区域,将第一和第二特征图融合并获得第四特征图,将第一和第三特征图融合并获得第五特征图;S3检测,对第四特征图进行类别预测和边框精修并获取水平矩形框;S4掩码,对第五特征图卷积操作并获取相应的掩码图;装置包括语义分割模块、检测模块、掩码模块和特征融合模块共四个程序模块;其通过步骤S1至步骤S4等,实现了自然场景下的通用文本检测。
-
公开(公告)号:CN113065411A
公开(公告)日:2021-07-02
申请号:CN202110266212.4
申请日:2021-03-10
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
摘要: 本发明公开了一种基于中心点监督信息的文本检测方法,涉及票据文本检测技术领域,尤其是一种基于中心点监督信息的文本检测方法,其包括:寻找火车票的边界;对火车票图片经过ResNet50卷积神经网络做特征提取;通过FPN网络对提取的特征图进行融合;通过FPN产生五种不同的输出:文本区域,文本中心线区域,圆盘半径,圆盘的sin值以及圆盘的cos值产生最终的检测结果。本发明主要针对火车票中的规则文本进行检测。通过将文本拆分为子区域(圆盘)进行预测,降低了训练的难度,FPN模块使得网络更具有泛华性。利用圆盘表示的方法避免了直接利用文本区域带来的粘连问题。本方法能够有效的解决火车票中内容检测问题。
-
公开(公告)号:CN113065407A
公开(公告)日:2021-07-02
申请号:CN202110254233.4
申请日:2021-03-09
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
摘要: 本发明属于票据文本识别领域,涉及一种基于注意力机制和生成对抗网络的财务票据印章擦除方法,由处理器实现,其包含:接收所述财务票据的原始图片;使用卷积神经网络中的特征提取模块根据所述原始图片确定其第一特征图;使用所述卷积神经网络根据所述第一特征图分别提取所述原始图片的背景颜色图和反应印章在所述原始图片上位置分布的注意力热图;并且,使用所述卷积神经网络根据所述原始图片、背景颜色图和注意力热图在通道方向上所拼接成的第二特征图通过生成对抗方式生成所述原始图片的擦除印章后的图片;所述卷积神经网络使用生成对抗的方式实施训练。本发明解决包含印章的财务票据识别困难问题,达到印章擦除却不损失原始文字信息的目标。
-
公开(公告)号:CN113159020B
公开(公告)日:2023-06-06
申请号:CN202110262362.8
申请日:2021-03-10
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
IPC分类号: G06V20/62 , G06V30/19 , G06V10/82 , G06N3/0464
摘要: 本发明公开了一种基于核尺度扩张的文本检测方法,涉及文本检测技术领域,尤其是一种文本检测方法,包括如下步骤:通过ResNet18网络对图片提取特征;通过FPN网络对所述ResNet18网络提取的所述特征提取深层语义信息并将提取的所述深层语义信息以及提取的所述特征进行融合产生融合特征;对所述融合特征提取不同尺度的文本中心核以及提取全局特征;利用区域权重算法对所述不同尺度的文本中心核以及所述全局特征进行区域融合得到最终的检测结果。本发明主要针对自然场景下中的复杂文本内容进行检测。通过基于分割的思想对文本预测多种核来避免常见的粘连问题,同时全局特征的使用进一步修正来生成的区域。该方法能够有效的解决复杂环境下的文本检测问题。
-
公开(公告)号:CN113159021A
公开(公告)日:2021-07-23
申请号:CN202110262508.9
申请日:2021-03-10
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
摘要: 本发明公开了一种基于上下文信息的文本检测方法,涉及文本检测技术领域,尤其是一种基于上下文信息的文本检测方法,包括如下步骤:输入图片,对图片进行缩放;用ResNet50网络对输入的图片进行特征提取;对ResNet50的最后四个block提取的特征进行空间上的特征融合;通过上下文模块对可能是文本的区域进行进一步加强;对每个固定大小的ROI区域特征图进行卷积操作,输出每个ROI区域是文本区域的得分、对ROI区域的修正以及修正后每个ROI区域的分割图;结合文本框的打分和全局分割图每个像素的得分重新进行打分,以确定每个预测得到的文本框的置信度。本发明设计的上下文模块借鉴了空间注意力的机制,提高了网络预测的精度;有效抑制了预测结果中假阳性预测的产生。
-
-
-
-
-
-
-
-
-