一种支持隐私保护的票据图像文本识别方法

    公开(公告)号:CN110175610B

    公开(公告)日:2023-09-05

    申请号:CN201910436497.4

    申请日:2019-05-23

    Abstract: 本发明公开了一种支持隐私保护的票据图像文本识别方法,涉及图像文本识别领域,所述方法包括以下步骤:首先通过用户票据请求端输入票据图像;然后通过所述用户票据请求端调用云端识别服务器接口,采用基于深度学习的端到端票据文本识别网络模型对所述票据图像的文本进行分析与识别;接着采用票据信息隐私保护方法对所述票据图像的识别全程实施加密保护;最后通过所述用户票据请求端得到文本行识别结果。本发明通过建立一种基于深度学习的端到端票据文本识别网络模型,利用明文票据数据集进行训练,捕获票据上的关键文本信息,提升票据录入效率,同时结合同态加密,提供一种票据信息隐私保护方案,保障用户的信息安全。

    融合多种文本特征及几何信息的表格识别方法及系统

    公开(公告)号:CN111860257B

    公开(公告)日:2022-11-11

    申请号:CN202010663170.3

    申请日:2020-07-10

    Abstract: 本发明提供了一种融合多种文本特征及几何信息的表格识别方法,包括:数据处理步骤:获取表格区域的图片,分别对获取的图片进行OCR识别与直线识别,获得关键特征信息;图卷积神经网络训练步骤:根据获得的关键特征信息,进行图卷积神经网络训练,构建表格结构识别模型;表格识别步骤:根据构建的表格结构识别模型,对图片格式的表格进行结构识别。本发明提出了一种融合多种文本特征及几何信息的表格识别方法,从采用数据的多样性方面和对数据进行特征提取的方法等方面进行改进,有效提升了表格识别的准确率,获得了更加准确的表格结构重建结果,相对现有基于传统规则的表格识别机制及基于图片的传统深度学习方法有了很大的提升效果。

    具有隐私保护的表格类信息抽取系统及方法

    公开(公告)号:CN113221181B

    公开(公告)日:2022-08-09

    申请号:CN202110642036.X

    申请日:2021-06-09

    Abstract: 一种具有隐私保护的表格类信息抽取系统及方法,包括:位于本地端的节点单元特征收集模块、用户隐私敏感脱敏模块和神经网络采集模块以及位于云服务端的图神经网络模块,节点单元特征收集模块根据用户输入待识别的图片,通过部署在本地端的文字识别模型和文字定位模型识别出节点得到节点的文字段以及坐标特征,用户隐私敏感脱敏模块利用自注意力机制,通过坐标空间转换文字空间转换将每个节点的文字、坐标信息进行变换并得到原语义在不同维度下的向量,神经网络采集模块将待识别图像通过卷积神经网络的卷积操作提取出图像特征,图神经网络模块根据节点连接关系节点特征,使用图卷积神经网络理解学习节点的位置特征以及邻接关系,最终得到节点连接关系,通过节点单元特征收集模块得到的节点文字、坐标信息以及云服务端返回的节点连接关系,提取出整个图片信息并恢复出整个表格。

    基于Gabor卷积和线性稀疏注意力的文字识别系统

    公开(公告)号:CN113221874A

    公开(公告)日:2021-08-06

    申请号:CN202110642032.1

    申请日:2021-06-09

    Abstract: 一种基于Gabor卷积和线性稀疏注意力的场景文字识别系统,包括:空间矫正模块、Gabor特征提取模块和线性稀疏注意力模块,空间矫正模块对输入的场景文字图像进行矫正,Gabor特征提取模块从矫正图像中提取出Gabor特征和卷积特征,经融合后输出至线性稀疏注意力模块进行编解码从而实现文字识别。本发明能够有效捕获场景文字图像各字符对象的方向和纹理变化特征,在提取目标的局部空间和频率域信息方面具有良好的特性。采用自注意力机制替代循环神经网络结构,由此具备了良好的并行计算的能力,加快了训练和推理速度。同时在自注意力机制中引入稀疏注意力的思想,解决了模型随着长度的增加,注意力部分所占用的内存和计算呈平方比增加的问题,同时有助于将引起注意的部分被保留下来,而忽视其他无关的信息。并且在稀疏注意力中加入线性关系约束,一定程度上可以缓解注意力偏移的问题,使得文字识别更加精准。

    序列处理方法及相关设备
    37.
    发明公开

    公开(公告)号:CN112036546A

    公开(公告)日:2020-12-04

    申请号:CN202010857256.X

    申请日:2020-08-24

    Abstract: 本公开提供了一种序列处理方法及装置、计算机可读存储介质、电子设备。该方法包括:获取待处理序列在当前时间步的当前输入向量;利用循环神经网络模型中的控制单元对当前输入向量进行处理,获得控制单元在当前时间步的当前控制细胞状态向量;根据当前控制细胞状态向量,生成循环神经网络模型中各个工作单元在当前时间步的当前工作隐状态向量;根据各个工作单元的当前工作隐状态向量,获得待处理序列在当前时间步的当前输出向量。

    基于深度学习的抗老年痴呆药物有效性预测系统

    公开(公告)号:CN111540419A

    公开(公告)日:2020-08-14

    申请号:CN202010347311.0

    申请日:2020-04-28

    Abstract: 一种基于深度学习的抗老年痴呆药物有效性预测系统,包括:基于方剂属性的抗老年痴呆中药有效性预测模块和基于分子化合物特征的抗老年痴呆药物有效性预测模块,其中:抗老年痴呆中药有效性预测模块进行中药方剂中药物属性训练处理并输出中药方剂预测模型;抗老年痴呆药物有效性预测模块进行分子化合物特征值训练处理并输出分子化合物预测模型。本发明以中药方剂中的药物属性以及分子化合物的特征作为训练数据来训练深度学习模型,并使用模型对药物有效性进行精确预测。

    云环境下搜索引擎的访问控制方法及系统

    公开(公告)号:CN102945356A

    公开(公告)日:2013-02-27

    申请号:CN201210537398.3

    申请日:2012-12-12

    Abstract: 本发明提供一种云环境下搜索引擎的访问控制方法及系统,所述云环境下搜索引擎的访问控制方法包括:S1.处理接收的新文件,为新文件生成索引,指定访问结构并为新文件加密,并存储已加密的新文件;S2.发出检索所需文件的请求,获取密钥后开始检索文件,并过滤检索结果;S3.选择下载文件,为文件刻上水印,最后将所述文件传给用户。本发明所述的云环境下搜索引擎的访问控制方法及系统利用属性加密具有访问控制粒度细、数据保护安全性强、运算速度可接受的特点,将其结合到云环境下的高效搜索引擎中可以同时实现加密操作和访问控制,并保持搜索引擎的高效性。

    基于可扩展的标记语言的统一策略管理系统

    公开(公告)号:CN1988478A

    公开(公告)日:2007-06-27

    申请号:CN200610147226.X

    申请日:2006-12-14

    Abstract: 一种计算机安全管理领域的基于可扩展的标记语言的统一策略管理系统。本发明包括:策略服务器、策略设计器以及策略共享库。所述的策略设计器通过可视化的策略定义界面生成易于管理的通用安全策略;所述的策略服务器根据统一策略中的设备类型信息字段,以及预置好的安全设备配置文件,把统一定义的配置规则编译成针对各个不同产品的具体配置规则,把编译好的具体配置规则,安全地按照正确的顺序分发给相应的设备,同时提供了报表系统为安全管理员反映策略的当前状态以及对设备进行监视,发出警告并报告其活动;所述的策略共享库,统一存放在所有定义好的安全策略,并随时供查询生成报表或进行审计,所有安全策略都是用PDL定义的。

Patent Agency Ranking