-
公开(公告)号:CN112070114A
公开(公告)日:2020-12-11
申请号:CN202010767079.6
申请日:2020-08-03
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提出一种基于高斯约束注意力机制网络的场景文字识别方法及系统,涉及图像信息识别领域,通过提取待识别图片的视觉特征,得到二维特征图;将二维特征图转化为一维特征序列,根据该一维特征序列提取全局语义信息;将全局语义信息输入至第一个时间步中初始化解码隐状态,并在每个时间步中根据隐状态和二维特征图计算原始的注意力权重,利用该权重加权求和得到原始加权特征向量;根据隐状态和原始加权特征向量构造二维高斯分布掩膜,将该掩膜与原始的注意力权重相乘,得到矫正的注意力权重,根据该权重得到矫正后加权特征向量;将原始加权特征向量和矫正后加权特征向量融合一起来预测待识别图片的字符,从而能够解决注意力弥散的情况。
-
公开(公告)号:CN110503090A
公开(公告)日:2019-11-26
申请号:CN201910614874.9
申请日:2019-07-09
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于受限注意力模型的字符检测网络训练方法、字符检测方法和字符检测器。本发明设计了基于深度神经网络的字符检测器,在网络结构中加入注意力模型来对学习到的特征进行加权,充分利用了字符周围的上下文信息来辅助字符特征的学习,并设计了一个受限关系模型来对上下文信息进行编码,考虑了不同上下文信息对当前特征的影响。本发明使用受限的上下文信息来提升字符检测的结果,通过融入合适的上下文信息,可以在很大程度上提高字符检测器的性能,使其对于复杂环境(光照、遮挡、复杂纹理等)的变化产生较强的抵抗性,能够减少检测过程中的误报和漏报,同时能够提供初步的识别结果。
-
公开(公告)号:CN104270392B
公开(公告)日:2017-09-26
申请号:CN201410575510.1
申请日:2014-10-24
Applicant: 中国科学院信息工程研究所
IPC: H04L29/06
Abstract: 本发明涉及一种基于三分类器协同训练学习的网络协议识别方法及系统:对网络原始流量进行IP重组和TCP流还原,将网络数据由包为单位规约为以流为单位;提取每条单向流的特征信息并向量化,构建特征矩阵;使用少量标记样本构建三分类器协同训练分类器;判定是否已有所分析协议的分类模型,如果没有则先利用三分类器协同训练学习方法构建协议分类器,否则对数据包的协议属性进行判别;利用基于J48的三分类器协同训练学习算法进行训练并得到所分析协议的分类模型;对未标识的网络数据包进行协议类别判定,输出结果为两类:一类是属于目标协议的网络数据包,另一类是非目标协议的网络数据包。本发明保证很高的识别准确率和召回率。
-
公开(公告)号:CN104270392A
公开(公告)日:2015-01-07
申请号:CN201410575510.1
申请日:2014-10-24
Applicant: 中国科学院信息工程研究所
IPC: H04L29/06
CPC classification number: H04L43/026 , H04L43/18 , H04L69/22
Abstract: 本发明涉及一种基于三分类器协同训练学习的网络协议识别方法及系统:对网络原始流量进行IP重组和TCP流还原,将网络数据由包为单位规约为以流为单位;提取每条单向流的特征信息并向量化,构建特征矩阵;使用少量标记样本构建三分类器协同训练分类器;判定是否已有所分析协议的分类模型,如果没有则先利用三分类器协同训练学习方法构建协议分类器,否则对数据包的协议属性进行判别;利用基于J48的三分类器协同训练学习算法进行训练并得到所分析协议的分类模型;对未标识的网络数据包进行协议类别判定,输出结果为两类:一类是属于目标协议的网络数据包,另一类是非目标协议的网络数据包。本发明保证很高的识别准确率和召回率。
-
公开(公告)号:CN113963341B
公开(公告)日:2024-07-19
申请号:CN202111034219.X
申请日:2021-09-03
Applicant: 中国科学院信息工程研究所
IPC: G06V20/62 , G06V10/40 , G06V10/774 , G06V10/764 , G06V10/75 , G06V10/82
Abstract: 本发明公开一种基于多层感知机掩膜解码器的文字检测系统及方法,涉及图像文本检测领域,利用多层感知机掩膜解码器来有效区分不同实例,多层感知机的掩膜解码器取消了权重共享,减小了掩膜分支中的学习混淆问题,同时,由于其全局建模和更多上下文信息的引入,得到预测结果也更为紧致,可以有效区分密集文本。
-
公开(公告)号:CN113963340B
公开(公告)日:2024-07-19
申请号:CN202111026162.9
申请日:2021-09-02
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于并行迭代模仿解码的场景文字识别系统及方法,涉及场景图像文本检测识别领域,综合了自回归和非自回归解码的优点,采用一种并行迭代的生成方式,针对不同长度的文本采用固定的迭代次数,并将“简单优先”策略引入到文字识别任务中,并引入一个额外的自回归解码器作为教师网络,使用自回归解码器FFN的输出作为额外的监督信号对并行解码器进行监督学习,并使用模仿学习来辅助并行解码器隐藏层的学习。本发明在多个公开的数据集上达到了最优的准确率,同时与自回归方法相比,速度上有明显的提升。
-
公开(公告)号:CN111753827B
公开(公告)日:2024-02-13
申请号:CN202010416704.2
申请日:2020-05-15
Applicant: 中国科学院信息工程研究所
IPC: G06V20/62 , G06V30/164 , G06V30/18 , G06V10/82 , G06N3/045 , G06N3/0442 , G06N3/0464
Abstract: 本发明提供一种基于语义强化编码器解码器框架的场景文字识别方法及系统,将目标图像上的任意形状的文本矫正为水平文本,得到矫正后的图像;将矫正后的图像输入到卷积神经网络中提取视觉特征,利用循环神经网络从该视觉特征中提取序列信息;根据序列信息预测全局语义信息;利用上述全局语义信息初始化一基于注意力机制的门控循环单元GRU的状态,根据上述视觉特征与GRU每一个解码时间的隐状态计算注意力权重,根据该注意力权重对上述视觉特征进行加权,预测出图像上的每一个字符。能够有效地利用全局信息填补现有方法使用局部信息的不足,同时减小视觉信息与语义信息之间的鸿沟,从而使模型能够更好地处理低质量的图像。
-
公开(公告)号:CN113963341A
公开(公告)日:2022-01-21
申请号:CN202111034219.X
申请日:2021-09-03
Applicant: 中国科学院信息工程研究所
IPC: G06V20/62 , G06V10/40 , G06V10/774 , G06V10/764 , G06V10/75 , G06K9/62
Abstract: 本发明公开一种基于多层感知机掩膜解码器的文字检测系统及方法,涉及图像文本检测领域,利用多层感知机掩膜解码器来有效区分不同实例,多层感知机的掩膜解码器取消了权重共享,减小了掩膜分支中的学习混淆问题,同时,由于其全局建模和更多上下文信息的引入,得到预测结果也更为紧致,可以有效区分密集文本。
-
公开(公告)号:CN113095319A
公开(公告)日:2021-07-09
申请号:CN202110235490.3
申请日:2021-03-03
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于全卷积角点修正网络的多向场景文字检测方法及装置,包括:依据图片的视觉特征,获取融合特征;根据融合特征,分别得到初始特征、初始分数与初始包围框偏移;将初始包围框偏移进行线性变换,得到角点感知卷积的采样网格,并依据该采样网格,对初始特征进行卷积,产生角点感知特征;依据角点感知特征,获取修正分数与修正包围框偏移;根据初始包围框偏移、修正包围框偏移及预定义参考点进行解码运算,获取修正包围框,从而得到多向场景文字检测结果。本发明利用多向场景文本的几何特性进行特征采样,通过角点感知的卷积模块,扩大了有效感受野且没有冗余信息引入,解决了密集长文本和高质量检测的问题,获取更优秀的性能。
-
公开(公告)号:CN112348048A
公开(公告)日:2021-02-09
申请号:CN202011040925.0
申请日:2020-09-28
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种多结构多任务深度神经网络及其训练、分类方法。本网络包括M个特征提取单元,一个用于识别样本子类类别的分类分支CCB和由K个用于对超类进行分类的超类分类器组成的超类分类分支MSCBs;每一超类分类器分别与一特征提取单元连接,用于基于提取的样本特征识别样本的超类类别;网络的损失函数为其中LCCB为CCB的损失函数,为第k个超类分类器的损失函数,分别是CCB、第k个超类分类器对样本x预测的子类和超类,c、是第k个分层标记结构Hk中的子类真实值、超类真实值。
-
-
-
-
-
-
-
-
-