-
公开(公告)号:CN109919174A
公开(公告)日:2019-06-21
申请号:CN201910040323.6
申请日:2019-01-16
Applicant: 北京大学
Abstract: 本发明公布了一种基于门控级联注意力机制的文字识别方法,涉及深度学习与图像文字识别技术。本发明方法采用基于注意力机制的编码器-解码器框架,使用编码器从输入图像中提取出特征向量序列;使用解码器依据编码后的特征向量序列循环地生成目标字符序列;在解码器中通过级联迭代的方式,逐步增强注意力机制对准的准确度,提升了注意力机制对准的准确性,避免利用额外的字符集标注数据来监督注意力机制训练,节省了人力成本,提高了场景文字识别的准确率,增强了识别模型对复杂情况的鲁棒性。
-
公开(公告)号:CN109902800A
公开(公告)日:2019-06-18
申请号:CN201910058187.3
申请日:2019-01-22
Applicant: 北京大学
Abstract: 本发明公布了一种基于多级骨干网络的通用物体的检测方法,建立基于拟反馈神经网络的多级骨干网络,利用多个骨干网络之间的连接,在深度神经网络中模拟反馈机制,从而增强通用物体特征的提取,提高物体检测的精度。本发明可应用于多种物体检测器,被应用的检测器的骨干网络采用本发明提供的多级骨干网络,而检测器其他部分的网络结构不需要改变,方法简单方便,且物体检测精度高。
-