-
公开(公告)号:CN106570456A
公开(公告)日:2017-04-19
申请号:CN201610895498.1
申请日:2016-10-13
Applicant: 华南理工大学
CPC classification number: G06K9/00409 , G06K9/00402 , G06K9/6256 , G06K9/6885 , G06N3/084
Abstract: 本发明公开了基于全卷积递归网络的手写汉字文本识别方法,包括步骤路径积分层将联机的笔迹信息转化为相应的脱机特征图片;全卷积网络提取脱机特征图片的高维抽象表达,生成相应的响应图;多层双向递归网络将所述响应图的每一帧完成识别并输出一个关于字符集的概率分布;转录层使用前向计算和反向梯度传播的动态规划算法,使得整个手写汉字文本识别模型可以直接基于文本数据进行训练;和语言模型后处理。本发明对于原联机笔迹信息具有不同程度的刻画能力;在没有对手写汉字文本预分割的情况下,可以接受任意长度的输入序列,并输出一个对应的输出序列;整体性能强;采用集束搜索方法嵌入语言模型解码全卷积递归网络,进一步提高了识别率。
-
公开(公告)号:CN106570456B
公开(公告)日:2019-08-09
申请号:CN201610895498.1
申请日:2016-10-13
Applicant: 华南理工大学
Abstract: 本发明公开了基于全卷积递归网络的手写汉字文本识别方法,包括步骤路径积分层将联机的笔迹信息转化为相应的脱机特征图片;全卷积网络提取脱机特征图片的高维抽象表达,生成相应的响应图;多层双向递归网络将所述响应图的每一帧完成识别并输出一个关于字符集的概率分布;转录层使用前向计算和反向梯度传播的动态规划算法,使得整个手写汉字文本识别模型可以直接基于文本数据进行训练;和语言模型后处理。本发明对于原联机笔迹信息具有不同程度的刻画能力;在没有对手写汉字文本预分割的情况下,可以接受任意长度的输入序列,并输出一个对应的输出序列;整体性能强;采用集束搜索方法嵌入语言模型解码全卷积递归网络,进一步提高了识别率。
-
公开(公告)号:CN110390326A
公开(公告)日:2019-10-29
申请号:CN201910517854.X
申请日:2019-06-14
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于集聚交叉损失函数的序列识别方法,包括以下步骤:下载自然场景文本识别数据作为测试集,并使用开源代码合成的自然场景文本的数据作为训练数据;采集自然场景下的图片,并对所述图片进行等比例放缩操作;统计所述图片中的标签出现的字符类别、所述字符类别出现的次数;通过监督网络预测所述自然场景文本数据的字符类别、所述字符类别出现次数,将自然场景文本数据与所述标签的差别的部分进行训练;把步骤A中的自然场景文本识别数据、步骤C中的标签数据输入到预先设计好的网络中进行训练;输入测试数据到已训练完成的网络中,最后得到图片的识别结果;本发明对弯曲排列文本具有很高的鲁棒性和有效性。
-
-