一种基于类标编码表示的复杂场景文字识别方法及系统

    公开(公告)号:CN112036290B

    公开(公告)日:2023-11-03

    申请号:CN202010878323.6

    申请日:2020-08-27

    Abstract: 本发明提供了一种基于类标编码表示的复杂场景文字识别方法及系统,该方法包括:设计五笔类标编码表示模块,根据设计的五笔类标编码表示模块对字符进行编码;输入场景文字图像进行预处理,得到训练场景文字图像;将训练场景文字图像输入到语义分割网络进行像素级别的分类,得到编码后标签的分类结果;利用概率模块学习五笔类标编码的转移矩阵,训练整个模型,得到场景文字识别模型;将测试图像输入至已训练的场景文字识别模型进行分类,得到最终语义分割图;对语义分割图的像素进行投票,选择具有最高票数的预测作为最终字符识别结果。本发明的技术方案对复杂场景的字符图像具有较高识别准确率,降低了参数和计算的复杂度。

    一种基于类标编码表示的复杂场景文字识别方法及系统

    公开(公告)号:CN112036290A

    公开(公告)日:2020-12-04

    申请号:CN202010878323.6

    申请日:2020-08-27

    Abstract: 本发明提供了一种基于类标编码表示的复杂场景文字识别方法及系统,该方法包括:设计五笔类标编码表示模块,根据设计的五笔类标编码表示模块对字符进行编码;输入场景文字图像进行预处理,得到训练场景文字图像;将训练场景文字图像输入到语义分割网络进行像素级别的分类,得到编码后标签的分类结果;利用概率模块学习五笔类标编码的转移矩阵,训练整个模型,得到场景文字识别模型;将测试图像输入至已训练的场景文字识别模型进行分类,得到最终语义分割图;对语义分割图的像素进行投票,选择具有最高票数的预测作为最终字符识别结果。本发明的技术方案对复杂场景的字符图像具有较高识别准确率,降低了参数和计算的复杂度。

Patent Agency Ranking