-
公开(公告)号:CN112036290B
公开(公告)日:2023-11-03
申请号:CN202010878323.6
申请日:2020-08-27
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V30/413 , G06F40/126 , G06F40/279 , G06F40/30
Abstract: 本发明提供了一种基于类标编码表示的复杂场景文字识别方法及系统,该方法包括:设计五笔类标编码表示模块,根据设计的五笔类标编码表示模块对字符进行编码;输入场景文字图像进行预处理,得到训练场景文字图像;将训练场景文字图像输入到语义分割网络进行像素级别的分类,得到编码后标签的分类结果;利用概率模块学习五笔类标编码的转移矩阵,训练整个模型,得到场景文字识别模型;将测试图像输入至已训练的场景文字识别模型进行分类,得到最终语义分割图;对语义分割图的像素进行投票,选择具有最高票数的预测作为最终字符识别结果。本发明的技术方案对复杂场景的字符图像具有较高识别准确率,降低了参数和计算的复杂度。
-
公开(公告)号:CN112036137B
公开(公告)日:2025-02-18
申请号:CN202010879503.6
申请日:2020-08-27
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F40/171 , G06T3/04 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明提供了一种基于深度学习的多风格书法数字墨水仿真方法和系统,该方法包括:对输入图像进行预处理,得到经过预处理的输入图像;初始化风格特征向量;提取输入图像特征,并将其与风格特征向量初步融合;使用特征融合网络进一步融合输入图像特征和风格特征向量;使用解码器解码,生成具有输入图像笔画结构和指定书法风格的图像;根据真实图像与生成图像计算损失函数,并通过反向传播训练网络。采用本发明的技术方案,不需要繁琐的步骤,实现了端到端的书法数字墨水仿真;而且可轻易支持多种风格的仿真,并且仿真效果更加真实、自然;不仅可以用于书法数字墨水仿真,也可以用于变换纸张书写图像或计算机字体图像的风格,用途更加广泛。
-
公开(公告)号:CN112036290A
公开(公告)日:2020-12-04
申请号:CN202010878323.6
申请日:2020-08-27
Applicant: 哈尔滨工业大学(深圳)
IPC: G06K9/00 , G06F40/126 , G06F40/279 , G06F40/30
Abstract: 本发明提供了一种基于类标编码表示的复杂场景文字识别方法及系统,该方法包括:设计五笔类标编码表示模块,根据设计的五笔类标编码表示模块对字符进行编码;输入场景文字图像进行预处理,得到训练场景文字图像;将训练场景文字图像输入到语义分割网络进行像素级别的分类,得到编码后标签的分类结果;利用概率模块学习五笔类标编码的转移矩阵,训练整个模型,得到场景文字识别模型;将测试图像输入至已训练的场景文字识别模型进行分类,得到最终语义分割图;对语义分割图的像素进行投票,选择具有最高票数的预测作为最终字符识别结果。本发明的技术方案对复杂场景的字符图像具有较高识别准确率,降低了参数和计算的复杂度。
-
公开(公告)号:CN112036137A
公开(公告)日:2020-12-04
申请号:CN202010879503.6
申请日:2020-08-27
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F40/171 , G06T3/00 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种基于深度学习的多风格书法数字墨水仿真方法和系统,该方法包括:对输入图像进行预处理,得到经过预处理的输入图像;初始化风格特征向量;提取输入图像特征,并将其与风格特征向量初步融合;使用特征融合网络进一步融合输入图像特征和风格特征向量;使用解码器解码,生成具有输入图像笔画结构和指定书法风格的图像;根据真实图像与生成图像计算损失函数,并通过反向传播训练网络。采用本发明的技术方案,不需要繁琐的步骤,实现了端到端的书法数字墨水仿真;而且可轻易支持多种风格的仿真,并且仿真效果更加真实、自然;不仅可以用于书法数字墨水仿真,也可以用于变换纸张书写图像或计算机字体图像的风格,用途更加广泛。
-
-
-