一种基于关键偏旁部首分析的零样本汉字识别方法

    公开(公告)号:CN115187997B

    公开(公告)日:2023-07-28

    申请号:CN202210823652.X

    申请日:2022-07-13

    Abstract: 本发明提出一种基于关键偏旁部首分析的零样本汉字识别方法,包括以下步骤;步骤S1:获取汉字图像建立汉字识别数据集;步骤S2:把数据集中的每个汉字表示为唯一的树状结构,进行先序遍历,获取汉字表意描述序列;步骤S3:建立汉字表意描述序列生成模型;步骤S4:使用汉字识别数据集对汉字表意描述序列生成模型进行深度学习训练;步骤S5:以深度学习训练后的汉字表意描述序列生成模型经汉字表意描述序列生成模型,生成汉字的表意描述序列;步骤S6:建立关键偏旁部首分析模型;步骤S7:根据生成的汉字表意描述序列,使用关键偏旁部首分析模型对汉字类别进行预测。本发明能将汉字识别问题转化为不确定性消除问题,提高模型对预测表意描述序列的利用能力。

    一种基于关键偏旁部首分析的零样本汉字识别方法

    公开(公告)号:CN115187997A

    公开(公告)日:2022-10-14

    申请号:CN202210823652.X

    申请日:2022-07-13

    Abstract: 本发明提出一种基于关键偏旁部首分析的零样本汉字识别方法,包括以下步骤;步骤S1:获取汉字图像建立汉字识别数据集;步骤S2:把数据集中的每个汉字表示为唯一的树状结构,进行先序遍历,获取汉字表意描述序列;步骤S3:建立汉字表意描述序列生成模型;步骤S4:使用汉字识别数据集对汉字表意描述序列生成模型进行深度学习训练;步骤S5:以深度学习训练后的汉字表意描述序列生成模型经汉字表意描述序列生成模型,生成汉字的表意描述序列;步骤S6:建立关键偏旁部首分析模型;步骤S7:根据生成的汉字表意描述序列,使用关键偏旁部首分析模型对汉字类别进行预测。本发明能将汉字识别问题转化为不确定性消除问题,提高模型对预测表意描述序列的利用能力。

Patent Agency Ranking