基于匹配类别嵌入的零样本的汉字识别方法

    公开(公告)号:CN113723421B

    公开(公告)日:2023-10-17

    申请号:CN202111038228.6

    申请日:2021-09-06

    Abstract: 本发明涉及基于匹配类别嵌入的零样本的汉字识别方法,包括:提取汉字文本图像的视觉特征;对汉字类别进行类别嵌入,采用基于层级分解嵌入算法,对汉字的部件进行层级分解,并计算得到相应的嵌入向量;将汉字类别的类别嵌入映射到视觉空间中,基于双向嵌入转移模块,使得汉字类别嵌入的维度等于视觉空间的维度,并保留所述汉字类别的原始信息;通过基于距离的CTC解码器,匹配汉字文本图像的视觉特征和汉字类别嵌入信息,输出汉字文本图像识别的最终结果。本发明通过匹配类别嵌入的方法,实现了零样本的汉字文本识别,该方法适用于汉字长文本识别和零样本汉字识别,此外本发明实现过程简单且灵活,可以应用于主流的文本识别框架。

    一种零样本中文单字识别方法、系统、装置及存储介质

    公开(公告)号:CN114529917B

    公开(公告)日:2024-08-23

    申请号:CN202210095194.2

    申请日:2022-01-26

    Abstract: 本发明公开了一种零样本中文单字识别方法、系统、装置及存储介质,其中方法包括:提取中文单字图像的视觉特征;对中文单字类别进行可学习的类别编码,对中文单字的部件结构进行分解,并计算得到可学习的类别编码;将所述中文单字的类别编码映射到视觉空间中,通过重构损失函数来约束类别编码在映射前后的语义一致性;通过基于transformer的解码器,匹配中文单字的类别编码和图像的视觉特征,从图像的视觉特征上获取与类别编码相关的特征,最终解码输出中文单字的识别结果。本发明通过可学习的类别编码方法,实现了零样本的中文单字识别,解决了现有中文单字识别方法依赖于大量有标注数据的问题。本发明可广泛应用于模式识别与人工智能技术领域。

    一种零样本中文单字识别方法、系统、装置及存储介质

    公开(公告)号:CN114529917A

    公开(公告)日:2022-05-24

    申请号:CN202210095194.2

    申请日:2022-01-26

    Abstract: 本发明公开了一种零样本中文单字识别方法、系统、装置及存储介质,其中方法包括:提取中文单字图像的视觉特征;对中文单字类别进行可学习的类别编码,对中文单字的部件结构进行分解,并计算得到可学习的类别编码;将所述中文单字的类别编码映射到视觉空间中,通过重构损失函数来约束类别编码在映射前后的语义一致性;通过基于transformer的解码器,匹配中文单字的类别编码和图像的视觉特征,从图像的视觉特征上获取与类别编码相关的特征,最终解码输出中文单字的识别结果。本发明通过可学习的类别编码方法,实现了零样本的中文单字识别,解决了现有中文单字识别方法依赖于大量有标注数据的问题。本发明可广泛应用于模式识别与人工智能技术领域。

    基于匹配类别嵌入的零样本的汉字识别方法

    公开(公告)号:CN113723421A

    公开(公告)日:2021-11-30

    申请号:CN202111038228.6

    申请日:2021-09-06

    Abstract: 本发明涉及基于匹配类别嵌入的零样本的汉字识别方法,包括:提取汉字文本图像的视觉特征;对汉字类别进行类别嵌入,采用基于层级分解嵌入算法,对汉字的部件进行层级分解,并计算得到相应的嵌入向量;将汉字类别的类别嵌入映射到视觉空间中,基于双向嵌入转移模块,使得汉字类别嵌入的维度等于视觉空间的维度,并保留所述汉字类别的原始信息;通过基于距离的CTC解码器,匹配汉字文本图像的视觉特征和汉字类别嵌入信息,输出汉字文本图像识别的最终结果。本发明通过匹配类别嵌入的方法,实现了零样本的汉字文本识别,该方法适用于汉字长文本识别和零样本汉字识别,此外本发明实现过程简单且灵活,可以应用于主流的文本识别框架。

Patent Agency Ranking