一种基于二维特征注意力机制的自然场景文本识别方法

    公开(公告)号:CN110378334B

    公开(公告)日:2023-04-18

    申请号:CN201910516931.X

    申请日:2019-06-14

    Abstract: 本发明公开了一种基于二维特征注意力机制的自然场景文本识别方法,包括如下步骤:1数据获取:使用公开的代码合成用以训练的行文本图片,按形状划分为规则训练集和不规则训练集,并从网上下载真实拍摄的文本图片作为测试数据;2数据处理:对图片的大小进行拉伸操作,处理后图片的尺寸为32*104;3标签制作:采用有监督的方法来训练识别模型,每张行文本图片都有对应的文本内容;4训练网络:用训练集中的数据训练识别网络;5测试网络:输入测试数据到已训练网络中获取行文本图片的预测结果。本发明利用注意力网络实现了从图片的二维特征中解码出字符,识别准确率在公开的数据集上达到了较高的水平,具有极高的实用性和应用价值。

    一种零样本中文单字识别方法、系统、装置及存储介质

    公开(公告)号:CN114529917B

    公开(公告)日:2024-08-23

    申请号:CN202210095194.2

    申请日:2022-01-26

    Abstract: 本发明公开了一种零样本中文单字识别方法、系统、装置及存储介质,其中方法包括:提取中文单字图像的视觉特征;对中文单字类别进行可学习的类别编码,对中文单字的部件结构进行分解,并计算得到可学习的类别编码;将所述中文单字的类别编码映射到视觉空间中,通过重构损失函数来约束类别编码在映射前后的语义一致性;通过基于transformer的解码器,匹配中文单字的类别编码和图像的视觉特征,从图像的视觉特征上获取与类别编码相关的特征,最终解码输出中文单字的识别结果。本发明通过可学习的类别编码方法,实现了零样本的中文单字识别,解决了现有中文单字识别方法依赖于大量有标注数据的问题。本发明可广泛应用于模式识别与人工智能技术领域。

    一种基于生成对抗网络的手写文字擦除方法

    公开(公告)号:CN117132994A

    公开(公告)日:2023-11-28

    申请号:CN202311039086.4

    申请日:2023-08-17

    Abstract: 本申请公开了一种基于生成对抗网络的手写文字擦除方法,步骤包括:收集带有手写文字的文档图像,并对文档进行人工标注,得到数据集;基于数据集,生成手写文字笔画掩码;对文档图像进行预处理,得到处理后数据;根据手写文字笔画掩码搭建基于生成对抗网络的手写文字擦除模型;利用处理后数据对手写文字擦除模型进行训练,得到最终模型;利用最终模型擦除文档图像中的手写文字部分。本申请利用深度学习网络对文档图像进行特征提取,通过预测手写文字的笔画精确定位需要擦除的区域,采用级联的生成对抗网络对手写文字进行擦除,具有实现简单、速度快、擦除效果好等优点。

    一种零样本中文单字识别方法、系统、装置及存储介质

    公开(公告)号:CN114529917A

    公开(公告)日:2022-05-24

    申请号:CN202210095194.2

    申请日:2022-01-26

    Abstract: 本发明公开了一种零样本中文单字识别方法、系统、装置及存储介质,其中方法包括:提取中文单字图像的视觉特征;对中文单字类别进行可学习的类别编码,对中文单字的部件结构进行分解,并计算得到可学习的类别编码;将所述中文单字的类别编码映射到视觉空间中,通过重构损失函数来约束类别编码在映射前后的语义一致性;通过基于transformer的解码器,匹配中文单字的类别编码和图像的视觉特征,从图像的视觉特征上获取与类别编码相关的特征,最终解码输出中文单字的识别结果。本发明通过可学习的类别编码方法,实现了零样本的中文单字识别,解决了现有中文单字识别方法依赖于大量有标注数据的问题。本发明可广泛应用于模式识别与人工智能技术领域。

    一种基于注意力机制的文本行单字分割方法

    公开(公告)号:CN110399879B

    公开(公告)日:2022-05-13

    申请号:CN201910517862.4

    申请日:2019-06-14

    Abstract: 本发明公开一种基于注意力机制的文本行单字分割方法,包括收集文本行训练图像;对图像的尺寸做归一化;对训练图像做数据增广;创建基于注意力机制的文本行识别网络;通过大量训练数据训练得到识别模型;将待分割文本行图像输入到识别模型中,通过注意力机制的权重概率分布计算单字分割结果;本发明注意力机制中的权重概率分布,在识别文本行内容的同时,能够将文本行中的单字分割出来,并且只需要标注文本内容,而不需要标注单字的位置,节省了大量人力,实现了弱监督的文本行单字分割。

    一种基于二维特征注意力机制的自然场景文本识别方法

    公开(公告)号:CN110378334A

    公开(公告)日:2019-10-25

    申请号:CN201910516931.X

    申请日:2019-06-14

    Abstract: 本发明公开了一种基于二维特征注意力机制的自然场景文本识别方法,包括如下步骤:1数据获取:使用公开的代码合成用以训练的行文本图片,按形状划分为规则训练集和不规则训练集,并从网上下载真实拍摄的文本图片作为测试数据;2数据处理:对图片的大小进行拉伸操作,处理后图片的尺寸为32*104;3标签制作:采用有监督的方法来训练识别模型,每张行文本图片都有对应的文本内容;4训练网络:用训练集中的数据训练识别网络;5测试网络:输入测试数据到已训练网络中获取行文本图片的预测结果。本发明利用注意力网络实现了从图片的二维特征中解码出字符,识别准确率在公开的数据集上达到了较高的水平,具有极高的实用性和应用价值。

Patent Agency Ranking