-
公开(公告)号:CN113723330B
公开(公告)日:2023-11-07
申请号:CN202111039933.8
申请日:2021-09-06
Applicant: 华南理工大学
IPC: G06V30/412 , G06V30/413 , G06V30/19 , G06V10/82 , G06N3/0464 , G06V10/80 , G06T5/30 , G06F40/30 , G06V10/764
Abstract: 本发明公开了一种图表文档信息理解的方法及系统,包括:采集初始图表文档,对所述初始图表文档进行分类,获得第一图表文档;对所述第一图表文档进行文本检测和识别,获得第二图表文档;对所述第二图表文档进行文本属性分类,获得目标图表文档;基于所述目标图表文档实现对图表文档信息的理解。本发明提出的图表文档信息理解的方法及系统,可以有效对图表文档进行分类,文本检测和识别,以及文本属性分类,对于机器自动化提取、分析、理解图表文档内容信息有重大的作用和意义。
-
公开(公告)号:CN113723330A
公开(公告)日:2021-11-30
申请号:CN202111039933.8
申请日:2021-09-06
Applicant: 华南理工大学
Abstract: 本发明公开了一种图表文档信息理解的方法及系统,包括:采集初始图表文档,对所述初始图表文档进行分类,获得第一图表文档;对所述第一图表文档进行文本检测和识别,获得第二图表文档;对所述第二图表文档进行文本属性分类,获得目标图表文档;基于所述目标图表文档实现对图表文档信息的理解。本发明提出的图表文档信息理解的方法及系统,可以有效对图表文档进行分类,文本检测和识别,以及文本属性分类,对于机器自动化提取、分析、理解图表文档内容信息有重大的作用和意义。
-
公开(公告)号:CN113723421B
公开(公告)日:2023-10-17
申请号:CN202111038228.6
申请日:2021-09-06
Applicant: 华南理工大学
IPC: G06V30/19 , G06V30/148 , G06N3/04
Abstract: 本发明涉及基于匹配类别嵌入的零样本的汉字识别方法,包括:提取汉字文本图像的视觉特征;对汉字类别进行类别嵌入,采用基于层级分解嵌入算法,对汉字的部件进行层级分解,并计算得到相应的嵌入向量;将汉字类别的类别嵌入映射到视觉空间中,基于双向嵌入转移模块,使得汉字类别嵌入的维度等于视觉空间的维度,并保留所述汉字类别的原始信息;通过基于距离的CTC解码器,匹配汉字文本图像的视觉特征和汉字类别嵌入信息,输出汉字文本图像识别的最终结果。本发明通过匹配类别嵌入的方法,实现了零样本的汉字文本识别,该方法适用于汉字长文本识别和零样本汉字识别,此外本发明实现过程简单且灵活,可以应用于主流的文本识别框架。
-
公开(公告)号:CN114529917B
公开(公告)日:2024-08-23
申请号:CN202210095194.2
申请日:2022-01-26
Applicant: 华南理工大学
IPC: G06V30/40 , G06V30/418 , G06V10/75 , G06V30/19 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06T9/00
Abstract: 本发明公开了一种零样本中文单字识别方法、系统、装置及存储介质,其中方法包括:提取中文单字图像的视觉特征;对中文单字类别进行可学习的类别编码,对中文单字的部件结构进行分解,并计算得到可学习的类别编码;将所述中文单字的类别编码映射到视觉空间中,通过重构损失函数来约束类别编码在映射前后的语义一致性;通过基于transformer的解码器,匹配中文单字的类别编码和图像的视觉特征,从图像的视觉特征上获取与类别编码相关的特征,最终解码输出中文单字的识别结果。本发明通过可学习的类别编码方法,实现了零样本的中文单字识别,解决了现有中文单字识别方法依赖于大量有标注数据的问题。本发明可广泛应用于模式识别与人工智能技术领域。
-
公开(公告)号:CN114529917A
公开(公告)日:2022-05-24
申请号:CN202210095194.2
申请日:2022-01-26
Applicant: 华南理工大学
Abstract: 本发明公开了一种零样本中文单字识别方法、系统、装置及存储介质,其中方法包括:提取中文单字图像的视觉特征;对中文单字类别进行可学习的类别编码,对中文单字的部件结构进行分解,并计算得到可学习的类别编码;将所述中文单字的类别编码映射到视觉空间中,通过重构损失函数来约束类别编码在映射前后的语义一致性;通过基于transformer的解码器,匹配中文单字的类别编码和图像的视觉特征,从图像的视觉特征上获取与类别编码相关的特征,最终解码输出中文单字的识别结果。本发明通过可学习的类别编码方法,实现了零样本的中文单字识别,解决了现有中文单字识别方法依赖于大量有标注数据的问题。本发明可广泛应用于模式识别与人工智能技术领域。
-
公开(公告)号:CN113723421A
公开(公告)日:2021-11-30
申请号:CN202111038228.6
申请日:2021-09-06
Applicant: 华南理工大学
Abstract: 本发明涉及基于匹配类别嵌入的零样本的汉字识别方法,包括:提取汉字文本图像的视觉特征;对汉字类别进行类别嵌入,采用基于层级分解嵌入算法,对汉字的部件进行层级分解,并计算得到相应的嵌入向量;将汉字类别的类别嵌入映射到视觉空间中,基于双向嵌入转移模块,使得汉字类别嵌入的维度等于视觉空间的维度,并保留所述汉字类别的原始信息;通过基于距离的CTC解码器,匹配汉字文本图像的视觉特征和汉字类别嵌入信息,输出汉字文本图像识别的最终结果。本发明通过匹配类别嵌入的方法,实现了零样本的汉字文本识别,该方法适用于汉字长文本识别和零样本汉字识别,此外本发明实现过程简单且灵活,可以应用于主流的文本识别框架。
-
-
-
-
-