Patent search ap:("华南理工大学") AND inv:"黄宇浩" Page 1

1.

发明授权
一种图表文档信息理解的方法及系统有权

公开(公告)号：CN113723330B

公开(公告)日：2023-11-07

申请号：CN202111039933.8

申请日：2021-09-06

Applicant: 华南理工大学

Inventor： 伍思航 , 谢灿宇 , 黄宇浩 , 唐国志 , 廖倩颖 , 汪嘉鹏 , 陈邦栋 , 李洪亮 , 常新峰 , 李辉 , 丁凯 , 黄毅超 , 金连文

IPC: G06V30/412 , G06V30/413 , G06V30/19 , G06V10/82 , G06N3/0464 , G06V10/80 , G06T5/30 , G06F40/30 , G06V10/764

Abstract: 本发明公开了一种图表文档信息理解的方法及系统，包括：采集初始图表文档，对所述初始图表文档进行分类，获得第一图表文档；对所述第一图表文档进行文本检测和识别，获得第二图表文档；对所述第二图表文档进行文本属性分类，获得目标图表文档；基于所述目标图表文档实现对图表文档信息的理解。本发明提出的图表文档信息理解的方法及系统，可以有效对图表文档进行分类，文本检测和识别，以及文本属性分类，对于机器自动化提取、分析、理解图表文档内容信息有重大的作用和意义。

2.

发明公开
一种图表文档信息理解的方法及系统审中-实审

公开(公告)号：CN113723330A

公开(公告)日：2021-11-30

申请号：CN202111039933.8

申请日：2021-09-06

Applicant: 华南理工大学

Inventor： 伍思航 , 谢灿宇 , 黄宇浩 , 唐国志 , 廖倩颖 , 汪嘉鹏 , 陈邦栋 , 李洪亮 , 常新峰 , 李辉 , 丁凯 , 黄毅超 , 金连文

IPC: G06K9/00 , G06K9/62 , G06N3/04 , G06T5/30 , G06F40/30

Abstract: 本发明公开了一种图表文档信息理解的方法及系统，包括：采集初始图表文档，对所述初始图表文档进行分类，获得第一图表文档；对所述第一图表文档进行文本检测和识别，获得第二图表文档；对所述第二图表文档进行文本属性分类，获得目标图表文档；基于所述目标图表文档实现对图表文档信息的理解。本发明提出的图表文档信息理解的方法及系统，可以有效对图表文档进行分类，文本检测和识别，以及文本属性分类，对于机器自动化提取、分析、理解图表文档内容信息有重大的作用和意义。

3.

发明授权
基于匹配类别嵌入的零样本的汉字识别方法有权

公开(公告)号：CN113723421B

公开(公告)日：2023-10-17

申请号：CN202111038228.6

申请日：2021-09-06

Applicant: 华南理工大学

Inventor： 黄宇浩 , 金连文 , 彭德智

IPC: G06V30/19 , G06V30/148 , G06N3/04

Abstract: 本发明涉及基于匹配类别嵌入的零样本的汉字识别方法，包括：提取汉字文本图像的视觉特征；对汉字类别进行类别嵌入，采用基于层级分解嵌入算法，对汉字的部件进行层级分解，并计算得到相应的嵌入向量；将汉字类别的类别嵌入映射到视觉空间中，基于双向嵌入转移模块，使得汉字类别嵌入的维度等于视觉空间的维度，并保留所述汉字类别的原始信息；通过基于距离的CTC解码器，匹配汉字文本图像的视觉特征和汉字类别嵌入信息，输出汉字文本图像识别的最终结果。本发明通过匹配类别嵌入的方法，实现了零样本的汉字文本识别，该方法适用于汉字长文本识别和零样本汉字识别，此外本发明实现过程简单且灵活，可以应用于主流的文本识别框架。

4.

发明授权
一种零样本中文单字识别方法、系统、装置及存储介质有权

公开(公告)号：CN114529917B

公开(公告)日：2024-08-23

申请号：CN202210095194.2

申请日：2022-01-26

Applicant: 华南理工大学

Inventor： 黄宇浩 , 毛慧芸 , 周伟英

IPC: G06V30/40 , G06V30/418 , G06V10/75 , G06V30/19 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06T9/00

Abstract: 本发明公开了一种零样本中文单字识别方法、系统、装置及存储介质，其中方法包括：提取中文单字图像的视觉特征；对中文单字类别进行可学习的类别编码，对中文单字的部件结构进行分解，并计算得到可学习的类别编码；将所述中文单字的类别编码映射到视觉空间中，通过重构损失函数来约束类别编码在映射前后的语义一致性；通过基于transformer的解码器，匹配中文单字的类别编码和图像的视觉特征，从图像的视觉特征上获取与类别编码相关的特征，最终解码输出中文单字的识别结果。本发明通过可学习的类别编码方法，实现了零样本的中文单字识别，解决了现有中文单字识别方法依赖于大量有标注数据的问题。本发明可广泛应用于模式识别与人工智能技术领域。

5.

发明公开
一种零样本中文单字识别方法、系统、装置及存储介质有权

公开(公告)号：CN114529917A

公开(公告)日：2022-05-24

申请号：CN202210095194.2

申请日：2022-01-26

Applicant: 华南理工大学

Inventor： 黄宇浩 , 毛慧芸 , 周伟英

IPC: G06V30/40 , G06V30/418 , G06V10/75 , G06V30/19 , G06N3/04 , G06N3/08 , G06T9/00

Abstract: 本发明公开了一种零样本中文单字识别方法、系统、装置及存储介质，其中方法包括：提取中文单字图像的视觉特征；对中文单字类别进行可学习的类别编码，对中文单字的部件结构进行分解，并计算得到可学习的类别编码；将所述中文单字的类别编码映射到视觉空间中，通过重构损失函数来约束类别编码在映射前后的语义一致性；通过基于transformer的解码器，匹配中文单字的类别编码和图像的视觉特征，从图像的视觉特征上获取与类别编码相关的特征，最终解码输出中文单字的识别结果。本发明通过可学习的类别编码方法，实现了零样本的中文单字识别，解决了现有中文单字识别方法依赖于大量有标注数据的问题。本发明可广泛应用于模式识别与人工智能技术领域。

6.

发明公开
基于匹配类别嵌入的零样本的汉字识别方法有权

公开(公告)号：CN113723421A

公开(公告)日：2021-11-30

申请号：CN202111038228.6

申请日：2021-09-06

Applicant: 华南理工大学

Inventor： 黄宇浩 , 金连文 , 彭德智

IPC: G06K9/34 , G06K9/62 , G06N3/04

Abstract: 本发明涉及基于匹配类别嵌入的零样本的汉字识别方法，包括：提取汉字文本图像的视觉特征；对汉字类别进行类别嵌入，采用基于层级分解嵌入算法，对汉字的部件进行层级分解，并计算得到相应的嵌入向量；将汉字类别的类别嵌入映射到视觉空间中，基于双向嵌入转移模块，使得汉字类别嵌入的维度等于视觉空间的维度，并保留所述汉字类别的原始信息；通过基于距离的CTC解码器，匹配汉字文本图像的视觉特征和汉字类别嵌入信息，输出汉字文本图像识别的最终结果。本发明通过匹配类别嵌入的方法，实现了零样本的汉字文本识别，该方法适用于汉字长文本识别和零样本汉字识别，此外本发明实现过程简单且灵活，可以应用于主流的文本识别框架。

Patent Agency Ranking