-
公开(公告)号:CN110751152A
公开(公告)日:2020-02-04
申请号:CN201910994519.9
申请日:2019-10-18
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种检测任意形状文本的方法,通过使用特征增强模块能够通过提取全局上下文信息来增大感受野,使得网络能检测很长和很大的文本;此外,特征增强模块还能使网络知道哪些区域属于同一个文本,从而解决了现有方法把具有大的字符间距的文本错误检测为多个文本的问题。其次,通过学习像素间的紧凑性(属于同一个文本实例的像素的关系密切,反之亦然),用X坐标偏移图和Y坐标的偏移图来指导文本分割图,从而重构出更精确的文本边框,从而解决了现有方法将靠得近的两个文本实例错误地检测为一个的问题。最后,本方法能够检测任意形状的文本,解决了现有很多方法只能检测形状规则的文本的问题。
-
公开(公告)号:CN109948615A
公开(公告)日:2019-06-28
申请号:CN201910232853.0
申请日:2019-03-26
Abstract: 本发明公开了一种多语言文本检测识别系统,包括:文本检测器,用于在输入图像中生成一系列的文本候选框;归一化单元,用于在每一文本候选框在保存原有宽高比的基础上将所有文本候选框调整为统一高度;脚本识别网络,用于对归一化后的文本候选框中文本的类型进行识别,确定相应文本为符号或者某个具体的语言类型;基于注意力机制的多语言文本识别网络,用于对归一化后的文本候选框中文本内容进行识别。该系统可以同时检测并识别出场景文本图像中的多种语言的文本。
-
公开(公告)号:CN110276351B
公开(公告)日:2022-09-06
申请号:CN201910577855.3
申请日:2019-06-28
Applicant: 中国科学技术大学
IPC: G06V20/62 , G06V30/19 , G06V30/18 , G06V10/82 , G06V30/148
Abstract: 本发明公开了一种多语言场景文本检测与识别方法,包括:通过文本检测器对输入的图像进行处理,得到一系列文本候选框:通过特征选择和长范围依赖性提取模块,自适应地生成一个一维权重向量和一个二维权重矩阵,从而更关注那些提取了文本信息的通道以及包含文本的区域,以及通过捕获长范围依赖性,从而获得全局信息;再通过特征增强模块的操作,使网络对文本/非文本具有更好的辨别性能,从而减小误报。最后分别使用多个卷积来预测一系列文本候选框;将经过阈值处理以及缩放之后的文本候选框通过文本识别器与文本类别识别器进行文本识别与文本类别识别,得到文本内容与文本的类别。该方法具有较高的文本检测与识别性能,并适用于多语言的应用场景。
-
公开(公告)号:CN111259764A
公开(公告)日:2020-06-09
申请号:CN202010030861.X
申请日:2020-01-10
Abstract: 一种文本检测方法,应用于文本检测技术领域,包括:提取待检测图像的多种尺度的文本特征,得到多种尺度的文本特征图,将该多种尺度的文本特征图进行级联,得到包含多种尺度信息的级联文本特征图,根据该级联文本特征图,预测该待检测图像中的文本区域和文本中心区域,采用形状感知的聚类算法,根据该文本区域和文本中心区域,重建得到该待检测图像中的精确的文本框。本申请还提供了一种文本检测装置、电子设备及存储装置,可从场景图像中检测出任意形状的文本,提升文本检测效果。
-
公开(公告)号:CN112861739A
公开(公告)日:2021-05-28
申请号:CN202110186700.4
申请日:2021-02-10
Applicant: 中国科学技术大学
Abstract: 一种端到端文本识别方法、模型训练方法及装置,模型训练方法包括:构建初始端到端文本识别模型,其中,初始端到端文本识别模型包括初始文本检测模块和初始文本识别模块;获取训练样本数据集;利用样本生成算法处理训练样本数据集中的训练样本,生成扩增训练样本数据集,以便增加用于训练初始文本识别模块的训练样本数量;以及利用训练样本数据集和扩增训练样本数据集训练初始端到端文本识别模型,得到端到端文本识别模型。通过上述技术方案本发明利用样本生成算法生成大量用于训练文本识别模块的训练样本,从而有效地解决了文本检测模块过拟合和文本识别模块欠拟合的问题,提升端到端文本识别模型的识别精度。
-
公开(公告)号:CN110276351A
公开(公告)日:2019-09-24
申请号:CN201910577855.3
申请日:2019-06-28
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种多语言场景文本检测与识别方法,包括:通过文本检测器对输入的图像进行处理,得到一系列文本候选框:通过特征选择和长范围依赖性提取模块,自适应地生成一个一维权重向量和一个二维权重矩阵,从而更关注那些提取了文本信息的通道以及包含文本的区域,以及通过捕获长范围依赖性,从而获得全局信息;再通过特征增强模块的操作,使网络对文本/非文本具有更好的辨别性能,从而减小误报。最后分别使用多个卷积来预测一系列文本候选框;将经过阈值处理以及缩放之后的文本候选框通过文本识别器与文本类别识别器进行文本识别与文本类别识别,得到文本内容与文本的类别。该方法具有较高的文本检测与识别性能,并适用于多语言的应用场景。
-
公开(公告)号:CN112861739B
公开(公告)日:2022-09-09
申请号:CN202110186700.4
申请日:2021-02-10
Applicant: 中国科学技术大学
Abstract: 块过拟合和文本识别模块欠拟合的问题,提升端一种端到端文本识别方法、模型训练方法及 到端文本识别模型的识别精度。装置,模型训练方法包括:构建初始端到端文本识别模型,其中,初始端到端文本识别模型包括初始文本检测模块和初始文本识别模块;获取训练样本数据集;利用样本生成算法处理训练样本数据集中的训练样本,生成扩增训练样本数据集,以便增加用于训练初始文本识别模块的训练样本数量;以及利用训练样本数据集和扩增训练样本数据集训练初始端到端文本识别模型,得到端到端文本识别模型。通过上述技术方案本发明(56)对比文件Siyang Qin 等.Towards UnconstrainedEnd-to-End Text Spotting《.arXiv》.2019,Li T 等.Natural Scene Text DetectionBased On Multi-level Fusion ProposalNetwork《.IOP Conference Series MaterialsScience and Engineering》.2020,Chowdhury A 等.An Efficient End-to-End Neural Model for Handwritten TextRecognition《.arXiv》.2018,
-
公开(公告)号:CN110751152B
公开(公告)日:2021-06-08
申请号:CN201910994519.9
申请日:2019-10-18
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种检测任意形状文本的方法,通过使用特征增强模块能够通过提取全局上下文信息来增大感受野,使得网络能检测很长和很大的文本;此外,特征增强模块还能使网络知道哪些区域属于同一个文本,从而解决了现有方法把具有大的字符间距的文本错误检测为多个文本的问题。其次,通过学习像素间的紧凑性(属于同一个文本实例的像素的关系密切,反之亦然),用X坐标偏移图和Y坐标的偏移图来指导文本分割图,从而重构出更精确的文本边框,从而解决了现有方法将靠得近的两个文本实例错误地检测为一个的问题。最后,本方法能够检测任意形状的文本,解决了现有很多方法只能检测形状规则的文本的问题。
-
公开(公告)号:CN109948615B
公开(公告)日:2021-01-26
申请号:CN201910232853.0
申请日:2019-03-26
Abstract: 本发明公开了一种多语言文本检测识别系统,包括:文本检测器,用于在输入图像中生成一系列的文本候选框;归一化单元,用于在每一文本候选框在保存原有宽高比的基础上将所有文本候选框调整为统一高度;脚本识别网络,用于对归一化后的文本候选框中文本的类型进行识别,确定相应文本为符号或者某个具体的语言类型;基于注意力机制的多语言文本识别网络,用于对归一化后的文本候选框中文本内容进行识别。该系统可以同时检测并识别出场景文本图像中的多种语言的文本。
-
-
-
-
-
-
-
-