-
公开(公告)号:CN108052937B
公开(公告)日:2019-05-31
申请号:CN201711460633.0
申请日:2017-12-28
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06K9/00463 , G06F17/241 , G06K9/6256 , G06K2209/01 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种基于弱监督的字符检测器训练方法、装置、文字检测系统及计算机可读存储介质,其中基于弱监督的字符检测器训练方法包括:输入待处理对象的粗粒度标注信息,粗粒度标注信息包括待处理对象的基于词、文本条和/或行的标注信息;对粗粒度标注信息的多边形进行分割,获得所述待处理对象的字符的粗包围盒;根据粗粒度标注信息,通过神经网络模型获得所述待处理对象的字符的预测包围盒;根据粗包围盒和所述预测包围盒确定所述待处理对象的字符的精细包围盒,将所述精细包围盒的标注信息作为所述待处理对象的字符标注。本发明提供的实施例能够使文字字符检测器利用更多的文字检测数据集进行训练,使模型在字符级别的检测精度显著提高。
-
公开(公告)号:CN106845530A
公开(公告)日:2017-06-13
申请号:CN201611262299.3
申请日:2016-12-30
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06K9/6227 , G06K9/4604 , G06K2209/01 , G06N3/0454 , G06K9/6262 , G06K9/6256 , G06N3/08
Abstract: 本申请公开了字符检测方法和装置。该方法的一具体实施方式包括:将包含经标注的词语的图片作为机器学习模型的输入;基于被预测出的位于经标注的词语的标注区域内的字符的预测结果和经标注的词语的标注信息,从被预测出的位于经标注的词语的标注区域内的字符中选取出用于训练机器学习模型的字符;基于选取出的字符的特征,对机器学习模型进行训练。实现了利用既有的词级别标注的图片即可对机器学习模型进行充分地训练,得到可对图片中的字符进行检测的机器学习模型,降低了训练可对图片中的字符进行检测的机器学习模型的开销。
-
公开(公告)号:CN108304835B
公开(公告)日:2019-12-06
申请号:CN201810090633.4
申请日:2018-01-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了文字检测方法和装置。该方法的一具体实施方式包括:采用特征提取网络对待检测图像进行多个抽象层级的特征提取;采用字符检测网络预测出待检测图像中每个像素点为字符像素点的概率、以及每个像素点为字符像素点时该像素点相对于其所在的字符的包围盒的位置信息;基于字符检测网络的预测结果确定出各候选字符的包围盒的位置信息;将提取出特征输入字符映射网络,对字符映射网络输出的特征图进行变换,生成字符向量;在待检测图像中确定各候选字符的近邻候选字符,并将各候选字符与相关的近邻候选字符连接为字符组;根据字符组中各候选字符的包围盒的位置信息确定待检测图像的文字区域。该实施方式提升了不规则文字检测的准确度。
-
公开(公告)号:CN108304835A
公开(公告)日:2018-07-20
申请号:CN201810090633.4
申请日:2018-01-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了文字检测方法和装置。该方法的一具体实施方式包括:采用特征提取网络对待检测图像进行多个抽象层级的特征提取;采用字符检测网络预测出待检测图像中每个像素点为字符像素点的概率、以及每个像素点为字符像素点时该像素点相对于其所在的字符的包围盒的位置信息;基于字符检测网络的预测结果确定出各候选字符的包围盒的位置信息;将提取出特征输入字符映射网络,对字符映射网络输出的特征图进行变换,生成字符向量;在待检测图像中确定各候选字符的近邻候选字符,并将各候选字符与相关的近邻候选字符连接为字符组;根据字符组中各候选字符的包围盒的位置信息确定待检测图像的文字区域。该实施方式提升了不规则文字检测的准确度。
-
公开(公告)号:CN106845530B
公开(公告)日:2018-09-11
申请号:CN201611262299.3
申请日:2016-12-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了字符检测方法和装置。该方法的一具体实施方式包括:将包含经标注的词语的图片作为机器学习模型的输入;基于被预测出的位于经标注的词语的标注区域内的字符的预测结果和经标注的词语的标注信息,从被预测出的位于经标注的词语的标注区域内的字符中选取出用于训练机器学习模型的字符;基于选取出的字符的特征,对机器学习模型进行训练。实现了利用既有的词级别标注的图片即可对机器学习模型进行充分地训练,得到可对图片中的字符进行检测的机器学习模型,降低了训练可对图片中的字符进行检测的机器学习模型的开销。
-
公开(公告)号:CN108052937A
公开(公告)日:2018-05-18
申请号:CN201711460633.0
申请日:2017-12-28
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06K9/00463 , G06F17/241 , G06K9/6256 , G06K2209/01 , G06N3/04 , G06N3/08 , G06K9/2054 , G06K9/342
Abstract: 本发明提出一种基于弱监督的字符检测器训练方法、装置、文字检测系统及计算机可读存储介质,其中基于弱监督的字符检测器训练方法包括:输入待处理对象的粗粒度标注信息,粗粒度标注信息包括待处理对象的基于词、文本条和/或行的标注信息;对粗粒度标注信息的多边形进行分割,获得所述待处理对象的字符的粗包围盒;根据粗粒度标注信息,通过神经网络模型获得所述待处理对象的字符的预测包围盒;根据粗包围盒和所述预测包围盒确定所述待处理对象的字符的精细包围盒,将所述精细包围盒的标注信息作为所述待处理对象的字符标注。本发明提供的实施例能够使文字字符检测器利用更多的文字检测数据集进行训练,使模型在字符级别的检测精度显著提高。
-
-
-
-
-