-
公开(公告)号:CN111523292B
公开(公告)日:2023-09-15
申请号:CN202010325580.7
申请日:2020-04-23
Applicant: 北京百度网讯科技有限公司
IPC: G06F40/166 , G06V30/413 , G06V30/414 , G06V30/148
Abstract: 本申请公开了用于获取图像信息的方法和装置,涉及计算机视觉技术领域。具体实施方式包括:利用深度神经网络,对待处理图像进行检测,得到所述待处理图像中目标的类别和位置,其中,所述待处理图像包括至少一个类别的目标;基于所得到的位置对应的类别,解析所得到的位置的目标,得到可编辑的解析结果;按照各个所述解析结果在所述待处理图像中对应的所得到的位置,进行文档重建,得到可编辑文档。本申请可以基于各个位置对应的类别,准确地解析在各个位置的目标,并且可以基于至少一个目标的类别中各个目标的类别,对图像进行更加全面的解析。
-
公开(公告)号:CN111539438B
公开(公告)日:2024-01-12
申请号:CN202010349150.9
申请日:2020-04-28
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/148 , G06V30/14
Abstract: 本申请公开了一种文本内容的识别方法、装置及电子设备,涉及计算机技术领域中的文本识别技术。具体实现方案为:获取表盘图片;检测所述表盘图片中的至少一根文本中心线以及与每一文本中心线对应的包围框;基于所述至少一根文本中心线以及与每一文本中心线对应的包围框,识别所述表盘图片中的每一行文本的文本内容。这样,电子设备可以准确且快速地识别表盘图片中的文本内容,从而提升仪表盘的计量内容的识别准确度以及效率。
-
公开(公告)号:CN111507355B
公开(公告)日:2023-08-22
申请号:CN202010307924.1
申请日:2020-04-17
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/148
Abstract: 本申请公开了一种字符识别方法、装置、设备和存储介质,涉及字符识别技术领域。具体实现方案为:获取待识别对象中目标字符位置的第一视觉特征;依据所述第一视觉特征生成所述目标字符位置的语义特征;基于所述第一视觉特征和所述语义特征,识别所述目标字符位置的字符。本申请可以提高字符识别的效果。
-
公开(公告)号:CN110377591A
公开(公告)日:2019-10-25
申请号:CN201910506752.8
申请日:2019-06-12
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/215 , G06K9/62
Abstract: 本发明公开了训练数据清洗方法、装置、计算机设备及存储介质,其中方法可包括:获取识别模型对输入的作为训练数据的任一图片序列及对应的标注文本进行预定处理后得到的CTC解码结果;根据CTC解码结果构建置信度矩阵;根据置信度矩阵确定出图片序列是否为脏数据。应用本发明所述方案,可提高处理结果的准确性等。
-
公开(公告)号:CN110287951B
公开(公告)日:2022-04-12
申请号:CN201910546270.5
申请日:2019-06-21
Applicant: 北京百度网讯科技有限公司
Abstract: 本发明实施例提出一种文字识别的方法及装置。所述方法包括:获得待识别的目标图像,以及与所述目标图像上的文字对应的语种信息;将所述目标图像和所述语种信息输入融合语种信息的文字识别模型,获得识别结果。本发明实施例能够通过融合语种信息的文字识别模型,对多个语种的文字图片进行文字识别,适用范围广,简化模型部署。
-
-
公开(公告)号:CN111860479B
公开(公告)日:2024-03-26
申请号:CN202010550694.1
申请日:2020-06-16
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/14 , G06V30/148 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/09
Abstract: 本申请公开了光学字符识别方法、装置、电子设备及存储介质,涉及人工智能领域和深度学习领域,其中的方法可包括:针对待识别的图片,确定出其中的文本区域的包围框,根据所述包围框从待识别的图片中提取出文本区域图片;确定出文本区域图片中的文本行的包围框,根据所述包围框从文本区域图片中提取出文本行图片;对文本行图片进行文本序列识别,得到识别结果。应用本申请所述方案,可提升识别速度等。
-
公开(公告)号:CN110377591B
公开(公告)日:2022-02-25
申请号:CN201910506752.8
申请日:2019-06-12
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/215 , G06K9/62 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
-
公开(公告)号:CN111860479A
公开(公告)日:2020-10-30
申请号:CN202010550694.1
申请日:2020-06-16
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了光学字符识别方法、装置、电子设备及存储介质,涉及人工智能领域和深度学习领域,其中的方法可包括:针对待识别的图片,确定出其中的文本区域的包围框,根据所述包围框从待识别的图片中提取出文本区域图片;确定出文本区域图片中的文本行的包围框,根据所述包围框从文本区域图片中提取出文本行图片;对文本行图片进行文本序列识别,得到识别结果。应用本申请所述方案,可提升识别速度等。
-
公开(公告)号:CN111539438A
公开(公告)日:2020-08-14
申请号:CN202010349150.9
申请日:2020-04-28
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种文本内容的识别方法、装置及电子设备,涉及计算机技术领域中的文本识别技术。具体实现方案为:获取表盘图片;检测所述表盘图片中的至少一根文本中心线以及与每一文本中心线对应的包围框;基于所述至少一根文本中心线以及与每一文本中心线对应的包围框,识别所述表盘图片中的每一行文本的文本内容。这样,电子设备可以准确且快速地识别表盘图片中的文本内容,从而提升仪表盘的计量内容的识别准确度以及效率。
-
-
-
-
-
-
-
-
-