-
公开(公告)号:CN108052937B
公开(公告)日:2019-05-31
申请号:CN201711460633.0
申请日:2017-12-28
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06K9/00463 , G06F17/241 , G06K9/6256 , G06K2209/01 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种基于弱监督的字符检测器训练方法、装置、文字检测系统及计算机可读存储介质,其中基于弱监督的字符检测器训练方法包括:输入待处理对象的粗粒度标注信息,粗粒度标注信息包括待处理对象的基于词、文本条和/或行的标注信息;对粗粒度标注信息的多边形进行分割,获得所述待处理对象的字符的粗包围盒;根据粗粒度标注信息,通过神经网络模型获得所述待处理对象的字符的预测包围盒;根据粗包围盒和所述预测包围盒确定所述待处理对象的字符的精细包围盒,将所述精细包围盒的标注信息作为所述待处理对象的字符标注。本发明提供的实施例能够使文字字符检测器利用更多的文字检测数据集进行训练,使模型在字符级别的检测精度显著提高。
-
公开(公告)号:CN103123691B
公开(公告)日:2019-02-12
申请号:CN201310060300.4
申请日:2013-02-26
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06K9/36
Abstract: 本发明提供了一种莫尔条纹的过滤方法和装置,其中方法包括:S1、对当前的图像进行莫尔条纹检测,如果检测到莫尔条纹,则执行步骤S2;如果未检测到莫尔条纹,则结束流程;S2、采用预设窗口对当前的图像进行高斯平滑后,转至步骤S1进行下一轮莫尔条纹的过滤,直至达到预设的轮数;其中每一轮莫尔条纹的过滤中在步骤S2中采用的预设窗口大小递增。本发明尽可能大程度地减少对图像无莫尔条纹时图像的误伤,也尽可能地减少了因过滤方式选择不当所造成的过滤不完全或者过滤过当的问题,提高了基于莫尔条纹过滤的图像整体识别效果。
-
公开(公告)号:CN106845530A
公开(公告)日:2017-06-13
申请号:CN201611262299.3
申请日:2016-12-30
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06K9/6227 , G06K9/4604 , G06K2209/01 , G06N3/0454 , G06K9/6262 , G06K9/6256 , G06N3/08
Abstract: 本申请公开了字符检测方法和装置。该方法的一具体实施方式包括:将包含经标注的词语的图片作为机器学习模型的输入;基于被预测出的位于经标注的词语的标注区域内的字符的预测结果和经标注的词语的标注信息,从被预测出的位于经标注的词语的标注区域内的字符中选取出用于训练机器学习模型的字符;基于选取出的字符的特征,对机器学习模型进行训练。实现了利用既有的词级别标注的图片即可对机器学习模型进行充分地训练,得到可对图片中的字符进行检测的机器学习模型,降低了训练可对图片中的字符进行检测的机器学习模型的开销。
-
公开(公告)号:CN103347091B
公开(公告)日:2016-12-28
申请号:CN201310306643.4
申请日:2013-07-19
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 韩钧宇
Abstract: 本发明提出一种文档注释的共享方法,包括:云端服务器获取并保存第一用户发送的针对文档信息的至少一个注释信息;云端服务器接收第一用户针对至少一个注释信息分别设置的多个第二用户的共享权限;当多个第二用户访问至少一个注释信息时,云端服务器根据共享权限提供共享编辑功能给多个第二用户,以使多个第二用户根据共享权限实现共享编辑。本方法通过设置的针对所接收的第一用户发送的针对文档信息的至少一个注释信息的多个第二用户的共享权限,当多个第二用户访问至少一个注释信息时,云端服务器根据共享权限提供共享编辑功能给多个第二用户,具有对文档进行编辑的实时性与高效性,以及提高了用户的共享体验性。本发明还提出了一种云端服务器。
-
公开(公告)号:CN103984772A
公开(公告)日:2014-08-13
申请号:CN201410244830.9
申请日:2014-06-04
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 韩钧宇
IPC: G06F17/30
CPC classification number: G06F17/30796
Abstract: 本发明实施例公开了一种文本检索字幕库生成方法和装置、视频检索方法和装置。文本检索字幕库生成方法包括:根据预设的语种类型,获取与视频对应的至少两个语种类型的语种检索字幕;将视频库中与各视频对应的语种检索字幕的合集,作为文本检索字幕库;视频检索方法包括:获取文本检索字幕库中与输入检索词对应的至少一个匹配字幕语句集;根据所述匹配字幕语句集获取对应的视频信息,作为所述输入检索词的检索结果。本发明通过在视频检索服务中增加字幕检索,优化了现有的视频检索服务,为用户提供了一种基于台词的视频字幕检索服务,提高了视频检索服务的个性化和便捷化。
-
公开(公告)号:CN103390282A
公开(公告)日:2013-11-13
申请号:CN201310325576.0
申请日:2013-07-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T7/00
Abstract: 本发明提供了一种图像标注方法和装置。所述图像标注方法,包括:显示待标注图像;获取在待标注图像中已标注的关键点集合;根据所述待标注图像中已标注的关键点集合和预置的关键点模板集合,预测所述待标注图像中下一个待标注关键点的标注位置;将所述标注点的位置移动至所述预测的标注位置;接收用户对所述标注点的位置调整,并将所述标注点在实际位置标注的关键点添加至所述已标注的关键点集合。采用本发明所述方法及装置,不仅能够大幅度提高标注的效率,而且能够有效保证标注的准确性,从而获得优质的采集数据。
-
公开(公告)号:CN103347091A
公开(公告)日:2013-10-09
申请号:CN201310306643.4
申请日:2013-07-19
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 韩钧宇
Abstract: 本发明提出一种文档注释的共享方法,包括:云端服务器获取并保存第一用户发送的针对文档信息的至少一个注释信息;云端服务器接收第一用户针对至少一个注释信息分别设置的多个第二用户的共享权限;当多个第二用户访问至少一个注释信息时,云端服务器根据共享权限提供共享编辑功能给多个第二用户,以使多个第二用户根据共享权限实现共享编辑。本方法通过设置的针对所接收的第一用户发送的针对文档信息的至少一个注释信息的多个第二用户的共享权限,当多个第二用户访问至少一个注释信息时,云端服务器根据共享权限提供共享编辑功能给多个第二用户,具有对文档进行编辑的实时性与高效性,以及提高了用户的共享体验性。本发明还提出了一种云端服务器。
-
公开(公告)号:CN104156694B
公开(公告)日:2019-03-19
申请号:CN201410342455.1
申请日:2014-07-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06K9/00
Abstract: 本发明的目的是提供一种识别图像中的目标对象的方法与设备。具体地,根据经用户涂覆的第一图像确定所述第一图像中被涂覆的第二图像;识别所述第二图像中的一个或多个候选对象;根据所述一个或多个候选对象确定与所述第二图像所对应的涂覆区域信息相匹配的一个或多个目标对象。与现有技术相比,本发明识别到的目标对象与所述第二图像所对应的涂覆区域信息相匹配,即与用户涂覆的涂覆区域相匹配,从而实现了在准确识别用户的真实需求,并能够比较精细的识别用户涂覆区域的同时,提高了对用户涂覆的涂覆区域中的内容进行识别的准确度,相应地,也提高了用户获取信息的效率,并提升了用户的识别体验以及用户对识别结果的满意度。
-
公开(公告)号:CN108052937A
公开(公告)日:2018-05-18
申请号:CN201711460633.0
申请日:2017-12-28
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06K9/00463 , G06F17/241 , G06K9/6256 , G06K2209/01 , G06N3/04 , G06N3/08 , G06K9/2054 , G06K9/342
Abstract: 本发明提出一种基于弱监督的字符检测器训练方法、装置、文字检测系统及计算机可读存储介质,其中基于弱监督的字符检测器训练方法包括:输入待处理对象的粗粒度标注信息,粗粒度标注信息包括待处理对象的基于词、文本条和/或行的标注信息;对粗粒度标注信息的多边形进行分割,获得所述待处理对象的字符的粗包围盒;根据粗粒度标注信息,通过神经网络模型获得所述待处理对象的字符的预测包围盒;根据粗包围盒和所述预测包围盒确定所述待处理对象的字符的精细包围盒,将所述精细包围盒的标注信息作为所述待处理对象的字符标注。本发明提供的实施例能够使文字字符检测器利用更多的文字检测数据集进行训练,使模型在字符级别的检测精度显著提高。
-
公开(公告)号:CN103984772B
公开(公告)日:2017-07-18
申请号:CN201410244830.9
申请日:2014-06-04
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 韩钧宇
IPC: G06F17/30
Abstract: 本发明实施例公开了一种文本检索字幕库生成方法和装置、视频检索方法和装置。文本检索字幕库生成方法包括:根据预设的语种类型,获取与视频对应的至少两个语种类型的语种检索字幕;将视频库中与各视频对应的语种检索字幕的合集,作为文本检索字幕库;视频检索方法包括:获取文本检索字幕库中与输入检索词对应的至少一个匹配字幕语句集;根据所述匹配字幕语句集获取对应的视频信息,作为所述输入检索词的检索结果。本发明通过在视频检索服务中增加字幕检索,优化了现有的视频检索服务,为用户提供了一种基于台词的视频字幕检索服务,提高了视频检索服务的个性化和便捷化。
-
-
-
-
-
-
-
-
-