-
公开(公告)号:CN113971810A
公开(公告)日:2022-01-25
申请号:CN202111260590.8
申请日:2021-10-27
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/413 , G06V30/414 , G06V10/774 , G06V10/82 , G06V10/764 , G06K9/62
Abstract: 本公开提供了文档生成方法、装置、平台、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,可应用于文字识别等场景。具体实现方案为:对文档图片进行类别识别,得到目标类别结果;确定与目标类别结果相匹配的目标结构化模型;以及利用目标结构化模型,对文档图片进行结构识别,得到结构识别结果,以便基于结构识别结果生成电子文档,结构识别结果包括字段属性识别结果和字段位置识别结果。
-
公开(公告)号:CN113420174B
公开(公告)日:2024-01-09
申请号:CN202110571530.1
申请日:2021-05-25
Applicant: 北京百度网讯科技有限公司
Inventor: 张栋栋
IPC: G06F16/583 , G06F16/55
Abstract: 本公开提供了一种难样本挖掘方法、装置、设备、存储介质以及程序产品,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图像识别场景下。该方法的一具体实施方式包括:获取目标垂类票据图像集;将目标垂类票据图像集中的目标垂类票据图像输入至结构化信息提取模型,得到目标垂类票据图像的字段检测框;将目标垂类票据图像和字段检测框输入至垂类挖掘模型,得到目标垂类票据图像对应的得分,其中,得分用于表征字段检测框与字段真实框之间的差异;基于得分从目标垂类票据图像集中选取难样本票据图像。该实施方式降低了挖掘难样本的成本。
-
公开(公告)号:CN114428677A
公开(公告)日:2022-05-03
申请号:CN202210110164.4
申请日:2022-01-28
Applicant: 北京百度网讯科技有限公司
IPC: G06F9/48
Abstract: 本公开提供了一种任务处理方法、处理装置、电子设备及存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:响应于接收到任务处理请求,根据任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据,其中,任务标注数据的标签信息与任务类型标识相匹配,任务标注数据包括第一任务标注数据和第二任务标注数据;利用第一任务标注数据训练待训练模型,得到多个候选模型,其中,待训练模型是根据任务类型标识确定的;根据利用第二任务标注数据对多个候选模型进行性能评估得到的性能评估结果,从多个候选模型中确定目标模型。
-
公开(公告)号:CN114120346A
公开(公告)日:2022-03-01
申请号:CN202111229111.6
申请日:2021-10-21
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/413
Abstract: 本公开提供了一种内容识别方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于光学字符识别(Optical Character Recognition,OCR)等场景下。具体实现方案为:获取待识别图像,确定待识别图像的内容类型,确定与内容类型相关的内容识别模型,以及采用内容识别模型对待识别图像进行内容识别,以得到目标内容。由此,实现根据内容类型灵活地筛选出匹配的内容识别模型,以辅助图像识别,从而实现对待识别图像进行针对性的识别处理,提升针对图像的内容识别效率,提升内容识别的灵活性,提升内容识别效果。
-
公开(公告)号:CN113420174A
公开(公告)日:2021-09-21
申请号:CN202110571530.1
申请日:2021-05-25
Applicant: 北京百度网讯科技有限公司
Inventor: 张栋栋
IPC: G06F16/583 , G06F16/55
Abstract: 本公开提供了一种难样本挖掘方法、装置、设备、存储介质以及程序产品,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图像识别场景下。该方法的一具体实施方式包括:获取目标垂类票据图像集;将目标垂类票据图像集中的目标垂类票据图像输入至结构化信息提取模型,得到目标垂类票据图像的字段检测框;将目标垂类票据图像和字段检测框输入至垂类挖掘模型,得到目标垂类票据图像对应的得分,其中,得分用于表征字段检测框与字段真实框之间的差异;基于得分从目标垂类票据图像集中选取难样本票据图像。该实施方式降低了挖掘难样本的成本。
-
公开(公告)号:CN114428677B
公开(公告)日:2023-09-12
申请号:CN202210110164.4
申请日:2022-01-28
Applicant: 北京百度网讯科技有限公司
IPC: G06F9/48
Abstract: 本公开提供了一种任务处理方法、处理装置、电子设备及存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:响应于接收到任务处理请求,根据任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据,其中,任务标注数据的标签信息与任务类型标识相匹配,任务标注数据包括第一任务标注数据和第二任务标注数据;利用第一任务标注数据训练待训练模型,得到多个候选模型,其中,待训练模型是根据任务类型标识确定的;根据利用第二任务标注数据对多个候选模型进行性能评估得到的性能评估结果,从多个候选模型中确定目标模型。
-
-
-
-
-