-
公开(公告)号:CN115690016A
公开(公告)日:2023-02-03
申请号:CN202211287536.7
申请日:2022-10-20
Applicant: 北京百度网讯科技有限公司
IPC: G06T7/00 , G06T7/11 , G06V10/764 , G06N3/0464
Abstract: 本公开提供了图像质量检测方法、装置、电子设备及存储介质,涉及深度学习、计算机视觉以及图像处理等人工智能领域,其中的方法可包括:对待处理图像进行切分操作,得到M个图像块,M为大于一的正整数,任意两个图像块之间均不存在重叠区域;将M个图像块作为网络分类模型的输入,得到输出的待处理图像的质量分类结果,网络分类模型中包括至少两层卷积层,其中,第一层卷积层为采用深度可分离卷积方式的卷积层。应用本公开所述方案,可提升分类结果的准确性等。
-
公开(公告)号:CN115328895A
公开(公告)日:2022-11-11
申请号:CN202210784523.4
申请日:2022-07-05
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/215 , G06V30/19
Abstract: 本公开提供了一种光学字符识别处理方法、装置、设备及存储介质,涉及人工智能领域,尤其涉及深度学习、图像处理、计算机视觉技术领域,可应用于光学字符识别等场景。具体实现方案为:获取待清洗样本集。其中,待清洗样本集中包括携带标注信息的文本识别图像。在待清洗样本集中确定标注脏样本。其中,标注脏样本为携带错误标注信息的文本识别图像。之后,在待清洗样本集中清洗标注脏样本,得到清洗后样本集。然后,可以利用清洗后样本集进行OCR处理。本公开通过自动对待清洗样本集进行清洗,去除标注错误的标注脏样本。使得利用去除标注脏样本后的样本集进行OCR处理时,提升OCR识别准确率。
-
公开(公告)号:CN112966522B
公开(公告)日:2022-10-14
申请号:CN202110235776.1
申请日:2021-03-03
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开公开了一种图像分类方法,装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习方面。具体实现方案为:将待分类的文档图像输入到预先训练好的神经网络模型中,通过神经网络模型得到待分类的文档图像的各个文本框的特征子图;将各个文本框的特征子图与各个文本框的文本信息对应的语义特征和位置信息对应的位置特征输入至多模态特征融合模型中,通过多模态特征融合模型将三者融合为各个文本框对应的多模态特征;基于各个文本框对应的多模态特征对待分类的文档图像进行分类。本申请实施例能够很好地利用文档图像中存在的语义特征和位置特征,最终达到提升文档图像的分类精度的目的。
-
公开(公告)号:CN115019037A
公开(公告)日:2022-09-06
申请号:CN202210516748.1
申请日:2022-05-12
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/26 , G06V10/774 , G06V10/764
Abstract: 本公开提供了一种对象分割方法及对应模型的训练方法、装置及存储介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于光学字符识别(Optical Character Recognition;OCR)等场景。具体实现方案为:基于原始图像,获取所述原始图像的语义分割特征;基于所述原始图像和语言表达,获取所述语言表达描述的待分割对象在所述原始图像中的定位特征;基于所述语义分割特征和所述定位特征,获取所述待分割对象在所述原始图像中的分割图。本公开的技术,能够有效地提高待分割对象的分割图的准确性,有效地极提升了引用实例分割的效果。
-
公开(公告)号:CN114973258A
公开(公告)日:2022-08-30
申请号:CN202210564943.1
申请日:2022-05-23
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种图像处理方法和装置,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。实现方案为:获得包括沿第一方向排列的多个字符的目标图像,多个字符中的每一个字符来自预设字符集并且在预设标签集中具有相应的标签;获得目标图像对应的识别结果集,识别结果集中的每一个识别结果包括来自预设标签集的按顺序排列的多个标签和该多个标签中的每一个标签的置信度;以及基于识别结果集,获得目标图像的图像标签,图像标签包括来自预设标签集的按顺序排列的多个标签。
-
公开(公告)号:CN114937277A
公开(公告)日:2022-08-23
申请号:CN202210543075.9
申请日:2022-05-18
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/413 , G06V30/18 , G06V30/19 , G06V10/82
Abstract: 本公开提供了一种基于图像的文本获取方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于光学字符识别(Optical Character Recognition,OCR)等场景。具体实现方案为:获取文档图像,文档图像包括:文本内容,获取文档图像的图像网格特征,根据图像网格特征,获取与文本内容对应的视觉语义特征,根据视觉语义特征,从文档图像中获取目标文本。由于文档图像的图像网格特征能够表征文档图像中所包含内容的空间维度特征和语义维度特征,实现联合文档图像的空间维度特征和语义维度特征,识别出文档图像中所包含文本内容的视觉语义特征,有效丰富了视觉语义特征的空间语义信息,有效提升目标文本获取的准确性。
-
公开(公告)号:CN114821622A
公开(公告)日:2022-07-29
申请号:CN202210234230.9
申请日:2022-03-10
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/416 , G06V30/414 , G06V30/42 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本公开提供了一种文本抽取方法、文本抽取模型训练方法、装置及设备,涉及人工智能技术领域,尤其涉及计算机视觉技术领域。具体实现方案为:获取待检测图像的视觉编码特征;从待检测图像中提取多组多模态特征,其中,每组多模态特征包括从待检测图像中提取的一个检测框的位置信息、该检测框中的检测特征以及该检测框中的第一文本信息;基于视觉编码特征、待抽取属性以及多组多模态特征,从多组多模态特征包括的第一文本信息中,获取与待抽取属性匹配的第二文本信息,待抽取属性为需要被抽取的文本信息的属性。该方案可以对多种版式的证件票据进行文本信息抽取,提高了抽取效率。
-
公开(公告)号:CN114782771A
公开(公告)日:2022-07-22
申请号:CN202210335680.7
申请日:2022-03-30
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/774 , G06V10/82 , G06V10/74 , G06N3/08 , G06N3/04 , G06K9/62 , G06F16/583
Abstract: 本公开提供了一种训练方法、图像检索方法、图像处理方法、装置及设备,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习领域。深度学习模型包括第一模型或第二模型,具体实现方案为:利用子模型处理样本图像,得到样本图像特征数据;利用子模型处理样本图像特征数据和样本任务特征数据,得到样本实例特征数据,其中,样本任务特征数据是根据样本图像确定的;基于对比损失函数,利用至少两个样本实例特征数据,训练至少两个子模型,其中,至少两个子模型的训练数据不同;根据训练后的子模型得到经训练的深度学习模型。
-
公开(公告)号:CN114549695A
公开(公告)日:2022-05-27
申请号:CN202210032582.6
申请日:2022-01-12
Applicant: 北京百度网讯科技有限公司
IPC: G06T11/60 , G06F40/30 , G06F16/55 , G06F16/583
Abstract: 本公开提供了一种图像生成方法、装置、电子设备及可读存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于文字识别等场景。其中,图像生成方法包括:获取第一图像,得到所述第一图像中的文本内容;根据所述文本内容,确定目标文本库;根据所述第一图像与所述目标文本库中的目标文本,生成第二图像。本公开能够简化图像生成时的步骤,提升图像生成时的效率。
-
公开(公告)号:CN114428677A
公开(公告)日:2022-05-03
申请号:CN202210110164.4
申请日:2022-01-28
Applicant: 北京百度网讯科技有限公司
IPC: G06F9/48
Abstract: 本公开提供了一种任务处理方法、处理装置、电子设备及存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:响应于接收到任务处理请求,根据任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据,其中,任务标注数据的标签信息与任务类型标识相匹配,任务标注数据包括第一任务标注数据和第二任务标注数据;利用第一任务标注数据训练待训练模型,得到多个候选模型,其中,待训练模型是根据任务类型标识确定的;根据利用第二任务标注数据对多个候选模型进行性能评估得到的性能评估结果,从多个候选模型中确定目标模型。
-
-
-
-
-
-
-
-
-