-
公开(公告)号:CN110287951B
公开(公告)日:2022-04-12
申请号:CN201910546270.5
申请日:2019-06-21
Applicant: 北京百度网讯科技有限公司
Abstract: 本发明实施例提出一种文字识别的方法及装置。所述方法包括:获得待识别的目标图像,以及与所述目标图像上的文字对应的语种信息;将所述目标图像和所述语种信息输入融合语种信息的文字识别模型,获得识别结果。本发明实施例能够通过融合语种信息的文字识别模型,对多个语种的文字图片进行文字识别,适用范围广,简化模型部署。
-
公开(公告)号:CN114283411A
公开(公告)日:2022-04-05
申请号:CN202111560326.6
申请日:2021-12-20
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种文本识别方法、文本识别模型的训练方法及装置,应用于工智能技术领域,具体为深度学习、计算机视觉技术领域,文本识别方法包括:获取待识别图像的图像序列特征,对所述图像序列特征进行解码处理,得到待识别图像的全量的文本字符串,对文本字符串进行语义增强处理,得到文本序列特征,其中,图像序列特征、文本字符串与文本序列特征的长度相同,根据文本字符串和文本序列特征,确定待识别图像的文本内容,使得识别过程更加全面和完善,不仅充分考虑了用以确定文本内容的元素的完整性和全面性,且考虑了用以确定文本内容的元素在语义理解层面的内容,从而实现了文本识别的准确性、有效性、以及可靠性的技术效果。
-
公开(公告)号:CN111595450B
公开(公告)日:2022-03-25
申请号:CN202010415405.7
申请日:2020-05-15
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开的实施例涉及一种用于测量温度方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及人工智能领域。该方法可以包括对输入图像中的对象的目标部位进行检测。该方法进一步包括基于目标部位的检测结果确定目标部位的关键点和关键点的权重信息,权重信息指示关键点被遮挡的概率。该方法还可以包括获取关键点的温度信息。此外,该方法可以进一步包括至少基于关键点的温度信息和权重信息,确定目标部位的温度。本公开的技术方案可以快速高效且低成本地获取行人的体温信息,从而降低温度测量的时间和人力成本。
-
公开(公告)号:CN113962845A
公开(公告)日:2022-01-21
申请号:CN202110985605.0
申请日:2021-08-25
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种图像处理方法、图像处理装置、电子设备以及存储介质,涉及人工智能领域,尤其涉及计算机视觉和深度学习领域,可应用于人脸图像处理和人脸识别等场景。具体实现方案为:根据第一目标图像和第二目标图像,生成待处理图像,待处理图像中对象的身份信息与第一目标图像中对象的身份信息匹配;根据第二目标图像和待处理图像,生成解耦图像集,解耦图像集包括与待处理图像中对象的头部区域对应的头部解耦图像和与待处理图像中对象相关的待修复信息对应的修复解耦图像;根据解耦图像集,生成融合图像,融合图像中对象的身份信息和纹理信息分别与待处理图像中对象的身份信息和纹理信息匹配,与融合图像中对象相关的待修复信息已被修复。
-
公开(公告)号:CN110378346B
公开(公告)日:2021-12-24
申请号:CN201910515396.6
申请日:2019-06-14
Applicant: 北京百度网讯科技有限公司
Abstract: 本发明提供一种建立文字识别模型的方法,所述方法包括:获取包含各文字图像以及各文字图像中所包含文字的识别结果的训练数据;确定包含构建模型结构的卷积神经网络和循环神经网络的各参数以及各参数的取值范围的搜索空间;分别从卷积神经网络以及循环神经网络的各参数的取值范围中进行采样,在利用各参数取值的采样结果得到模型结构序列之后,根据模型结构序列构建对应的模型结构;依据训练数据获取模型结构的奖励值,并确定奖励值是否满足预设条件,若否,则转至执行构建模型结构的步骤,直至模型结构的奖励值满足预设条件,输出模型结构作为最终模型结构;利用训练数据对最终模型结构进行训练,直至最终模型结构收敛,得到文字识别模型。
-
公开(公告)号:CN113657398A
公开(公告)日:2021-11-16
申请号:CN202110947890.7
申请日:2021-08-18
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了图像识别方法和装置,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域,具体可用于OCR光学字符识别等场景。具体实现方案为:获取待识别图像;将待识别图像输入预设的图像识别模型,得到与至少两个卡证图像中每一卡证图像对应的第一识别结果;根据第一识别结果所指示的类别,对与第一识别结果对应的卡证图像执行相应的识别操作,得到第二识别结果;汇总第二识别结果并输出。该方式有效提高了对多卡证图像进行识别的准确率和效率。
-
公开(公告)号:CN113656630A
公开(公告)日:2021-11-16
申请号:CN202110943222.7
申请日:2021-08-17
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/583 , G06K9/62
Abstract: 本公开提供了检索图像的方法、装置和系统,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图像处理和图像识别等场景下。具体实现方案为:响应于接收到包括目标图像的查询请求,从目标图像中检测目标主体;若检测到的目标主体的检测框的置信度大于第一阈值,则从目标主体中提取出主体特征,其中,主体特征包括相同特征、相似特征和类别;将目标图像的主体特征与数据库中预先存储的候选图像的主体特征进行匹配,得到候选图像的相似得分、相同得分;根据相似得分、相同得分选择预定数目个候选图像作为搜索结果输出。该实施方式实现了提高了检索的准确性。
-
公开(公告)号:CN113361522A
公开(公告)日:2021-09-07
申请号:CN202110698215.5
申请日:2021-06-23
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了用于确定字符序列的方法、装置、电子设备和计算机可读存储介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于智慧城市、智慧金融场景下。具体实现方案为:确定原始图像的图像特征数据;基于图像特征数据确定第一字符特征数据,第一字符特征数据至少包括原始图像中包括的多个字符的相应字符特征数据;基于第一字符特征数据,确定由多个字符组成的目标字符序列;从目标字符序列中获取第二字符特征数据,第二字符特征数据包含字符特征信息和字符序列特征信息;以及基于图像特征数据和第二字符特征数据,确定多个字符的更新的目标字符序列。本公开提升了字符序列识别结果的正确率,改善了用户体验。
-
公开(公告)号:CN110188755B
公开(公告)日:2021-09-07
申请号:CN201910464140.7
申请日:2019-05-30
Applicant: 北京百度网讯科技有限公司
Abstract: 本发明实施例提出一种图像识别的方法、装置和计算机可读存储介质,其中方法包括对输入图像进行文本识别,得到所述输入图像的文字信息及其位置;将所述输入图像的文字信息及其位置与预设的结构化模板中的关键特征进行匹配,得到各匹配对;基于各所述匹配对的位置关系,将所述输入图像的文字信息的位置调整为与所述结构化模板相同;从调整后的图像中提取所述文字信息。根据该变换矩阵将输入图像上的文字信息转换成与结构化模板一样的方向和大小,可以解决方向、旋转的问题。
-
公开(公告)号:CN110147786B
公开(公告)日:2021-06-29
申请号:CN201910290330.1
申请日:2019-04-11
Applicant: 北京百度网讯科技有限公司
Abstract: 根据本公开的示例实施例,提供了一种用于检测图像中的文本区域的方法、装置、设备以及介质。方法包括基于图像的特征表示来检测图像中的第一文本区域,其中第一文本区域覆盖图像中所占区域具有一定形状的文本。方法还包括基于第一文本区域的特征块来确定与文本相关联的文本几何信息,其中文本几何信息包括文本的文本中心线以及文本中心线与文本的上下边界的距离信息。方法还包括基于与文本相关联的文本几何信息来将第一文本区域调整为第二文本区域,其中第二文本区域也覆盖文本并且比第一文本区域更小。本公开的实施例在通用文本检测模块的基础上增加一个任意形状文本检测模块,能够获得更紧凑的文本检测结果,从而提高图像文本检测的精度。
-
-
-
-
-
-
-
-
-