文本检测方法、文本识别方法及装置

    公开(公告)号:CN114359932A

    公开(公告)日:2022-04-15

    申请号:CN202210028960.3

    申请日:2022-01-11

    Abstract: 本公开提供了一种文本检测方法、文本识别方法及装置,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于光学字符识别等场景,文本检测方法为:获取待识别图像中文本条的图像特征,对待识别图像进行视觉增强处理,得到待识别图像的增强特征图,对文本条的图像特征与增强特征图进行相似性比对,得到在增强特征图上的文本条的目标包围盒。增强特征图从更多的维度对待识别图像的特征进行表征,使得确定出的包围盒具有较高的准确性和可靠性,且通过从文本条的包围盒和增强特征图的相似性比对确定文本条的包围盒,可以避免包围盒与文本条之间不匹配,使得包围盒具有较强的可靠性。

    端到端模型的训练方法与系统、及中文识别方法与系统

    公开(公告)号:CN110490191B

    公开(公告)日:2022-03-04

    申请号:CN201910640953.7

    申请日:2019-07-16

    Abstract: 本发明涉及图像识别领域,公开了一种端到端模型的训练方法、训练系统、中文识别方法及识别系统。所述训练方法包括:采用第一精标样本对端到端模型进行第一训练,以使与该第一训练相应的第一损失收敛;基于经第一训练的所述端到端模型,采用第二精标样本对在线候选匹配模型进行第二训练,以使与该第二训练相应的第二损失收敛;以及基于经第二训练的所述在线候选匹配模型,采用第三精标样本和弱标样本对经第一训练的所述端到端模型进行第三训练,以使与该第三训练相应的第三损失收敛。本发明可克服大量精标样本的获取成本高及获取难度大的瓶颈,大幅度地降低模型训练过程中对大量精标样本的依赖性,从而极大地提升模型的中文识别能力。

    模型确定方法、装置、电子设备和存储器

    公开(公告)号:CN113947700A

    公开(公告)日:2022-01-18

    申请号:CN202111212317.8

    申请日:2021-10-18

    Abstract: 本公开提供了一种模型确定方法、装置、电子设备和存储器,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习领域,可应用于图像处理、图像识别等场景。具体实现方案为:获取图像样本和文本样本,其中,文本样本中的文本用于对图像样本中的目标图像进行文字描述;将图像样本中的图像特征存储至第一队列,且将文本样本中的文本特征存储至第二队列;对第一队列和第二队列进行训练,得到第一目标模型;将第一目标模型确定为第二目标模型的初始化模型,解决了初始化模型训练的效率低的技术问题。

    结算方法、装置、电子设备以及存储介质

    公开(公告)号:CN113362543A

    公开(公告)日:2021-09-07

    申请号:CN202110558542.0

    申请日:2021-05-21

    Abstract: 本公开提供了结算方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,可应用于图像识别场景下。具体实现方案为:通过摄像头采集目标物品的图像并通过称重台获取目标物品的重量;对目标物品的图像进行识别,获取图像中目标物品对应的特征;根据目标物品对应的特征与预先确定的至少一个物品类别对应的聚类中心,确定目标物品所属的目标类别;根据目标物品对应的特征与目标类别下至少一个子类别物品对应的特征,确定目标物品所属的目标子类别;根据目标物品的目标子类别及目标物品的重量,对目标物品进行结算。由此,提高了目标物品的结算效率和准确性,降低了结算的人力成本。

    图像处理方法、装置、设备和介质

    公开(公告)号:CN112949415A

    公开(公告)日:2021-06-11

    申请号:CN202110156565.9

    申请日:2021-02-04

    Abstract: 本公开公开了一种图像处理方法、装置、设备和介质,涉及人工智能技术领域,具体涉及计算机视觉、深度学习等技术领域。该图像处理方法包括:获取图像中至少一个文本区域的各个文本区域的多模态特征,所述多模态特征包括多个维度的特征;对所述各个文本区域的多模态特征进行全局注意力处理,以得到所述各个文本区域的全局注意力特征;基于所述各个文本区域的全局注意力特征,确定所述各个文本区域的类别,基于所述各个文本区域的文本内容和所述类别构建结构化信息。本公开可以提供更具有普适性的图像中的结构化信息的构建方案。

    移动终端执行的车辆定损方法、装置、移动终端、介质

    公开(公告)号:CN112712498A

    公开(公告)日:2021-04-27

    申请号:CN202011559563.6

    申请日:2020-12-25

    Abstract: 本公开的实施例提供了一种由移动终端执行的车辆定损方法、装置、移动终端、介质以及计算机程序产品。本公开涉及人工智能领域,具体涉及计算机视觉和深度学习技术。实现方案为:采集至少一个输入图像;在至少一个输入图像中检测车辆标识信息;在至少一个输入图像中检测车辆损伤信息;基于车辆标识信息和车辆损伤信息确定车辆定损结果。利用本公开的实施例提供的方法,可以在移动终端处离线地执行车辆定损而无需将拍摄的图像发送到云端,从而可以实现定损过程实时性高、网络延迟小、节省网络服务资源、节省网络带宽费用的效果。

    信息处理方法、信息处理装置、电子设备和存储介质

    公开(公告)号:CN112052835A

    公开(公告)日:2020-12-08

    申请号:CN202011057666.2

    申请日:2020-09-29

    Abstract: 本申请公开了一种信息处理方法、信息处理装置、电子设备和计算机可读存储介质,涉及计算机视觉、深度学习、自然语言处理等人工智能领域。在本公开的信息处理方法中,计算设备可以首先识别图像中的多个文本项。然后,计算设备可以基于多个文本项的语义,将多个文本项划分为名称文本项的第一集合和内容文本项的第二集合。接着,计算设备可以基于多个文本项在图像中的布置,执行第一集合和第二集合的匹配,以确定与第一集合的名称文本项匹配的第二集合的内容文本项。然后,计算设备可以输出匹配的名称文本项和内容文本项。本公开的实施例可以提高用于识别和提取图像中的结构化信息的方法或系统的性能。

    图像识别方法、装置、设备和计算机存储介质

    公开(公告)号:CN111767846A

    公开(公告)日:2020-10-13

    申请号:CN202010605404.9

    申请日:2020-06-29

    Abstract: 本申请公开了一种图像识别方法,涉及人工智能技术领域,尤其涉及图像处理技术领域。具体实现方案为:将预处理的人脸图像进行五官识别,并在人脸图像中标注人脸五官的位置,得到标注的人脸图像;确定标注的人脸图像的多尺度下的人脸图像,将多尺度的人脸图像输入主干网络模型进行特征提取,获得多种尺度下每一种尺度的人脸图像的皱纹特征;将位于人脸图像同一区域的每一种尺度的皱纹特征进行融合,获得人脸图像的皱纹识别结果。本申请实施例具有较高的皱纹识别精度,且不易受光照等外界环境的影响。

Patent Agency Ranking