一种从图像中提取文字行的方法及装置

    公开(公告)号:CN102930262A

    公开(公告)日:2013-02-13

    申请号:CN201210350550.7

    申请日:2012-09-19

    Abstract: 本发明提供了一种从图像中提取文字行的方法及装置,其中从图像中提取文字行的方法包括:A.对图像进行二值化处理,以得到所述图像的各个连通域;B.对不满足第一统计特征的连通域进行过滤,其中所述第一统计特征是对标注好的样本中提取的连通域描述特征进行统计学习后得到的属于文字连通域的统计特征;C.从过滤后的各个连通域中提取所述图像中的文字行。通过上述方式,本发明可以大大提高从图像中提取的文字行的准确性。

    一种基于图像文字识别的商品推送方法和装置

    公开(公告)号:CN102831200A

    公开(公告)日:2012-12-19

    申请号:CN201210279367.2

    申请日:2012-08-07

    Abstract: 本发明提供了一种基于图像文字识别的商品推送方法和装置,其中方法包括:S1、获取待识别图像中的文字区域;S2、对所述文字区域进行文字识别;S3、利用识别结果查询商品库获得识别结果对应的商品信息;S4、推送包含所述商品信息的商品查询列表。通过本发明用户能够通过上传图像的方式直接获取到商品信息,而无需人工通过搜索引擎从大量的搜索结果中搜寻商品信息,大大减少了用户操作,实现更加方便。

    模型蒸馏的方法和装置
    93.
    发明授权

    公开(公告)号:CN112529180B

    公开(公告)日:2024-05-24

    申请号:CN202011473801.1

    申请日:2020-12-15

    Abstract: 本申请公开了模型蒸馏的方法和装置,涉及人工智能技术领域,具体涉及深度学习和计算机视觉技术领域。具体实施方式包括:获得教师模型对应的批量教师特征和学生模型对应的批量学生特征;确定批量教师特征对应的教师相似度集合和批量学生特征对应的学生相似度集合;基于图像对应的相差值,确定该图像的特征的损失值的权重;对批量图像中各个图像的特征的损失值进行加权,利用加权结果训练学生模型。本申请可以利用学生模型和教师模型之间特征相似度的相差值,确定出损失值的权重,从而对模型进行准确地蒸馏。通过本申请的蒸馏过程可以提高模型的检测能力,有助于降低执行设备的延时,减少内存等计算资源的占用和消耗。

    车牌识别方法、车牌识别模型的训练方法和装置

    公开(公告)号:CN111832568B

    公开(公告)日:2024-01-12

    申请号:CN202010536808.7

    申请日:2020-06-12

    Abstract: 本申请公开了一种车牌识别方法,涉及人工智能、计算机视觉以及深度学习技术领域,具体涉及图像识别技术领域。具体实现方案为:通过获取车牌区域的特征图的多个特征向量;将多个特征向量,按照第一顺序依次输入第一循环神经网络进行编码,以得到每一个特征向量的第一编码;将多个特征向量,按照第二顺序依次输入第二循环神经网络进行编码,以得到每一个特征向量的第二编码;根据每一个特征向量的第一编码和每一个特征向量的第二编码,以生成多个特征向量的多个目标编码;以及对多个目标编码进行解码,以得到车牌中的多个字符。该方法中对提取的车牌区域的特征图包含的多个特征向量,分别采用循环神经网络进行正反向编码,从而使得

    结算方法、装置、电子设备以及存储介质

    公开(公告)号:CN113362543B

    公开(公告)日:2023-10-31

    申请号:CN202110558542.0

    申请日:2021-05-21

    Abstract: 本公开提供了结算方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,可应用于图像识别场景下。具体实现方案为:通过摄像头采集目标物品的图像并通过称重台获取目标物品的重量;对目标物品的图像进行识别,获取图像中目标物品对应的特征;根据目标物品对应的特征与预先确定的至少一个物品类别对应的聚类中心,确定目标物品所属的目标类别;根据目标物品对应的特征与目标类别下至少一个子类别物品对应的特征,确定目标物品所属的目标子类别;根据目标物品的目标子类别及目标物品的重量,对目标物品进行结算。由此,提高了目标物品的结算效率和准确性,降低了结算的人力成本。

    图像处理方法、图像处理装置、电子设备以及存储介质

    公开(公告)号:CN113962845B

    公开(公告)日:2023-08-29

    申请号:CN202110985605.0

    申请日:2021-08-25

    Abstract: 本公开提供了一种图像处理方法、图像处理装置、电子设备以及存储介质,涉及人工智能领域,尤其涉及计算机视觉和深度学习领域,可应用于人脸图像处理和人脸识别等场景。具体实现方案为:根据第一目标图像和第二目标图像,生成待处理图像,待处理图像中对象的身份信息与第一目标图像中对象的身份信息匹配;根据第二目标图像和待处理图像,生成解耦图像集,解耦图像集包括与待处理图像中对象的头部区域对应的头部解耦图像和与待处理图像中对象相关的待修复信息对应的修复解耦图像;根据解耦图像集,生成融合图像,融合图像中对象的身份信息和纹理信息分别与待处理图像中对象的身份信息和纹理信息匹配,与融合图像中对象相关的待修复信息已被修复。

    图像处理方法、图像处理模型的训练方法和装置

    公开(公告)号:CN116597454A

    公开(公告)日:2023-08-15

    申请号:CN202310597526.1

    申请日:2023-05-24

    Abstract: 本公开提供了一种图像处理方法、图像处理模型的训练方法、装置和设备,涉及人工智能技术领域,具体为计算机视觉、图像处理、深度学习等技术领域,可应用于OCR、智慧政务等场景。图像处理方法包括:对目标图像进行文本识别,得到多个文本区域和其各自的文本内容;提取表征多个文本区域的视觉模态信息的多个第一视觉特征和每一个文本区域所包括的文本内容的文本模态信息的多个第一文本特征;基于多个第一视觉特征将多个第一文本特征融合,以得到多个第一文本融合特征;基于多个第一文本特征将多个第一视觉特征融合,以得到多个第一视觉融合特征;基于注意力机制对多个第一视觉融合特征和多个第一文本融合特征进行强化进而得到图像处理结果。

Patent Agency Ranking