车牌识别方法和装置
    43.
    发明公开

    公开(公告)号:CN110070085A

    公开(公告)日:2019-07-30

    申请号:CN201910359065.8

    申请日:2019-04-30

    Abstract: 本申请提出一种车牌识别方法和装置,其中,方法包括:从采集到的图像中,识别呈现车牌的图像区域;采用卷积神经网络对图像区域进行特征提取,得到图像区域的特征矩阵;将特征矩阵输入循环神经网络,以顺序识别出车牌各文本位置上的文本信息;其中,循环神经网络,用于根据特征矩阵中各元素对相应文本位置的注意力权重进行文本识别。该方法既能够实现对单行车牌进行识别,又能够实现对双行车牌进行识别,可以提升该方法的适用性。并且,无需对图像区域进行切分,再进行单字分割识别,可以减少算法的步骤,能够实现提升车牌识别的效率和准确性。

    批注电子文档的方法和装置

    公开(公告)号:CN103500158A

    公开(公告)日:2014-01-08

    申请号:CN201310463942.9

    申请日:2013-10-08

    Inventor: 韩钧宇

    Abstract: 提供了一种在终端设备中批注电子文档的方法和装置,所述方法包括:获取用户在所述电子文档中针对选定的批注区域输入的批注信息;根据获取的批注信息向所述用户推荐至少一个批注类别,以便用户选择;将用户选择的批注类别确定为所述获取的批注信息所属的批注类别。采用本发明所述方法及装置不仅能够实现对电子文档中各种批注信息的准确、有效地分类,而且通过分类显示批注信息还能够让用户在阅读过程中迅速定位到想要关注的批注信息,从而进一步增强了用户体验。

    一种基于语音输入的图像信息提取分析方法及装置

    公开(公告)号:CN103064936A

    公开(公告)日:2013-04-24

    申请号:CN201210568735.5

    申请日:2012-12-24

    Inventor: 韩钧宇

    Abstract: 本发明提供了一种基于语音输入的图像信息提取分析方法及装置,其中,方法包括:预先建立像信息提取场景库;S1、根据用户输入的语音,获取用户的信息提取意图;S2、根据所述用户的信息提取意图查询图像信息提取场景库,与各文字描述标签进行匹配,并获取匹配得到的文字描述标签对应的图像信息提取场景;S3、根据所获取的图像信息提取场景对目标图像进行目标对象识别,将识别结果返回给用户。本发明能够综合各种不同类别的图像信息提取软件所具有的功能,同时,能够根据用户输入的语音,智能地提取目标图像中的对应信息并进行分析处理,显著减少了用户的交互负担。

    移动终端执行的车辆定损方法、装置、移动终端、介质

    公开(公告)号:CN112712498B

    公开(公告)日:2024-09-13

    申请号:CN202011559563.6

    申请日:2020-12-25

    Abstract: 本公开的实施例提供了一种由移动终端执行的车辆定损方法、装置、移动终端、介质以及计算机程序产品。本公开涉及人工智能领域,具体涉及计算机视觉和深度学习技术。实现方案为:采集至少一个输入图像;在至少一个输入图像中检测车辆标识信息;在至少一个输入图像中检测车辆损伤信息;基于车辆标识信息和车辆损伤信息确定车辆定损结果。利用本公开的实施例提供的方法,可以在移动终端处离线地执行车辆定损而无需将拍摄的图像发送到云端,从而可以实现定损过程实时性高、网络延迟小、节省网络服务资源、节省网络带宽费用的效果。

    图像处理方法、图像处理模型的训练方法和装置

    公开(公告)号:CN116597454B

    公开(公告)日:2024-07-12

    申请号:CN202310597526.1

    申请日:2023-05-24

    Abstract: 本公开提供了一种图像处理方法、图像处理模型的训练方法、装置和设备,涉及人工智能技术领域,具体为计算机视觉、图像处理、深度学习等技术领域,可应用于OCR、智慧政务等场景。图像处理方法包括:对目标图像进行文本识别,得到多个文本区域和其各自的文本内容;提取表征多个文本区域的视觉模态信息的多个第一视觉特征和每一个文本区域所包括的文本内容的文本模态信息的多个第一文本特征;基于多个第一视觉特征将多个第一文本特征融合,以得到多个第一文本融合特征;基于多个第一文本特征将多个第一视觉特征融合,以得到多个第一视觉融合特征;基于注意力机制对多个第一视觉融合特征和多个第一文本融合特征进行强化进而得到图像处理结果。

    一种视频拼接方法、装置、电子设备及存储介质

    公开(公告)号:CN114125324B

    公开(公告)日:2024-02-06

    申请号:CN202111315996.1

    申请日:2021-11-08

    Abstract: 本公开提供了一种视频拼接方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及深度学习和计算机视觉技术领域。具体实现方案为:在第一视频的最后一个图像帧和第二个视频的第一个图像帧之间插入一个中间帧;在第一视频和第二视频中分别按照从后向前的顺序和从前向后的顺序依次选取L个图像帧;其中,L为大于1的自然数;基于中间帧以及第一视频中的L个图像帧和第二视频中的L个图像帧,将第一视频和第二视频拼接为目标视频。本申请实施例可以实现视频之间的平滑过渡,能够极大地降低视频拼接难度,同时还可以提高拼接速度,降低成本。

Patent Agency Ranking