一种对形变图像的目标识别方法及装置

    公开(公告)号:CN109145927A

    公开(公告)日:2019-01-04

    申请号:CN201710457725.7

    申请日:2017-06-16

    CPC classification number: G06K9/46 G06K9/62 G06N3/02 G06K9/4609 G06K9/6267

    Abstract: 本发明实施例提供了一种对形变图像的目标识别方法及装置,所述方法包括:将待识别图像输入预设定位网络,获取所述待识别图像的多个定位参数,所述定位网络包括预设个卷积层,所述多个定位参数是所述待识别图像卷积后得到的特征图中的图像特征回归后得到的;根据所述多个定位参数,对所述待识别图像进行空间变换,得到校正后的待识别图像;将所述校正后的待识别图像输入预设识别网络,获取所述待识别图像的目标分类结果。本发明实施例在基于神经网络的目标识别过程中,先对形变图像进行校正,基于校正后的图像进行目标识别,能够减少形变对目标识别的干扰,因此本发明实施例能够针对形变图像,提高目标识别的准确性。

    车牌识别方法、装置、设备及存储介质

    公开(公告)号:CN112651417B

    公开(公告)日:2024-06-14

    申请号:CN201910967901.0

    申请日:2019-10-12

    Inventor: 钱华 钮毅 程战战

    Abstract: 本发明实施例提供一种车牌识别方法、装置、设备及存储介质,该方法包括:获取待识别的车牌图像,其中,所述车牌图像包含车牌;通过多个识别模型分别对所述车牌图像进行字符识别,得到各个识别模型对应的车牌识别结果,其中,所述多个识别模型为多个不同类型的深度学习模型;将各个识别模型对应的车牌识别结果进行融合,得到所述车牌图像的车牌识别结果。本发明实施例能够利用多个类型的深度学习模型的不同网络特性,从而在各种复杂场景下都具有较高的车牌识别准确度。

    文本识别方法、装置及设备

    公开(公告)号:CN111695385B

    公开(公告)日:2023-09-26

    申请号:CN201910197234.2

    申请日:2019-03-15

    Inventor: 程战战

    Abstract: 本说明书提供一种文本识别方法、装置及设备,该方案预先训练有切割模型,由切割模型获得待识别文本图像的切割位置,从而可以将待识别文本图像切割出大小合适的子图像,防止图像中的文本被不完整切割;由于将图像切割了多个子图像,为了防止上下文信息丢失,已训练的文本识别模型可以识别输入的子图像的语义特征信息,并结合语义特征信息上下文识别出各子图像对应的文本信息,进而可识别所述待识别文本图像。

    视频时序定位方法、装置、计算设备和存储介质

    公开(公告)号:CN111950332B

    公开(公告)日:2023-09-05

    申请号:CN201910412596.9

    申请日:2019-05-17

    Abstract: 本申请公开了一种视频时序定位方法、装置、计算设备和存储介质,属于视频监控领域。本申请实施例提供了一种视频时序定位方法,通过将监控视频裁剪的多个第一视频片段输入事件定位模型中,根据该模型,确定监控视频中的每个第一事件发生的时间范围。该事件定位模型为基于第一样本视频包括的多个第二视频片段和第一样本视频标注的至少一个第二事件训练得到的。该方法中使用的模型为事件定位模型,由于该模型在训练时不需对每帧图像进行标注,因此,在使用该模型进行时序定位时,只需对监控视频中的每个第一视频片段中的事件进行识别定位,不需对监控视频中的每帧图像进行识别定位,从而缩短了视频时序定位时长,提高了视频时序定位效率。

    车牌识别方法、装置、设备及存储介质

    公开(公告)号:CN112651417A

    公开(公告)日:2021-04-13

    申请号:CN201910967901.0

    申请日:2019-10-12

    Inventor: 钱华 钮毅 程战战

    Abstract: 本发明实施例提供一种车牌识别方法、装置、设备及存储介质,该方法包括:获取待识别的车牌图像,其中,所述车牌图像包含车牌;通过多个识别模型分别对所述车牌图像进行字符识别,得到各个识别模型对应的车牌识别结果,其中,所述多个识别模型为多个不同类型的深度学习模型;将各个识别模型对应的车牌识别结果进行融合,得到所述车牌图像的车牌识别结果。本发明实施例能够利用多个类型的深度学习模型的不同网络特性,从而在各种复杂场景下都具有较高的车牌识别准确度。

    图像目标的识别方法及装置

    公开(公告)号:CN108664848B

    公开(公告)日:2020-12-25

    申请号:CN201710200804.X

    申请日:2017-03-30

    Inventor: 程战战

    Abstract: 本发明实施例提供了一种图像目标的识别方法及装置,所述方法包括:获取待识别图像;将所述待识别图像输入预设的三维分类模型;所述三维分类模型提取所述待识别图像的三维图像特征,并根据所述三维图像特征,生成所述待识别图像的三维概率空间图,根据预存的各种目标物与三维概率空间图之间的关系,识别所述待识别图像中的目标物,并将所述目标物作为识别结果输出;获取所述三维分类模型输出的识别结果。应用本发明实施例能够提高图像目标识别的准确率。

    简历筛选方法、装置、电子设备及存储介质

    公开(公告)号:CN112069806A

    公开(公告)日:2020-12-11

    申请号:CN201910425239.6

    申请日:2019-05-21

    Inventor: 程战战

    Abstract: 本申请实施例提供了简历筛选方法、装置、电子设备及存储介质,该方法包括:获取待筛选的目标简历中的文本信息;按照预设的语法映射规则,将文本信息中的数据映射到相应语义项下,得到目标简历的各关键信息项;选取指定语义项的关键信息项,判断指定语义项的关键信息项是否与预设信息项相匹配;在指定语义项的关键信息项与预设信息项相匹配时,通过预设定级模型对目标简历的各关键信息项进行关联分析,得到目标简历的期望级别;在目标简历的期望级别表征晋级时,判定目标简历晋级。实现了简历的自动筛选,减少了人工工作量,增加了简历的筛选速度。同时对简历进行多次筛选,能够满足用户的实际筛选需要,适用性强。

    视频时序定位方法、装置、计算设备和存储介质

    公开(公告)号:CN111950332A

    公开(公告)日:2020-11-17

    申请号:CN201910412596.9

    申请日:2019-05-17

    Abstract: 本申请公开了一种视频时序定位方法、装置、计算设备和存储介质,属于视频监控领域。本申请实施例提供了一种视频时序定位方法,通过将监控视频裁剪的多个第一视频片段输入事件定位模型中,根据该模型,确定监控视频中的每个第一事件发生的时间范围。该事件定位模型为基于第一样本视频包括的多个第二视频片段和第一样本视频标注的至少一个第二事件训练得到的。该方法中使用的模型为事件定位模型,由于该模型在训练时不需对每帧图像进行标注,因此,在使用该模型进行时序定位时,只需对监控视频中的每个第一视频片段中的事件进行识别定位,不需对监控视频中的每帧图像进行识别定位,从而缩短了视频时序定位时长,提高了视频时序定位效率。

    文本识别方法、装置及设备

    公开(公告)号:CN111695385A

    公开(公告)日:2020-09-22

    申请号:CN201910197234.2

    申请日:2019-03-15

    Inventor: 程战战

    Abstract: 本说明书提供一种文本识别方法、装置及设备,该方案预先训练有切割模型,由切割模型获得待识别文本图像的切割位置,从而可以将待识别文本图像切割出大小合适的子图像,防止图像中的文本被不完整切割;由于将图像切割了多个子图像,为了防止上下文信息丢失,已训练的文本识别模型可以识别输入的子图像的语义特征信息,并结合语义特征信息上下文识别出各子图像对应的文本信息,进而可识别所述待识别文本图像。

    一种神经网络的训练方法、装置及序列预测方法

    公开(公告)号:CN111105028A

    公开(公告)日:2020-05-05

    申请号:CN201811258926.5

    申请日:2018-10-26

    Inventor: 白帆 程战战

    Abstract: 本发明公开了一种神经网络的训练方法、装置及序列预测方法,属于人工智能技术领域。方法:在将n个样本数据输入至待训练的神经网络后,获取待训练的神经网络输出的n个概率分布列序列,第k个概率分布列序列包括m个概率分布列,第k个概率分布列序列中第g个概率分布列为,第k个样本数据的第g个单元数据的类别的概率分布,n、k、m和g均为整数,1≤k≤n,1≤g≤m;确定第k个概率分布列序列到第k个标定序列的编辑概率,第k个概率分布列序列到第k个标定序列的编辑概率为,通过编辑操作将第k个概率分布列序列生成第k个标定序列的概率;基于n个概率分布列序列中各个概率分布列序列到相应标定序列的编辑概率,对待训练的神经网络进行优化。

Patent Agency Ranking