一种训练样本图像的生成方法及装置

    公开(公告)号:CN110598785B

    公开(公告)日:2021-09-07

    申请号:CN201910857892.X

    申请日:2019-09-11

    Abstract: 本申请提供一种训练样本图像的生成方法及装置,涉及人工智能技术领域。该方法包括:获取包括至少一个目标对象的原始图像;分别针对每个目标对象调整原始图像的尺寸以获得各个目标对象的调整图像;其中,每个目标对象的调整图像中该目标对象的尺寸被调整到目标检测器关联的锚框可检测到的目标尺寸范围内;基于各个目标对象对应的调整图像,获得训练样本图像,训练样本图像中包括至少一个目标对象,且训练样本图像中的目标对象尺寸与调整图像中对应的目标对象尺寸一致,该方法通过将原始图像中的目标对象的尺寸调整到目标检测器关联的锚框可检测到的目标尺寸范围内,使得生成的样本与目标检测器相适配,提供一种适用于目标检测器的样本生成方法。

    一种图像识别方法、装置和计算机可读存储介质

    公开(公告)号:CN111652331B

    公开(公告)日:2021-05-11

    申请号:CN202010775335.6

    申请日:2020-08-05

    Abstract: 本发明实施例公开了一种图像识别方法、装置和计算机可读存储介质;本发明实施例在获取待识别图像对和待识别图像对的时空信息后,该待识别图像对包括第一对象图像和第二对象图像,对待识别图像对中的图像进行多维度特征提取,得到图像特征对,并计算图像特征对中的图像特征的相似度,基于时空信息,确定第一对象图像和第二对象图像之间的时空关联信息,根据时空关联信息,确定第一对象图像和第二对象图像属于同一对象的先验概率,对相似度和先验概率进行融合,得到第一对象图像与第二对象图像属于同一对象的目标概率,基于目标概率,对第一对象图像和第二对象图像中对象的同一性进行识别,得到图像识别结果;该方案可以提升图像识别的准确率。

    图像分类模型处理方法、图像分类方法及装置

    公开(公告)号:CN112733970A

    公开(公告)日:2021-04-30

    申请号:CN202110344857.5

    申请日:2021-03-31

    Abstract: 本申请公开了一种无监督领域自适应的图像分类模型处理方法、图像分类方法、装置、计算机设备及存储介质,属于人工智能技术领域。本申请通过在图像分类模型训练阶段,分别获取源域图像和目标域图像的特征的空间分布,基于两个数据域的特征在空间分布上的相似性,确定两个数据域对应的参考分布信息,应用参考分布信息对对应数据域的特征进行归一化处理,使两个数据域的特征在分布上更接近,图像分类模型根据归一化处理后的特征输出图像分类结果以及模型训练,基于上述方法对图像分类模型进行迭代训练,能够使模型提取到的两个数据域的特征的相似性提高,从而使模型能够逐渐适用于对目标域图像的处理,提高模型在目标域图像处理任务中的模型表现。

    基于人脸识别的签到系统、方法和装置

    公开(公告)号:CN106228628B

    公开(公告)日:2021-03-26

    申请号:CN201610560334.3

    申请日:2016-07-15

    Abstract: 一种基于人脸识别的签到系统、方法和装置。所述系统包括:至少一个摄像头和嵌入式人脸识别处理装置;摄像头用于采集记录有签到用户的监控视频流,并发送给嵌入式人脸识别处理装置;嵌入式人脸识别处理装置用于通过输入输出接口接收监控视频流;通过GPU从监控视频流中提取签到用户的人脸特征,通过CPU根据签到用户的人脸特征检测预先存储的注册人脸特征集中是否存在与签到用户相匹配的目标注册用户,若存在则确认目标注册用户签到成功。利用摄像头实时采集签到现场的通道入口处的监控视频流,使得签到用户无需排队签到直接步入签到现场即可,提升签到效率,以适用人流密度很高的签到场合,如大型会议。且GPU达到加速人脸识别的目的。

    音频识别方法及装置
    17.
    发明授权

    公开(公告)号:CN107229629B

    公开(公告)日:2021-03-19

    申请号:CN201610171165.4

    申请日:2016-03-24

    Abstract: 本发明是关于一种音频识别方法及装置,属于音频处理技术领域。该方法包括:获取待识别音频的原始音高序列,所述原始音高序列用于指示所述待识别音频在各个时间点上的频率;将所述原始音高序列切分成多个音高子序列;对所述原始音高序列和所述多个音高子序列分别进行识别;将对所述原始音高序列和所述多个音高子序列分别进行识别所获得的识别结果进行合并,获得对所述待识别音频的识别结果;通过将一个长音高序列切分成多个短音高序列,并对长音高序列和多个短音高序列分别进行识别,并将识别结果进行整合,从而达到提高哼唱识别的准确性的效果。

    视频帧特征提取方法、装置、计算机设备及存储介质

    公开(公告)号:CN111489378B

    公开(公告)日:2020-10-16

    申请号:CN202010596100.0

    申请日:2020-06-28

    Abstract: 本申请实施例公开了一种视频帧特征提取方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取多个视频帧,分别对每个视频帧进行特征提取,得到每个视频帧的初始特征信息,根据多个视频帧的初始特征信息进行运动识别,得到多个视频帧的运动特征信息,将多个视频帧的运动特征信息进行对比处理,得到每个视频帧的权重信息,分别对每个视频帧的初始特征信息与对应的权重信息进行融合处理,得到每个视频帧的目标特征信息。削弱了每个视频帧中与运动特征无关的信息,提高了多个视频帧的运动特征信息的准确性,增强每个视频帧的目标特征信息中的运动特征信息,从而提高了目标特征信息的准确性,实现了对视频帧的数据计算。

    一种轨迹跟踪方法、装置和存储介质

    公开(公告)号:CN108509896B

    公开(公告)日:2020-10-13

    申请号:CN201810267283.4

    申请日:2018-03-28

    Abstract: 本发明实施例公开了一种轨迹跟踪方法、装置和存储介质,本发明实施例对多个视频帧中的头部图像进行运动跟踪,得到头部图像对应的运动轨迹;获取在各个视频帧中头部图像对应的脸部图像,得到头部图像对应的脸部图像集合;从头部图像对应的脸部图像集合中,确定具有相同脸部图像的至少两个脸部图像集合;将确定的脸部图像集合所对应的运动轨迹进行合并处理,得到轨迹跟踪的最终运动轨迹。由于头部特征相同人体其它部分比较固定,且发生遮挡的概率较小,对头部图像进行运动跟踪,能够获取到相较于完整人体更为准确的运动轨迹,即使跟踪中断,也能通过头部图像对应的脸部图像将中断的运动轨迹进行合并,从而达到提升运动跟踪准确性的目的。

    人脸聚类的方法、装置和计算机可读存储介质

    公开(公告)号:CN111738221A

    公开(公告)日:2020-10-02

    申请号:CN202010736376.4

    申请日:2020-07-28

    Abstract: 本申请提出了用于人脸聚类的方法、装置和计算机可读存储介质。人脸聚类方法包括:获取至少一个人脸的人脸特征以及人脸特征对应的时空信息;确定人脸特征中任意两个人脸特征的相似度和两个人脸特征对应的时空信息的匹配度;基于两个人脸特征的相似度以及两个人脸特征对应的时空信息的匹配度,确定两个人脸特征指向相同身份的联合概率;响应于两个人脸特征的联合概率达到第一阈值,确定两个人脸特征指向相同身份并将它们进行聚类。本申请提出的人脸聚类方法精确度更高,通过结合用户行为使得建档更准确,因此更符合实际应用场景的需求,具有更强的实用性。

Patent Agency Ranking