视频分类方法、装置、计算机设备和存储介质

    公开(公告)号:CN112101154B

    公开(公告)日:2023-12-15

    申请号:CN202010907778.6

    申请日:2020-09-02

    Abstract: 本申请涉及人工智能的计算机视觉技术、机器学习等技术,一种视频分类方法、装置、计算机设备和存储介质。所述方法包括:获取待分类视频片段;将待分类视频片段输入已训练的视频分类网络,得到第一视频分类结果,并将待分类视频片段输入已训练的人脸识别网络,得到与待分类视频片段对应的人物信息;将人物信息与各预设视频类别的人物信息集合进行比对,得到第二视频分类结果,根据第一视频分类结果以及第二视频分类结果,得到目标视频分类结果。采用本方法能够得到准确的视频分类结果。

    图像样本的筛选方法、装置、设备及介质

    公开(公告)号:CN112598089A

    公开(公告)日:2021-04-02

    申请号:CN202110242144.8

    申请日:2021-03-04

    Abstract: 本申请公开了一种图像样本的筛选方法、装置、设备及介质,涉及机器学习领域。该方法包括:获取图像处理模型的样本数据集,所述样本数据集包括N个图像样本和C个样本类别,N和C为正整数;计算所述图像样本的交叉熵;基于所述交叉熵,计算所述图像样本的类别平衡截断交叉熵损失,所述类别平衡截断交叉熵损失是根据所述样本类别得到的损失值;基于所述类别平衡截断交叉熵损失,对所述图像样本进行筛选。本申请会计算图像样本的类别平衡截断交叉熵损失,并通过类别平衡截断交叉熵损失对样本进行筛选,使得筛选后的样本类别比较平衡。

    视频过渡方法、装置、计算机设备、存储介质

    公开(公告)号:CN114679605B

    公开(公告)日:2023-07-18

    申请号:CN202210298843.9

    申请日:2022-03-25

    Abstract: 本申请涉及一种视频过渡方法、装置、计算机设备、存储介质和计算机程序产品。所述计算机设备可以包括智能手机、电脑或智能车载设备;所述方法包括:获取待拼接的视频片段序列;视频片段序列内每相邻的视频片段作为一组,各视频片段组内的视频片段之间对象行为不连续;依次确定各视频片段组中的视频片段的片段相似分值;基于片段相似分值确定各视频片段组需插入的过渡帧数;基于各视频片段组中的视频片段和所述过渡帧数,生成各所述视频片段组的过渡帧图片;将各所述视频片段组中的视频片段与对应的所述过渡帧图片进行拼接。采用本方法能够有效提高过渡视频生成质量,有效解决了传统过渡视频生成方式中容易产生的分辨率低、动作不够自然等问题。

    一种多模态特征提取网络的预训练方法及装置

    公开(公告)号:CN115293348A

    公开(公告)日:2022-11-04

    申请号:CN202210974121.0

    申请日:2022-08-15

    Abstract: 本申请涉及数据处理技术领域,可应用于车载场景,尤其涉及一种多模态特征提取网络的预训练方法及装置,该方法为:在基于一批训练样本进行的一轮训练过程中,基于所述多模态特征提取网络提供的多种候选模态,分别对每个训练样本进行特征提取,获得相应候选模态的候选模态特征,并基于所述目标模态对应的局部映射子特征之间的时序关系,生成重构特征一个重构特征,以及基于目标模态的重构特征的目标模态特征与各个其他候选模态特征的相似性关系计算的损失值,调整网络参数。这样,不仅能够训练多模态特征提取网络提取更具时间敏感性的特征,还能够训练提取出不同模态的深层次特征,并能够提高训练后的多模态特征提取网络在下游任务中的适配性。

    虚拟角色的运动重定向方法和装置、存储介质及电子设备

    公开(公告)号:CN116958336A

    公开(公告)日:2023-10-27

    申请号:CN202310172536.0

    申请日:2023-02-21

    Abstract: 本申请公开了一种虚拟角色的运动重定向方法和装置、存储介质及电子设备。其中,该方法包括:获取源虚拟角色的源运动数据、目标虚拟角色的形状数据以及骨骼数据,根据源运动数据和形状数据确定对预先确定的初始运动数据进行穿模修正后得到的修正运动数据,初始运动数据表示目标虚拟角色执行目标运动的过程中存在互相穿透的第一部位,根据源运动数据、形状数据以及骨骼数据确定为修正运动数据和初始运动数据添加的目标权重参数,根据修正运动数据和目标权重参数确定目标运动数据。本申请解决了由于虚拟角色的运动重定向方式复杂,导致虚拟角色的运动重定向效率较低的技术问题。

    视频过渡方法、装置、计算机设备、存储介质

    公开(公告)号:CN114679605A

    公开(公告)日:2022-06-28

    申请号:CN202210298843.9

    申请日:2022-03-25

    Abstract: 本申请涉及一种视频过渡方法、装置、计算机设备、存储介质和计算机程序产品。所述计算机设备可以包括智能手机、电脑或智能车载设备;所述方法包括:获取待拼接的视频片段序列;视频片段序列内每相邻的视频片段作为一组,各视频片段组内的视频片段之间对象行为不连续;依次确定各视频片段组中的视频片段的片段相似分值;基于片段相似分值确定各视频片段组需插入的过渡帧数;基于各视频片段组中的视频片段和所述过渡帧数,生成各所述视频片段组的过渡帧图片;将各所述视频片段组中的视频片段与对应的所述过渡帧图片进行拼接。采用本方法能够有效提高过渡视频生成质量,有效解决了传统过渡视频生成方式中容易产生的分辨率低、动作不够自然等问题。

    音频合成方法、装置、设备及介质

    公开(公告)号:CN114299969A

    公开(公告)日:2022-04-08

    申请号:CN202110954697.6

    申请日:2021-08-19

    Abstract: 本申请公开了一种音频合成方法、装置、设备及介质,涉及机器学习领域。该方法包括:获取风格参考音频的风格频谱相位图和内容参考音频的内容频谱相位图;对风格频谱相位图进行编码得到风格编码,对内容频谱相位图进行编码得到内容编码;根据风格编码和所述内容编码,得到合成音频的输出频谱相位图;根据输出频谱相位图合成所述合成音频,合成音频的风格是以风格参考音频为参考的,合成音频的内容是以内容参考音频为参考的。本申请会根据风格参考音频和内容参考音频的频谱相位图来合成音频,合成音频的效果较好。

    视频帧特征提取方法、装置、计算机设备及存储介质

    公开(公告)号:CN111489378A

    公开(公告)日:2020-08-04

    申请号:CN202010596100.0

    申请日:2020-06-28

    Abstract: 本申请实施例公开了一种视频帧特征提取方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取多个视频帧,分别对每个视频帧进行特征提取,得到每个视频帧的初始特征信息,根据多个视频帧的初始特征信息进行运动识别,得到多个视频帧的运动特征信息,将多个视频帧的运动特征信息进行对比处理,得到每个视频帧的权重信息,分别对每个视频帧的初始特征信息与对应的权重信息进行融合处理,得到每个视频帧的目标特征信息。削弱了每个视频帧中与运动特征无关的信息,提高了多个视频帧的运动特征信息的准确性,增强每个视频帧的目标特征信息中的运动特征信息,从而提高了目标特征信息的准确性,实现了对视频帧的数据计算。

    视频分类方法、模型训练方法、装置及电子设备

    公开(公告)号:CN116994017A

    公开(公告)日:2023-11-03

    申请号:CN202211065530.5

    申请日:2022-09-01

    Abstract: 本申请实施例公开了一种视频分类方法、模型训练方法、装置及电子设备,在模型训练时,通过将第一视频片段输入至视频分类模型中,使得视频分类模型可以针对正确的类别标签的样本进行训练,同时为了让视频分类模型能够实现带噪学习,获取与第二视频片段进行相似度比较的第一对比片段,将第二视频片段和第一对比片段输入至视频分类模型中进行对比学习,使得视频分类模型无需为第二视频片段标注一个预测标签,就可以针对错误的类别标签的样本进行训练,提升了视频分类模型的训练效果,后续通过训练好的视频分类模型进行视频分类时,可以提高视频分类的准确率,可以广泛应用于云技术、人工智能等领域。

    运动信息的重定向方法、装置、设备、存储介质及产品

    公开(公告)号:CN116993773A

    公开(公告)日:2023-11-03

    申请号:CN202211399454.1

    申请日:2022-11-09

    Abstract: 本申请提供了一种运动信息的重定向方法、装置,包括:获取源角色执行目标动作的骨骼旋转数据、骨骼位移数据、骨骼关节点的位置数据以及源角色的高度,并获取目标角色的骨骼结构数据、目标角色的高度;基于源角色的骨骼关节点的位置数据以及目标角色的骨骼结构数据,修正源角色的骨骼旋转数据,得到目标角色的目标骨骼旋转数据;基于目标角色的高度以及源角色的高度、源角色的骨骼位移数据以及目标角色的骨骼结构数据,修正骨骼位移数据,得到目标角色的目标骨骼位移数据;基于目标骨骼旋转数据以及目标骨骼位移数据,确定目标角色执行目标动作的目标运动信息。通过本申请,能够提高运动信息的重定向结果的精确度、以及运动重定向后动作的真实性。

Patent Agency Ranking