视频行为识别方法、装置、计算机设备和存储介质

    公开(公告)号:CN114332670A

    公开(公告)日:2022-04-12

    申请号:CN202111202734.4

    申请日:2021-10-15

    Abstract: 本申请涉及一种视频行为识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:从至少两帧目标视频图像提取视频图像特征;将视频图像特征的空间特征进行贡献调整,得到中间图像特征;基于先验信息对中间图像特征的时间特征和时间特征对应的内聚特征进行融合,得到融合特征;先验信息是根据中间图像特征在时间维度的变化信息得到的;内聚特征是对时间特征进行关注处理得到的;对融合特征进行时间特征贡献调整,得到行为识别特征;基于行为识别特征进行视频行为识别。采用本方法能够提高视频行为识别的准确率。

    视频处理方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN115171014B

    公开(公告)日:2024-02-13

    申请号:CN202210772188.6

    申请日:2022-06-30

    Abstract: 本申请实施例提供了一种视频处理方法、装置、电子设备及计算机可读存储介质,涉及人工智能、云技术、计算机视觉和多媒体技术领域。该方法包括:通过对待处理视频进行划分,得到至少两个待处理的子视频。基于每个子视频与样本库中的各个种子样本的相似度,确定各子视频与样本库的匹配度;基于各子视频对应的匹配度,确定出各子视频中属于目标类型的候选子视频。通过多任务学习模型,确定每个候选子视频的类型预测结果;基于各候选子视频的类型预测结果,确定出各候选子视频中目标类型的目标子视频。基于各目标子视频中目标类型的视频片段,得到待处理视频对应的目标视频片段。本申请实(56)对比文件Huayong Liu.Highlight extraction insoccer videos by using multimodalanalysis《.2017 13th InternationalConference on Natural Computation, FuzzySystems and Knowledge Discovery (ICNC-FSKD)》.2018,第2169-2173页.王晗 等.针对用户兴趣的视频精彩片段提取《.中国图象图形学报》.2018,第23卷(第05期),第748-755页.邹玲 等.基于用户兴趣的视频片段提取方法《.中国科技论文》.2018,第13卷(第02期),第202-207页.

    媒体数据处理方法、装置、设备及存储介质

    公开(公告)号:CN115129902A

    公开(公告)日:2022-09-30

    申请号:CN202210765470.1

    申请日:2022-06-30

    Abstract: 本申请实施例公开了一种媒体数据处理方法、装置、设备及存储介质,方法包括:利用初始媒体识别模型基于M个样本多媒体数据分别对应的媒体特征信息处理得到M个样本多媒体数据分别对应的第一预测媒体标签和预测媒体类别;根据M个样本多媒体数据分别对应的第一标注媒体标签、标注媒体类别、第一预测媒体标签以及预测媒体类别,确定初始媒体识别模型的媒体预测误差;根据M个样本多媒体数据分别对应的媒体特征信息,确定初始媒体识别模型的特征提取误差;根据初始媒体识别模型的媒体预测误差和初始媒体识别模型的特征提取误差,对初始媒体识别模型进行第一调整,得到目标媒体识别模型,使得媒体识别模型针对多媒体数据的预测准确度得到提升。

    媒体数据处理方法、装置、设备及存储介质

    公开(公告)号:CN115129902B

    公开(公告)日:2024-03-29

    申请号:CN202210765470.1

    申请日:2022-06-30

    Abstract: 本申请实施例公开了一种媒体数据处理方法、装置、设备及存储介质,方法包括:利用初始媒体识别模型基于M个样本多媒体数据分别对应的媒体特征信息处理得到M个样本多媒体数据分别对应的第一预测媒体标签和预测媒体类别;根据M个样本多媒体数据分别对应的第一标注媒体标签、标注媒体类别、第一预测媒体标签以及预测媒体类别,确定初始媒体识别模型的媒体预测误差;根据M个样本多媒体数据分别对应的媒体特征信息,确定初始媒体识别模型的特征提取误差;根据初始媒体识别模型的媒体预测误差和初始媒体识别模型的特征提取误差,对初始媒体识别模型进行第一调整,得到目标媒体识别模型,使得媒体识别模型针对多媒体数据的预测准确度得到提升。

    视频处理方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN115171014A

    公开(公告)日:2022-10-11

    申请号:CN202210772188.6

    申请日:2022-06-30

    Abstract: 本申请实施例提供了一种视频处理方法、装置、电子设备及计算机可读存储介质,涉及人工智能、云技术、计算机视觉和多媒体技术领域。该方法包括:通过对待处理视频进行划分,得到至少两个待处理的子视频。基于每个子视频与样本库中的各个种子样本的相似度,确定各子视频与样本库的匹配度;基于各子视频对应的匹配度,确定出各子视频中属于目标类型的候选子视频。通过多任务学习模型,确定每个候选子视频的类型预测结果;基于各候选子视频的类型预测结果,确定出各候选子视频中目标类型的目标子视频。基于各目标子视频中目标类型的视频片段,得到待处理视频对应的目标视频片段。本申请实施例可以快速、精确地确定出待处理视频中的目标视频片段。

    一种骨架行为识别的方法以及相关装置

    公开(公告)号:CN115147924A

    公开(公告)日:2022-10-04

    申请号:CN202210762709.X

    申请日:2022-06-30

    Abstract: 本申请实施例公开了一种骨架行为识别的方法以及相关装置,能够减少空间维度上的骨架特征或者是时间维度上的骨架特征的信息丢失,提高识别精度,并且极大地减少了运算量,提高了运行速度。至少涉及人工智能等技术。该方法包括:获取包括至少两个骨架关键点的二维骨架图像;基于每个骨架关键点的坐标信息确定每个骨架关键点的目标骨架特征,骨架关键点的坐标信息用于反映骨架关键点的位置情况;对至少两个骨架关键点的目标骨架特征进行特征聚合处理,得到目标局部骨架的骨架特征;基于预设网络分类模型对目标局部骨架的骨架特征进行识别处理,得到目标分类结果,目标分类结果用于指示骨架对应的目标对象的行为。

Patent Agency Ranking