-
公开(公告)号:CN119445330A
公开(公告)日:2025-02-14
申请号:CN202411516857.9
申请日:2024-10-28
Applicant: 中国电信股份有限公司
IPC: G06V10/82 , G06F16/783 , G06V30/19 , G06N3/0464 , G06N3/084
Abstract: 本申请公开了一种模型训练方法及装置、非易失性存储介质、电子设备。其中,方法包括:获取视频数据以及用于描述视频数据的文本数据;对文本数据进行特征提取,得到文本特征,对视频数据中的每个图像帧进行特征提取,得到图像特征;在文本特征和图像特征构成的特征空间中查找共现特征;确定文本特征在特征空间中出现的情况下,共现特征在特征空间中出现的目标概率;确定在特征空间中与共现特征之间的相似度大于阈值的上下文特征,根据目标概率以及上下文特征,确定聚合特征;利用聚合特征对神经网络模型进行训练。本申请解决了由于相关文本视频检索技术中无法有效捕捉视频中细粒度信息,造成的限制模型对视频所出现场景的整体理解的技术问题。