多媒体数据的特征提取方法、多媒体数据检索方法及装置

    公开(公告)号:CN114328988A

    公开(公告)日:2022-04-12

    申请号:CN202111404192.9

    申请日:2021-11-24

    Abstract: 本申请公开了一种多媒体数据的特征提取方法、多媒体数据检索方法及装置,其中多媒体数据的特征提取方法通过对目标多媒体数据进行图像特征提取,得到目标多媒体数据的图像特征序列;对目标多媒体数据中的音频数据进行语音识别,并对语音识别结果进行文本特征提取,得到目标多媒体数据的文本特征序列;将图像特征序列和文本特征序列进行融合,得到融合特征序列;对融合特征序列进行自注意力计算,得到目标特征序列;根据目标特征序列确定目标多媒体数据的目标特征。该方法可以提高对多媒体数据进行特征提取的准确性。

Patent Agency Ranking