Patent search ap:("南京工业大学") AND inv:"黄玉婷" Page 1

1.

发明公开
一种基于特征强化和融合的视频描述方法审中-公开

公开(公告)号：CN118609028A

公开(公告)日：2024-09-06

申请号：CN202410780291.4

申请日：2024-06-17

Applicant: 南京工业大学

Inventor： 黄玉婷 , 刘斌

IPC: G06V20/40 , G06V10/42 , G06V10/771 , G06V10/80 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/0455

Abstract: 本文提供了一种基于特征强化和融合的视频描述方法，包括步骤：多模态特征提取，提取外观特征、运动特征和对象特征；语义特征提取，外观特征和运动特征串联输入到语义检测器提取语义特征；特征增强，利用局部和全局特征为模型提供正确的细节引导，放大相似物体的特征差异，提高目标主体编码特征的准确性；多模态特征融合，以外观特征为引导，筛选运动特征和对象特征中与内容更相关的视觉信息，并对特征进行融合，形成统一的多模态融合特征；特征解码，利用Transformer模型的解码器部分对编码进行解码；最后，生成视频描述内容。与现有的视频描述方法相比，通过特征增强，使得视频重点区域特征的定位识别更精确；同时通过跨模态融合网络，提升解码器的语义解码准确度，使得生成的视频描述更加准确。

Patent Agency Ranking