文本与图像联合建模的面向人物的视频摘要提取方法

    公开(公告)号:CN110083741B

    公开(公告)日:2022-10-28

    申请号:CN201910291983.1

    申请日:2019-04-11

    Abstract: 本发明公开了一种文本与图像联合建模的面向人物的视频摘要提取方法,包括:对原始视频数据进行预处理,获得等间距的视频帧序列以及与原始视频数据相关的文本信息;利用人物检测的方法逐帧地、无差别地定位出所有的人物区域,并通过一定范围的时间窗口筛选出相关的文本信息;根据选出的人物区域与相关的文本信息,利用重识别的方法将每一人物与目标人物进行匹配,将匹配成功的人物区域及对应文本信息所属的视频帧作为关键帧;根据时间相关性聚合所有关键帧,并补充一些过渡帧以形成流畅的视频片段,从而得到面向人物的视频摘要。该方法可以结合视觉信息以及多源的文本信息,产生更加细粒度的面向视频人物的摘要。

    文本与图像联合建模的面向人物的视频摘要提取方法

    公开(公告)号:CN110083741A

    公开(公告)日:2019-08-02

    申请号:CN201910291983.1

    申请日:2019-04-11

    Abstract: 本发明公开了一种文本与图像联合建模的面向人物的视频摘要提取方法,包括:对原始视频数据进行预处理,获得等间距的视频帧序列以及与原始视频数据相关的文本信息;利用人物检测的方法逐帧地、无差别地定位出所有的人物区域,并通过一定范围的时间窗口筛选出相关的文本信息;根据选出的人物区域与相关的文本信息,利用重识别的方法将每一人物与目标人物进行匹配,将匹配成功的人物区域及对应文本信息所属的视频帧作为关键帧;根据时间相关性聚合所有关键帧,并补充一些过渡帧以形成流畅的视频片段,从而得到面向人物的视频摘要。该方法可以结合视觉信息以及多源的文本信息,产生更加细粒度的面向视频人物的摘要。

Patent Agency Ranking