-
公开(公告)号:CN113191262B
公开(公告)日:2022-08-19
申请号:CN202110476061.5
申请日:2021-04-29
Applicant: 桂林电子科技大学
Abstract: 本发明提供一种视频描述数据处理方法、装置及存储介质,方法包括:导入视频序列,并将所述视频序列分割为多个视频图片;通过预设的卷积神经网络对所有的所述视频图片进行特征分割分析,得到多个镜头数据集;通过所述预设的卷积神经网络对所有的所述镜头数据集进行合并分析,得到多个合并后的镜头数据集;通过所述预设的卷积神经网络对多个所述合并后的镜头数据集进行特征提取,得到视频描述特征序列;通过预设的视频描述模型将所述视频描述特征序列转换为视频描述信息。本发明能够不需要每个镜头数据都生成文字描述后结合生成最终描述,直接将自然语言的问题转化为图像问题,减少了生成描述的冗余度,提高了文字描述的流畅度。
-
公开(公告)号:CN114386259B
公开(公告)日:2025-04-15
申请号:CN202111640845.3
申请日:2021-12-29
Applicant: 桂林电子科技大学
IPC: G06F30/20 , G06V10/80 , G06F119/02
Abstract: 本发明提供一种视频描述方法、装置以及存储介质,属于图像处理技术领域,方法包括:S1:导入多个视频数据,并分别对各个视频数据进行第一次融合分析得到第一融合特征;S2:构建训练模型,根据多个第一融合特征对训练模型进行训练得到目标视频描述模型;S3:分别对各个视频数据进行第二次融合分析得到第二融合特征;S4:通过目标视频描述模型对多个第二融合特征进行视频描述得到视频描述结果。本发明能够不需要人工监督来训练生成描述,降低了人工成本,且在图片特征层面比传统的视频描述模型描述准确率更高,增加了特征关系的紧密度,利于视频描述模型准确性的提升。
-
公开(公告)号:CN113191262A
公开(公告)日:2021-07-30
申请号:CN202110476061.5
申请日:2021-04-29
Applicant: 桂林电子科技大学
Abstract: 本发明提供一种视频描述数据处理方法、装置及存储介质,方法包括:导入视频序列,并将所述视频序列分割为多个视频图片;通过预设的卷积神经网络对所有的所述视频图片进行特征分割分析,得到多个镜头数据集;通过所述预设的卷积神经网络对所有的所述镜头数据集进行合并分析,得到多个合并后的镜头数据集;通过所述预设的卷积神经网络对多个所述合并后的镜头数据集进行特征提取,得到视频描述特征序列;通过预设的视频描述模型将所述视频描述特征序列转换为视频描述信息。本发明能够不需要每个镜头数据都生成文字描述后结合生成最终描述,直接将自然语言的问题转化为图像问题,减少了生成描述的冗余度,提高了文字描述的流畅度。
-
公开(公告)号:CN114386259A
公开(公告)日:2022-04-22
申请号:CN202111640845.3
申请日:2021-12-29
Applicant: 桂林电子科技大学
IPC: G06F30/20 , G06K9/62 , G06F119/02
Abstract: 本发明提供一种视频描述方法、装置以及存储介质,属于图像处理技术领域,方法包括:S1:导入多个视频数据,并分别对各个视频数据进行第一次融合分析得到第一融合特征;S2:构建训练模型,根据多个第一融合特征对训练模型进行训练得到目标视频描述模型;S3:分别对各个视频数据进行第二次融合分析得到第二融合特征;S4:通过目标视频描述模型对多个第二融合特征进行视频描述得到视频描述结果。本发明能够不需要人工监督来训练生成描述,降低了人工成本,且在图片特征层面比传统的视频描述模型描述准确率更高,增加了特征关系的紧密度,利于视频描述模型准确性的提升。
-
-
-