-
公开(公告)号:CN113407780B
公开(公告)日:2022-07-05
申请号:CN202110552511.4
申请日:2021-05-20
Applicant: 桂林电子科技大学
Abstract: 本发明提供一种目标检索方法、装置及存储介质,方法包括:从监控设备中获取原始视频数据,并对原始视频数据进行分割处理,得到多个原始视频段;分别对各个原始视频段进行融合特征分析,得到与各个原始视频段对应的融合特征向量;导入待检索目标视频数据,并对待检索目标视频数据进行分割处理,得到多个待检索目标视频段;分别对各个待检索目标视频段进行融合特征分析,得到与待检索目标视频段对应的待检索融合特征向量。本发明充分融合了待检索目标的外形和脸部特征,使得检索准确率大大地提高,节约了人力,实现了快速且准确的在视频中检索目标,更好地满足了产业界的需求。
-
公开(公告)号:CN114596523A
公开(公告)日:2022-06-07
申请号:CN202210167890.X
申请日:2022-02-23
Applicant: 桂林电子科技大学
IPC: G06V20/40 , G06K9/62 , G06F16/738 , G06V10/80 , G06V10/774
Abstract: 本发明提供一种多特征融合的视频描述方法、装置及存储介质,导入数据集,数据集包括多个数据组,各个数据组包括视频与描述信息;分别对各个数据组中的视频进行特征提取,得到运动特征和全局特征,将运动特征和全局特征进行特征拼接,得到各个视频对应的视频特征,分别提取各个数据组中描述信息对应的对象特征,并计算贡献值,根据各个贡献值计算对应视频中所有视频帧的区域特征和;分别将各个视频对应的特征输入训练模型中进行融合训练,得到融合特征;分别将各个所述视频对应的描述信息转换为文本特征;分别将各个所述视频对应的文本特征和各个所述视频对应的融合特征输入到预设的transformer语言模型中,输出视频描述语句。
-
公开(公告)号:CN113408348B
公开(公告)日:2022-08-19
申请号:CN202110529827.1
申请日:2021-05-14
Applicant: 桂林电子科技大学
Abstract: 本发明提供一种基于视频的人脸识别方法、装置及存储介质,方法包括:导入视频数据集,视频数据集包括多个视频数据;分别对各个视频数据进行转换,得到与各个视频数据对应的多个视频帧;分别对各个视频帧进行特征提取,得到与视频帧对应的人脸特征向量和权重,并集合所有的人脸特征向量得到人脸特征向量集;对人脸特征向量集和所有的权重进行评价分析,得到最优特征向量,并将最优特征向量作为人脸识别结果。本发明避免了噪声样本的干扰,且无需参考评估和额外的训练评估模型,简化了处理步骤,减少了对数据数量的依赖性,实现了识别结果与特征表达能力相关,提高了在视频中进行人脸识别的准确性。
-
公开(公告)号:CN113408348A
公开(公告)日:2021-09-17
申请号:CN202110529827.1
申请日:2021-05-14
Applicant: 桂林电子科技大学
Abstract: 本发明提供一种基于视频的人脸识别方法、装置及存储介质,方法包括:导入视频数据集,视频数据集包括多个视频数据;分别对各个视频数据进行转换,得到与各个视频数据对应的多个视频帧;分别对各个视频帧进行特征提取,得到与视频帧对应的人脸特征向量和权重,并集合所有的人脸特征向量得到人脸特征向量集;对人脸特征向量集和所有的权重进行评价分析,得到最优特征向量,并将最优特征向量作为人脸识别结果。本发明避免了噪声样本的干扰,且无需参考评估和额外的训练评估模型,简化了处理步骤,减少了对数据数量的依赖性,实现了识别结果与特征表达能力相关,提高了在视频中进行人脸识别的准确性。
-
公开(公告)号:CN114817637B
公开(公告)日:2024-03-22
申请号:CN202210487341.0
申请日:2022-05-06
Applicant: 桂林电子科技大学
IPC: G06F16/783 , G06F16/78 , G06F40/30
Abstract: 本发明涉及一种基于句子语义的视频描述方法、装置及存储介质,属于技术领域;方法包括步骤:将视觉特征和运动特征进行拼接融合,将目标视频特征对应的描述词袋转换为文本特征,根据视觉词、目标视频特征及其对应的文本特征构建损失函数模型,以及计算每个单词在句中出现的概率,根据概率得到句子级别损失函数,通过句子级别损失函数和损失函数模型进行损失迭代计算,得到最终的视频描述信息;本发明有助于提高预测长度的准确性,从而生成的视频描述信息更完整。
-
公开(公告)号:CN113407780A
公开(公告)日:2021-09-17
申请号:CN202110552511.4
申请日:2021-05-20
Applicant: 桂林电子科技大学
IPC: G06F16/783 , G06K9/00 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种目标检索方法、装置及存储介质,方法包括:从监控设备中获取原始视频数据,并对原始视频数据进行分割处理,得到多个原始视频段;分别对各个原始视频段进行融合特征分析,得到与各个原始视频段对应的融合特征向量;导入待检索目标视频数据,并对待检索目标视频数据进行分割处理,得到多个待检索目标视频段;分别对各个待检索目标视频段进行融合特征分析,得到与待检索目标视频段对应的待检索融合特征向量。本发明充分融合了待检索目标的外形和脸部特征,使得检索准确率大大地提高,节约了人力,实现了快速且准确的在视频中检索目标,更好地满足了产业界的需求。
-
公开(公告)号:CN114596523B
公开(公告)日:2024-11-08
申请号:CN202210167890.X
申请日:2022-02-23
Applicant: 桂林电子科技大学
IPC: G06V20/40 , G06F16/738 , G06V10/80 , G06V10/774
Abstract: 本发明提供一种多特征融合的视频描述方法、装置及存储介质,导入数据集,数据集包括多个数据组,各个数据组包括视频与描述信息;分别对各个数据组中的视频进行特征提取,得到运动特征和全局特征,将运动特征和全局特征进行特征拼接,得到各个视频对应的视频特征,分别提取各个数据组中描述信息对应的对象特征,并计算贡献值,根据各个贡献值计算对应视频中所有视频帧的区域特征和;分别将各个视频对应的特征输入训练模型中进行融合训练,得到融合特征;分别将各个所述视频对应的描述信息转换为文本特征;分别将各个所述视频对应的文本特征和各个所述视频对应的融合特征输入到预设的transformer语言模型中,输出视频描述语句。
-
公开(公告)号:CN114817637A
公开(公告)日:2022-07-29
申请号:CN202210487341.0
申请日:2022-05-06
Applicant: 桂林电子科技大学
IPC: G06F16/783 , G06F16/78 , G06F40/30
Abstract: 本发明涉及一种基于句子语义的视频描述方法、装置及存储介质,属于技术领域;方法包括步骤:将视觉特征和运动特征进行拼接融合,将目标视频特征对应的描述词袋转换为文本特征,根据视觉词、目标视频特征及其对应的文本特征构建损失函数模型,以及计算每个单词在句中出现的概率,根据概率得到句子级别损失函数,通过句子级别损失函数和损失函数模型进行损失迭代计算,得到最终的视频描述信息;本发明有助于提高预测长度的准确性,从而生成的视频描述信息更完整。
-
-
-
-
-
-
-