-
公开(公告)号:CN116486457A
公开(公告)日:2023-07-25
申请号:CN202310410387.7
申请日:2023-04-18
Applicant: 济南大学
IPC: G06V40/16 , G06V20/40 , G06V10/774 , G06V10/776 , G06V10/82 , G06N3/0455 , G06N3/0464
Abstract: 本发明提供了一种基于多级感知自编码网络的视频人脸识别方法及系统,所述系统包括:视频数据采集模块:获取用于计算机识别与处理的视频数据;数据预处理模块:对采集到的视频数据进行预处理,获得图像集数据,并把获取的图像集数据每类中所有样本平均分配,一半样本作为训练集,一半样本作为验证集;模型构建模块:本发明通过获取可用于计算机识别与处理的视频帧序列,并对数据进行预处理操作,以获得图像集数据;对所述的图像集数据随机分成训练集与测试集,所述训练集中的数据再次随机平均分配为训练集与验证集用于训练;将所述的训练集和验证集中的数据输入到多级感知自编码网络的视频特征生成模块中,生成每个图像集的深度概念级特征表示。
-
公开(公告)号:CN118626675A
公开(公告)日:2024-09-10
申请号:CN202410750171.X
申请日:2024-06-12
Applicant: 济南大学
IPC: G06F16/783 , G06F16/735 , G06V20/40 , G06V10/82 , G06V10/80
Abstract: 本发明提供一种基于大模型的粗细粒度相结合的哈希视频检索方法,通过获取视频数据集数据;对视频数据集进行划分和预处理操作;将视频输入分别输入到CLIP帧特征提取模块和Transformer视频特征提取模块;将得到的帧特征信息通过提出的多粒度融合模块中的空间注意力机制进行加权得到帧融合视频信息;将得到的粗粒度视频信息与帧融合视频信息按照给定的特定超参数进行加权融合,最终得到视频信息;将得到的视频信息输入哈希码生成模块中,并通过损失函数,优化网络;将测试样本与数据库中的样本根据汉明距离进行排序,检索到的正确结果。通过采用本发明的技术方案,能够有效增加视频检索的速度,提高视频检索的精度。
-
公开(公告)号:CN116958631A
公开(公告)日:2023-10-27
申请号:CN202310352099.0
申请日:2023-03-30
Applicant: 济南大学
IPC: G06V10/764 , G06V10/774 , G06V10/772 , G06V20/40
Abstract: 本发明提供了一种快速图像集合分类方法及系统,所述方法通过对获得的图像集合数据使用静态建模方法进行建模表示,生成每个图像集合的协方差矩阵;使用对数函数将所述协方差矩阵映射到切空间,把矩阵数据转换为向量,并使用PCA进行降维,最后将降维后的数据输入到流形低秩字典对学习方法中,优化求解后得到每类所对应的最优的合成字典及分析字典。本发明通过输入视频序列数据;对视频数据进行预处理操作,以获得图像集数据;对获得的图像集合数据使用静态建模方法进行建模表示,即生成每个图像集合的协方差矩阵;使用对数函数将协方差矩阵映射到切空间;把矩阵数据转换为向量,并使用PCA进行降维,最后将降维后的数据输入到流形低秩字典对学习方法中,优化求解后得到每类所对应的最优的合成字典及分析字典。
-
-