-
公开(公告)号:CN114898439B
公开(公告)日:2024-03-19
申请号:CN202210614368.1
申请日:2022-06-01
Applicant: 桂林电子科技大学
IPC: G06V40/16 , G06V20/40 , G06V10/82 , G06V10/774 , G06N3/0464
Abstract: 本发明公开了一种基于分段策略和多头卷积注意力的视频人脸识别方法,包括如下步骤:1)对视频人脸数据集进行预处理;2)对步骤1)中得到的视频帧图像集进行分段线性映射、位置嵌入操作;3)深度特征提取;4)识别;5)损失函数进行训练;6)完成人脸识别。本技术方案分段策略有效去除了跨度较大的视频帧面部姿态、大小等变化较大而对特征提取施加的冗余噪声,并结合提出的多头卷积注意力模块有效提取冗长视频序列的上下文信息,同时大幅降低了模型的复杂程度,分段损失函数的设计加速了网络的训练并提高模型抗干扰的能力,最终使得模型具有更好的识别性能。
-
公开(公告)号:CN117407808A
公开(公告)日:2024-01-16
申请号:CN202311475888.X
申请日:2023-11-07
Applicant: 桂林电子科技大学
IPC: G06F18/2431 , G06F18/214 , G06F18/213 , G06V10/764 , G06V10/40 , G06N3/08 , G06N3/0442
Abstract: 本发明公开了一种基于分数的扩散模型生成回放的类增量学习方法,所述方法包括如下步骤:1)训练分类器;2)建立基于分数的扩散模型;3)训练鉴别器;4)基于分数的扩散模型的生成回放。本技术方案利用基于分数的扩散模型生成高质量的旧类样本来记忆旧类信息,并使扩散模型和鉴别器能够以与分类器相同的方式来增量式地学习新类别,以此避免顺序更新模型时遭受的灾难性遗忘问题,从而有效地提升分类性能。
-
公开(公告)号:CN112308884B
公开(公告)日:2023-06-16
申请号:CN202011227714.8
申请日:2020-11-06
Applicant: 桂林电子科技大学
Abstract: 本发明公开一种基于张量核范数的视频背景减除方法,用改进的张量核范数去表征视频背景的低维特性,使得背景约束更加接近实际视频背景的秩,为前景背景更加准确的分离提供了一定的保证;用L1,1,2范数去建模视频前景的稀疏性,加强了视频前景的时空连续性和管稀疏性,从而达到了较好的背景前景分离效果。
-
公开(公告)号:CN114898439A
公开(公告)日:2022-08-12
申请号:CN202210614368.1
申请日:2022-06-01
Applicant: 桂林电子科技大学
IPC: G06V40/16 , G06V20/40 , G06V10/82 , G06V10/774 , G06N3/04
Abstract: 本发明公开了一种基于分段策略和多头卷积注意力的视频人脸识别方法,包括如下步骤:1)对视频人脸数据集进行预处理;2)对步骤1)中得到的视频帧图像集进行分段线性映射、位置嵌入操作;3)深度特征提取;4)识别;5)损失函数进行训练;6)完成人脸识别。本技术方案分段策略有效去除了跨度较大的视频帧面部姿态、大小等变化较大而对特征提取施加的冗余噪声,并结合提出的多头卷积注意力模块有效提取冗长视频序列的上下文信息,同时大幅降低了模型的复杂程度,分段损失函数的设计加速了网络的训练并提高模型抗干扰的能力,最终使得模型具有更好的识别性能。
-
公开(公告)号:CN113283531A
公开(公告)日:2021-08-20
申请号:CN202110641141.1
申请日:2021-06-09
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种结合分歧融合决策的半监督分类方法,其特征在于,包括如下步骤:1)模型初始化;2)预测伪标签和置信度;3)基于分歧的融合决策规则,筛选出高置信伪标记样本并计算相应的权重;4)将高置信样本加入原始有标记样本集,扩充训练集;5)动态重加权;6)重复步骤2)至步骤5),直至模型收敛。这种方法在提升模型分类精度的同时,有效地缓解了过拟合问题,提升模型泛化性能。
-
公开(公告)号:CN112164011A
公开(公告)日:2021-01-01
申请号:CN202011085140.5
申请日:2020-10-12
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于自适应残差与递归交叉注意力的运动图像去模糊方法,其特征在于,包括:1)去模糊网络框架的建立;2)浅层特征提取;3)自适应残差过程;4)递归交叉注意力过程;5)图像重建;6)判别网络模型。这种方法能解决运动模糊图像的非均匀性问题,去除伪影且获取更多的图像高频特征,重建出纹理细节丰富的高质量图像。
-
公开(公告)号:CN111310852A
公开(公告)日:2020-06-19
申请号:CN202010154538.3
申请日:2020-03-08
Applicant: 桂林电子科技大学
IPC: G06K9/62
Abstract: 本发明公开一种图像分类方法及系统,涉及数字图像处理技术领域。该方法包括:利用第一图像训练集训练得到特征提取网络模型;利用变分自编码网络、第一图像训练集、特征提取网络模型,以及三种损失函数的加权和,得到与最小的加权和对应的变分自编码网络的解码网络;利用解码网络随机生成伪样本图像集;利用伪样本图像集和第二图像训练集训练全连接神经网络模型,得到分类模型;利用分类模型对待分类图像进行分类。本发明的图像分类方法利用变分自编码网络对第一图像进行分解重构,计算并最小化三种损失函数的加权和,利用与最小的加权和对应的变分自编码网络的解码网络生成伪样本图像集,能完全舍弃旧类样本图像数据,降低内存的占用率。
-
公开(公告)号:CN108399608A
公开(公告)日:2018-08-14
申请号:CN201810172326.0
申请日:2018-03-01
Applicant: 桂林电子科技大学
Abstract: 本发明公开一种基于张量字典及全变分的高维图像去噪方法,在高维图像处理研究的基础上,将张量字典学习结合全变分正则项,提出一种张量字典学习结合TV正则项的高维图像去噪模型,然后用交替迭代方法求解模型,得到迭代更新后重建的MSI图像。本发明的优点是将高维图像看成一个张量整体处理,不会损失图像的立体结构信息,同时也考虑了各波段之间的相关性,并且张量字典学习的方式提高了算法的精确度;在不失高维图像空间结构的前提下,利用高阶TV正则项,很好地保存了较完善的边缘信息,取得良好的重建效果。实验结果在主观视觉和客观评价指标两方面均取得较好的效果,能够保留较多的纹理信息和轮廓信息。
-
公开(公告)号:CN108334816A
公开(公告)日:2018-07-27
申请号:CN201810033455.1
申请日:2018-01-15
Applicant: 桂林电子科技大学
Abstract: 本发明公开了基于轮廓对称约束生成式对抗网络的多姿态人脸识别方法,其特征是,包括如下步骤:1)数据预处理;2)轮廓约束生成网络;3)对称约束对抗网络;4)训练平衡网络;5)重建与识别。这种方法能有效解决人脸图像的姿态角度偏转影响、提取到人脸在多姿态下更具鲁棒性的特征,特别在大角度姿态重建下将全局质量和局部细节相互约束,保持了正脸的轮廓特征信息,能满足实际应用中对多姿态人脸识别的高精度需求。
-
公开(公告)号:CN104112286B
公开(公告)日:2017-06-09
申请号:CN201410376417.8
申请日:2014-08-01
Applicant: 桂林电子科技大学
Abstract: 本发明提供了一种基于几何结构特征和自相似性的图像压缩感知重构方法。包括判定图像块的结构类型;使用同步正交匹配追踪算法对每个图像块获得重构估计值;为每个图像块进行局部和非局部相似块匹配;产生初始解集,进行优化,得到候选解集,进而得到图像块的优化重构估计值;将图像块按顺序拼接起来;重构图像。本发明能够有效减少图像压缩感知重构的不确定性,获得对图像更准确的重构估计。
-
-
-
-
-
-
-
-
-