-
公开(公告)号:CN112580445B
公开(公告)日:2022-10-11
申请号:CN202011406087.4
申请日:2020-12-03
Applicant: 电子科技大学
IPC: G06V40/20 , G06V10/774 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明属于步态识别技术领域,具体提供一种基于生成对抗网络的人体步态图像视角转化方法。本发明通过在训练过程中引入多种不同类型的判别器,并通过合理设置训练策略,从而使得该视角转化方法可以将输入视角下步态图像转化到多个不同目标视角,并且在转化的过程中有效避免身份信息的丢失。该视角转化方法可以被有效应用在跨视角步态识别场景中,通过将不同视角的步态图像转化到多个统一的视角,一方面,消除了视角差异对于步态识别准确率的影响,另一方面,相比于其他方法只转化到一个统一视角,本方法通过转化到多个统一视角,为后续身份识别提供了更加丰富的数据,可以有效提升跨视角步态识别准确率。
-
公开(公告)号:CN110619385B
公开(公告)日:2022-07-29
申请号:CN201910820048.X
申请日:2019-08-31
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于多级剪枝的结构化网络模型压缩加速方法,属于模型压缩加速技术领域。本发明包括如下步骤:获取预训练模型,训练得到初始完备网络模型;测量卷积层敏感度,通过控制变量获得各个卷积层的敏感度‑剪枝率曲线;按照敏感度次序从低到高进行单层剪枝,微调重训练网络模型;选取样本作为验证集,测量滤波器输出特征图的信息熵;根据输出熵大小次序进行迭代柔性剪枝,微调重训练网络模型;硬性剪枝,对网络模型进行重训练恢复网络性能,得到并保存轻量级模型。本发明可以在保持原有网络性能的前提下,对大规模卷积神经网络进行压缩,能够缩减网络的本地内存占用,减少运行时的浮点运算和显存占用,实现网络的轻量化。
-
公开(公告)号:CN111460883A
公开(公告)日:2020-07-28
申请号:CN202010074922.2
申请日:2020-01-22
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于深度强化学习的视频行为自动描述方法,属于视频自动描述技术领域。本发明首先对视频数据进行图像预处理,将其转化为帧图像,然后提取空间域特征和时域特征,进行拼接后得到视频序列各帧的特征向量;再基于LSTM编码器将各帧编码为一个向量,以及基于LSTM解码器将固定向量解码成不同长度的自然语言。LSTM编码器和解码器所涉及的神经网络参数优化时的损失函数为生成词语与标注的参考语句的单词的交叉熵损失;从而获得准确的视频描述。进一步还可以对训练好的LSTM编码器、解码器进行强化学习,损失函数采用随机策略概率乘上随机策略奖励与最优策略奖励之差,以获得更高的描述准确率。
-
公开(公告)号:CN110650342A
公开(公告)日:2020-01-03
申请号:CN201910820042.2
申请日:2019-08-31
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于编码单元特征分析的快速编码方法,属于视频编码技术领域。本发明包括:编码单元纹理、边缘、结构特征提取;将提取的多特征输入至SVM分类器中离线学习,得到各深度下SVM的分类模型;通过提取的特征寻找当前关联度最大的编码单元进行深度0预判决;根据特征将编码单元划分为简单、中等和复杂三种情况;在各深度下对划分为简单的编码单元终止其深度判决,对划分为复杂的编码单元跳过当前深度进行下一深度判决,对划分为中等的编码单元则按照原流程进行当前深度的判决。本发明基于视频图像复杂度进行编码单元快速划分的方法可以大大减少编码单元在深度判决过程中的计算复杂度,在保证视频质量的前提下节约了编码时间。
-
公开(公告)号:CN110659586B
公开(公告)日:2022-03-15
申请号:CN201910820059.8
申请日:2019-08-31
Applicant: 电子科技大学
IPC: G06V30/148 , G06K9/62 , G06V10/764 , G06V10/74
Abstract: 本发明公开了一种基于身份保持循环式生成式对抗网络的步态识别方法,包括如下步骤:利用高斯背景建模方法得到步态前景得到步态能量图;通过身份保持循环式生成式对抗网络,实现步态图像的状态转换;提取目标步态视角的步态能量图的特征向量,进行步态识别处理。本发明基于身份保持循环式生成式对抗网络的步态识别方法,可以实现对步态图像转化过程的更为细致更为准确的控制,以解决步态识别中受测者状态与数据库状态不匹配的问题,可以很大程度上扩展提高步态识别的准确率以及其应用范围。
-
公开(公告)号:CN110674939A
公开(公告)日:2020-01-10
申请号:CN201910820043.7
申请日:2019-08-31
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于剪枝阈值自动搜索的深度神经网络模型压缩方法,属于深度神经网络模型压缩领域。本发明包括下列步骤:模型训练,得到用于剪枝的初始模型;对模型参数进行自适应网格搜索得到第一剪枝阈值;结合二分搜索法对第一剪枝阈值对应的阈值区间进一步搜小,寻找更优阈值大小,得到第二剪枝阈值;基于第二剪枝阈值对原始网络模型进行迭代剪枝处理;对剪枝后的模型进行稀疏存储,得到可使用的压缩网络模型。本发明提出的基于剪枝阈值自动搜索的深度神经网络模型压缩方法,可以对现有主要的深度神经网络模型进行压缩,解决了深度神经网络模型因为模型大导致无法部署到嵌入式设备上的技术问题,扩展了深度神经网络模型的应用范围。
-
公开(公告)号:CN110659586A
公开(公告)日:2020-01-07
申请号:CN201910820059.8
申请日:2019-08-31
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于身份保持循环式生成式对抗网络的跨视角步态识别方法,包括如下步骤:利用高斯背景建模方法得到步态前景得到步态能量图;通过身份保持循环式生成式对抗网络,实现步态图像的状态转换;提取目标步态视角的步态能量图的特征向量,进行步态识别处理。本发明基于身份保持循环式生成式对抗网络的步态识别方法,可以实现对步态图像转化过程的更为细致更为准确的控制,以解决步态识别中受测者状态与数据库状态不匹配的问题,可以很大程度上扩展提高步态识别的准确率以及其应用范围。
-
公开(公告)号:CN112215353B
公开(公告)日:2023-09-01
申请号:CN202011050565.2
申请日:2020-09-29
Applicant: 电子科技大学
IPC: G06N3/082 , G06N3/0464
Abstract: 本发明属于卷积神经网络压缩与加速技术领域,具体提供一种基于变分结构优化网络的通道剪枝方法,通过基于变分结构优化网络的通道剪枝技术对深度卷积神经网络模型进行压缩,考虑了目前大型神经网络在资源受限上的应用局限性,采用通道剪枝技术对原始网络进行压缩,在不影响原始网络性能的前提下,尽可能的压缩网络参数,减少网络前向传播过程中激活层的内存占用,降低运行时进行的浮点运算次数,以实现轻量化网络的目标。本发明通过自动优化网络结构,卓有成效地降低了深度卷积神经网路的参数冗余,提高了其运行速度,从而扩大了神经网络在边缘设备上的应用场景。
-
公开(公告)号:CN111008978B
公开(公告)日:2022-10-14
申请号:CN201911239331.X
申请日:2019-12-06
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于深度学习的视频场景分割方法,属于视频场景分割技术领域。本发明首先将待分割的视频数据转化为帧图像,再基于深度学习算法进行目标检测处理获取帧图像的背景候选框;并对帧图像进行关键背景候选框选取;基于关键背景候选框的位置信息,确定关键背景候选框所在的图像帧的相邻的后一图像帧上的对应所述位置信息的背景候选框;最后计算相邻图像帧的联合相似度相似度,若将联合相似度低于相似度阈值,则基于当前相邻帧的帧位置对待分割的一段视频数据进行视频分割。本发明可以在自动提取局部背景区域的情况下实现对视频背景信息进行相似度的判断,解决了传统算法中算法复杂度过高的问题,实现对复杂场景下背景分割。
-
公开(公告)号:CN108520215B
公开(公告)日:2022-10-11
申请号:CN201810262820.6
申请日:2018-03-28
Applicant: 电子科技大学
IPC: G06V40/16 , G06V10/74 , G06V10/774 , G06V10/764
Abstract: 本发明公开了一种基于多尺度联合特征编码器的单样本人脸识别方法,包括如下步骤:图像预处理;人脸区域划分;多尺度区域独立特征学习,对每块人脸区域分别训练,得到独立特征编码矩阵;联合特征学习,对各区域多尺度独立特征编码矩阵进行分解和聚类学习,得到联合特征编码矩阵;特征提取,通过多尺度联合特征编码矩阵对人脸图像进行特征提取;特征识别,对每个区域提取到的特征进行对比,获取识别结果。本发明提供了基于稀疏自动编码技术的联合特征学习方法,可以在有限的人脸训练数据条件下学习到鲁棒的人脸特征,解决了在遮挡和光照干扰情况下的人脸识别问题,极大扩大了人脸识别的应用场景。
-
-
-
-
-
-
-
-
-