-
公开(公告)号:CN110163175A
公开(公告)日:2019-08-23
申请号:CN201910449120.2
申请日:2019-05-28
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于改进VGG-16网络的步态识别方法及系统,包括步骤:S1、基于改进VGG-16网络对原始行人步态数据集进行处理,提取静态特征和动态特征;S2、训练所述静态特征和动态特征,得到静态识别网络、动态识别网络、特征融合模块和综合识别模块;S3、基于所述静态识别网络、动态识别网络、特征融合模块和综合识别模块识别图像或视频中的步态。本发明与现有技术相比有如下优点:1.本发明结合卷积神经网络进行行人步态识别,利用卷积神经网络优秀的特征提取能力和计算能力,大幅提升对行人步态识别的准确性和实时性。2.本发明结合行人走路时的静态特征与动态特征进行步态识别,可以有效去除由于角度、衣着和距离远近造成的负面影响。
-
公开(公告)号:CN109858430A
公开(公告)日:2019-06-07
申请号:CN201910080912.7
申请日:2019-01-28
Applicant: 杭州电子科技大学
Abstract: 本发明提供一种基于强化学习优化的多人姿态检测方法。针对传统方法中目标检测器所定位的有些包围框不能很好地贴合人体,导致姿态检测器的检测精度下降,进而影响到整个多人姿态检测算法的精度,提出了基于强化学习的目标精细模型,针对不够精确的包围框进行调整。目标精细模型使得包围框能更加贴合人体,减少了包围框中图像的冗余信息,可以提高姿态检测器的检测精度。
-
公开(公告)号:CN110047506A
公开(公告)日:2019-07-23
申请号:CN201910319987.6
申请日:2019-04-19
Applicant: 杭州电子科技大学
Abstract: 本发明提出一种基于卷积神经网络和多核学习SVM的关键音频检测方法,包括步骤:S1:处理音频数据集,得到音频原始波形序列数据集和音频声谱图数据集;S2:建立提取音频原始波形序列特征的一维卷积神经网络和提取音频声谱图特征的二维卷积神经网络;S3:使用音频的原始波形序列数据集和声谱图数据集分别训练一维和二维卷积神经网络,得到对应的两个特征提取的网络模型;S4:输入音频的原始波形序列和声谱图分别至对应的两个网络模型,提取对应的特征;S5:输入两类特征至多核支持向量机,构建基于特征融合模型的核函数,进行音频分类。本发明所述检测方法将卷积神经网络从音频语谱图和音频原始波形中提取的特征进行融合,提高了检测识别准确率。
-
公开(公告)号:CN109815901A
公开(公告)日:2019-05-28
申请号:CN201910069350.6
申请日:2019-01-24
Applicant: 杭州电子科技大学
Abstract: 本发明公开一种基于YOLOv3算法的多人姿态估计方法,包括步骤:S1:处理综合数据集,得到满足方法需要的单类行人数据集;S2:设计图片切割提取模块,将YOLOv3算法和Stacked Hourglass算法合理结合得到多人姿态估计网络框架;S3:训练S1所述数据集得到单类行人检测的YOLOv3网络模型,训练MPII数据集得到Hourglass姿态估计网络模型。将训练得到的YOLOv3网络模型和级联4个Hourglass网络得到的Stacked Hourglass网络模型进行合理结合,得到基于YOLOv3算法的多人姿态估计网络模型;S4:输入原始图像,得到多人姿态估计建议的图像。本发明基于最新的YOLOv3算法,通过提升人体检测器的检测能力,提高了多人姿态估计的准确性,提升了对全局性的把控。
-
公开(公告)号:CN110047506B
公开(公告)日:2021-08-20
申请号:CN201910319987.6
申请日:2019-04-19
Applicant: 杭州电子科技大学
Abstract: 本发明提出一种基于卷积神经网络和多核学习SVM的关键音频检测方法,包括步骤:S1:处理音频数据集,得到音频原始波形序列数据集和音频声谱图数据集;S2:建立提取音频原始波形序列特征的一维卷积神经网络和提取音频声谱图特征的二维卷积神经网络;S3:使用音频的原始波形序列数据集和声谱图数据集分别训练一维和二维卷积神经网络,得到对应的两个特征提取的网络模型;S4:输入音频的原始波形序列和声谱图分别至对应的两个网络模型,提取对应的特征;S5:输入两类特征至多核支持向量机,构建基于特征融合模型的核函数,进行音频分类。本发明所述检测方法将卷积神经网络从音频语谱图和音频原始波形中提取的特征进行融合,提高了检测识别准确率。
-
-
-
-