-
公开(公告)号:CN113470671A
公开(公告)日:2021-10-01
申请号:CN202110716972.0
申请日:2021-06-28
Applicant: 安徽大学
IPC: G10L21/02 , G10L21/0272 , G10L21/0316 , G10L21/06 , G10L25/30
Abstract: 一种充分利用视觉与语音联系的视听语音增强方法及系统,属于语音信号处理技术领域,解决如何利用视觉与语音之间的内在联系,在现实中嘈杂的语音环境中实现对目标语音信息进行增强的问题;在语音特征和视觉特征融合之前,通过BLSTM对视觉特征进行初次利用,由此得到的目标的二进制掩码和原始的噪声幅度谱图获取的语音特征相融合从而得到干净幅度二进制掩码,将此幅度掩码代替基本框架中的视觉特征和语音特征一起馈入BLSTM和全连接层组成的训练网络;同时在基础的增强网络之上,基于频域,加入后置相位子网络,利用语音的幅度和相位在结构上相关性,获取增强相位谱图和幅度谱图相融合使得语音增强效果更佳,提高了增强后语音清晰度,降低语音失真率。
-
公开(公告)号:CN113378697A
公开(公告)日:2021-09-10
申请号:CN202110637611.7
申请日:2021-06-08
Applicant: 安徽大学
Abstract: 本发明公开了一种基于卷积神经网络的说话人脸视频生成方法及装置,所述方法包括:构建数据集;设计唇音同步判别器;利用数据集训练唇音同步判别器,得到训练好的唇音同步判别器;构建说话人脸生成网络;利用数据集训练说话人脸生成网络,得到训练好的说话人脸生成网络;将目标语音和目标人物的人脸图片输入训练好的说话人脸生成网络生成目标人物说目标语音的视频;本发明的优点在于:能够生成清晰度较高且唇部运动与语音同步的真实性较高的说话人脸视频。
-
公开(公告)号:CN106951888B
公开(公告)日:2020-12-01
申请号:CN201710322155.0
申请日:2017-05-09
Abstract: 本发明公开了一种人脸特征点的相对坐标约束的方法,在人脸定位的过程中,计算任意两个人脸特征点i和j的相对位置,使得任意两个预测人脸特征点i和j的相对位置尽可能接近于其对应的两个真实的人脸特征点之间的相对位置。本发明还公开了一种使用上述人脸特征点的相对坐标约束的方法的人脸特征点的定位方法。发明相比现有技术具有以下优点:通过强制约束每一个人脸特征点与其它所有特征点之间的相对坐标位置,在人脸特征点定位模型训练中使用相对坐标约束,可以提高任意姿态下人脸特征点定位精度的相对坐标约束方法,且本发明提出的约束方法只需在网络训练中进行相关操作,对于训练完成的网络进行实际使用时不增加任何计算量。
-
公开(公告)号:CN108257347A
公开(公告)日:2018-07-06
申请号:CN201810020679.9
申请日:2018-01-10
Applicant: 安徽大学
CPC classification number: G08B17/125 , G06K9/6268 , G06N3/0454
Abstract: 本发明公开了一种利用卷积神经网络的火焰图像序列分类方法及装置,方法包括:获取前景图像序列,获取与前景图像序列对应的综合光流图;获取第一训练集和第一测试集;获取综合光流图是否对应于真实火焰的图像序列的类别标签;训练预设的第一卷积神经网络模型;测试训练好的第一卷积神经网络模型,获取第一测试结果;判断第一测试结果是否大于第一预设阈值;若是,将训练好的第一卷积神经网络模型作为目标第一卷积神经网络模型;若否调整训练好的第一卷积神经网络模型的训练参数,并返回执行训练预设的第一卷积神经网络模型;利用目标第一卷积神经网络对与待分类的综合光流图进行分类。应用本发明实施例,可以降低对火焰区域检测的误检率。
-
公开(公告)号:CN107886064A
公开(公告)日:2018-04-06
申请号:CN201711078847.1
申请日:2017-11-06
Applicant: 安徽大学
CPC classification number: G06K9/00288 , G06K9/00281 , G06K9/6256 , G06N3/0454
Abstract: 一种基于卷积神经网络的人脸识别场景适应的方法,包括:1)收集人脸数据并做好分类标签,对数据做预处理和增强,分成训练集和验证集;2)将训练集数据送入设计好的卷积神经网络进行训练,得到预训练模型;3)用验证集数据测试预训练模型,根据测试结果调整训练参数重新训练;4)重复3)获得最佳预训练模型;5)根据不同应用场景收集人脸图像数据,在新收集的数据上微调预训练模型,得到新的适应场景的模型;6)用适应场景模型对待测试人脸图像提取特征,对特征中人脸五官部分做加权操作,得到最终特征向量;7)用余弦距离度量最终特征向量,判断是否是目标人脸,输出结果。本发明的优点:保证了人脸识别的准确性及模型的场景适应性。
-
公开(公告)号:CN107122698A
公开(公告)日:2017-09-01
申请号:CN201610569831.X
申请日:2016-07-19
Applicant: 安徽大学
Abstract: 本发明公开了一种基于卷积神经网络的电影院实时上座率统计方法,通过在电影院银幕上方安置高清摄像机和红外摄像机配合采集的监控视频中读取图像,利用预先训练好的观众模版检测并统计上座率,其能够通过单一模型快速准确的检测出每个座位的入座情况,实际测试中本发明的检测准确率达到99.2%以上。
-
公开(公告)号:CN106564466A
公开(公告)日:2017-04-19
申请号:CN201510656302.9
申请日:2015-10-12
Applicant: 安徽大学
IPC: B60R25/102 , B60R25/30
CPC classification number: B60R25/102 , B60R25/305
Abstract: 本发明公开一种基于行为检测的汽车防盗报警系统,包括设置于车辆内车辆防盗系统、中央处理系统、汽车车顶内安装360度全景摄像头,以及移动终端,当汽车停驻时,摄像头启动,并根据异常行为特征库对摄像头拍摄的视频进行异常行为检测,并对异常行为进行分析检测,当检测到异常行为时可根据威胁基本采取相应措施;检测到陌生人靠近停留可采取预警,进一步检测其行为,当检测到划车、泼油漆等行为,则通过中央处理系统通知通过车主的移动终端,并将视频实施发送至车主以留证;当检测到撬门等行为,则通知车主,并将视频实施发送至车主以留证,同时将发动机灯电路锁死,并启动GPS,以防止汽车被盗;本发明能到做到对车辆及车内物品的双重防盗,并能主动预警、留证。具有很高的市场应用价值。
-
公开(公告)号:CN104992223A
公开(公告)日:2015-10-21
申请号:CN201510336483.7
申请日:2015-06-12
Applicant: 安徽大学
Abstract: 本发明涉及一种基于深度学习的密集人数估计方法,包括以下步骤:选择一幅密集场景的图像作为测试图像,然后对测试图像进行分块操作,分块的比例要保证与原图像的宽高比近似相同;将分得的图像块进行归一化操作,归一化成32×32的像素块,作为我们的测试样本,并附上对应的真实人数标签;将像素块批量送入已经训练好的深度网络中,对于每个像素块,网络都会反馈一个预测结果;将每个像素块的预测结果求和,所得到的结果就是我们需要估计的测试图像中的总人数。本发明的有益效果是:将深度学习的方法引入到了人数统计这一具体问题之中;构造的包含两路信号的回归模型,从一定程度上降低了出现过拟合的可能性。
-
公开(公告)号:CN103617263A
公开(公告)日:2014-03-05
申请号:CN201310632893.7
申请日:2013-11-29
Applicant: 安徽大学
IPC: G06F17/30 , H04N21/454
CPC classification number: G06F17/30787
Abstract: 本发明涉及一种基于多模态特征的电视广告片花自动检测方法,a.将电视视频数据分割为镜头单元;b.对a中提取的音频指纹特征做索引;c.在索引中查找视频其它位置处相似的地方;d.对c步骤通过音频比对获得的视频匹配段候选;e.细化匹配搜索其边界点;f.对e步骤产生的很多视频片段匹配对的结果,进行后处理,排除时间或内容重复性片段;g.对f步骤的结果视频段,再进一步利用特征识别判断是否是广告片花;h.对g步骤的判断结束后,最后输出结果。本发明的一种基于多模态特征的电视广告片花自动检测方法,(1)自动广告片花片段高效准确自动发现;(2)无监督的广告片花片段自动发现方式;(3)后处理排除冗余结果。
-
公开(公告)号:CN119290918A
公开(公告)日:2025-01-10
申请号:CN202411845727.X
申请日:2024-12-16
Applicant: 安徽大学
Abstract: 本发明属于工业型材检测技术领域,具体公开了基于计算机视觉的工业型材缺陷检测装置,包括工作台,所述工作台的顶部固定连接有支撑架,所述工作台的一侧设置有工业计算机,所述工作台的顶部固定连接有均匀分布的支撑台;通过设置第一检测组件,启动电动推杆带动安装板移动至型材内部凹槽的开设高度处,并通过启动线性滑轨能够通过电动推杆带动安装板同步移动,使其能够移动至型材内部凹槽内,在此过程中通过启动第一LED灯能够对型材表面进行补光,在此过程中第一LED灯光线经过反光板反射后形成的光路,能够对型材内部凹槽的死角进行补光,以便于第二工业相机对型材内部凹槽的死角进行拍摄,避免了传统型材检测过程中死角处拍摄效果较差的情况。
-
-
-
-
-
-
-
-
-