-
公开(公告)号:CN109872728A
公开(公告)日:2019-06-11
申请号:CN201910145086.X
申请日:2019-02-27
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于核典型相关分析的语音和姿态双模态情感识别方法,该方法首先提取姿态的空时特征,并提取出视频中的音频文件,再对所提取的音频进行语音情感特征提取,然后对语音和姿态的情感特征分别进行归一化并降维,再进行基于核典型相关分析的情感特征融合,最后用支持向量机进行情感分类。本方法能够综合利用了语音和姿态之间的相关信息,采用特征融合等手段增强了单模态特征数据间的相关性,去除了其中的冗余信息,使计算机的情感识别能力得到提升,比单模态的情感识别有更高的识别率,并使用了情感特征归一化和特征降维方法,降低了特征的维度与特征识别过程中的计算复杂度,进一步提高了情感识别的识别率。
-
公开(公告)号:CN109086803A
公开(公告)日:2018-12-25
申请号:CN201810755419.6
申请日:2018-07-11
Applicant: 南京邮电大学
Abstract: 本发明公开了基于深度学习与个性化因子的雾霾能见度检测系统,该系统包括数据库建立模块,用于构建不同能见度的雾霾能见度图片库;能见度提取模块,用于根据所述雾霾能见度图片库提取所述雾霾能见度图片中涉及场景的标志物的能见度,建立能见度坐标,并对所述雾霾能见度图片中涉及的场景进行编号,个性化因子提取模块,用于针对所述场景编号进行归一化,并将其定义为特征值,并根据场景编号提取个性化因子;神经网络训练模块,用于将所述个性化因子和所述雾霾能见度图片输入到卷积神经网络中进行训练;本发明采用基于深度学习的卷积神经网络结构能够自动提取数据集特征与传统方向比更加渐变,可以快速处理大数据集,节省了大量的训练时间。
-
公开(公告)号:CN108810535A
公开(公告)日:2018-11-13
申请号:CN201810603765.2
申请日:2018-06-12
Applicant: 南京邮电大学
IPC: H04N19/117 , H04N19/132 , H04N19/177 , H04N19/34
CPC classification number: H04N19/177 , H04N19/117 , H04N19/132 , H04N19/34
Abstract: 本发明公开了一种基于毫米波系统的自适应鲁棒视频编码方法,包括:对视频源进行张量分解显著性提取,并结合码率分配,将视频内容分配给编码器;通过场景建模控制编码器运行:若视线路径和中继路径通畅时,采用HEVC编码器,并结合通信路径数和路径信道状态确定自适应多描述编码器的编码路数,实现视线路径和/或中继路径的视频传输;若视线路径和/或中继路径不稳定时,采用SHVC编码器,并结合路径数和路径信道状态确定自适应多描述编码器的编码路数,通过喷泉编码实现中继路径、视线路径和一阶反射路径其中两者或者三者的视频传输。本方法保障用户在恶劣的网络条件下的基本视频服务,而在较稳定的网络条件下,尽可能提高视频质量。
-
公开(公告)号:CN108491858A
公开(公告)日:2018-09-04
申请号:CN201810141576.8
申请日:2018-02-11
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于卷积神经网络的疲劳驾驶检测方法及系统,属于图像处理与模式识别技术领域。首先,采集驾驶员在驾驶状态下的二维面部图像,并按疲劳程度逐级分类,建立疲劳驾驶图像库;其次,构建一个含有数据层、卷积层、池化层、连接层和分类层的卷积神经网络;然后,以疲劳驾驶图像库中图像数据和标签作为卷积神经网络的输入,利用反向传播算法对构建的网络迭代训练,使网络输出损失函数值逐步下降并收敛;最后,输入驾驶员驾驶状态下面部图像测试样本,利用训练后的卷积神经网络模型对其识别,实现驾驶员面部图像疲劳程度的检测分类。本发明相比于传统机器学习方法,明显提高了识别分类效果,为疲劳驾驶实时监测提供一种可行思路。
-
公开(公告)号:CN104036473B
公开(公告)日:2018-01-05
申请号:CN201410239703.X
申请日:2014-05-30
Applicant: 南京邮电大学
Abstract: 本发明属于数字图像处理领域,提供了一种基于分裂Bregman迭代的快速鲁棒图像运动去模糊方法,通过直接利用图像梯度与运动模糊核的L0范数并结合其各自的L2范数,构建运动模糊核估计的非凸非光滑能量泛函;通过耦合算子分裂和增广拉格朗日方法,设计运动模糊核的分裂Bregman迭代求解格式;利用基于全变差先验的图像非盲去模糊方法,实现图像的快速去模糊。本发明通过引入支撑连续性先验,提高了运动模糊核的估计精度;设计了一种新的基于分裂Bregman迭代的快速解法,大幅提高了运动模糊核的估计效率。
-
公开(公告)号:CN107038450A
公开(公告)日:2017-08-11
申请号:CN201610894675.4
申请日:2016-10-13
Applicant: 南京邮电大学
CPC classification number: G06K9/0063 , G06N3/0454 , G06N3/084
Abstract: 本发明公开了基于深度学习的无人机警察系统,用于无人机飞行管理,涉及无人机和图像识别的技术领域。本发明采用视觉传感网技术构建三层结构的无人机警察系统,通过在视觉传感网的各节点中配置无人机来弥补固定摄像机阵列存在监控死角以及不能灵活调整监控区域的缺陷,采用卷积神经网络训练数据以获取精度较高地识别模型,实现了无人机的监管和识别。
-
公开(公告)号:CN106372576A
公开(公告)日:2017-02-01
申请号:CN201610705858.7
申请日:2016-08-23
Applicant: 南京邮电大学
CPC classification number: G06K9/00228 , G06K9/00268 , G06N3/02 , H04N7/18
Abstract: 本发明公开了一种基于深度学习的智能室内入侵检测方法及系统,包括:建立BP神经网络模型;利用帧间差分算法获得监控视频画面中相邻帧间的差分图像;对所获取的差分图像进行二值化处理,及对处理后的图像中提取静止背景下的变化前景区域图像;对所提取的变化前景图像检测和识别其是否存在人形;当识别存在人形时,从所述变化前景区域中检测和提取获得人脸区域图像;对所提取的人脸区域图像检测和识别其是否为用户图像;及在识别判断为非用户图像时,确定为非用户入侵并向用户发送报警信号。本发明抗其他运动物体干扰能力强、误判率低,可进行大量的视频数据分析,可以准确地进行入侵检测识别。
-
公开(公告)号:CN104457986B
公开(公告)日:2016-09-28
申请号:CN201410573157.3
申请日:2014-10-23
Applicant: 南京邮电大学
IPC: G01J3/28
Abstract: 本发明公开了一种基于自适应正则化的光谱分辨率增强方法,该方法的分辨率是光谱测量中至关重要的指标,然而由于在光谱的测量过程中,光谱测量仪器本身会引入一些导致测量的谱线位置偏移、轮廓增宽和畸变等因素,从而导致分辨率降低。本发明提出的基于自适应正则化的光谱分辨率增强方法,既能在抑制噪声的同时保留光谱细节,又能自适应地估计模糊核函数的宽度,适用于不同模糊程度下的光谱分辨率增强。本发明充分利用了噪声对光谱强度受的影响远小于对光谱强度一阶导数的影响的特点,对光谱信息的正则项施加了自适应权系数,更好的保存光谱峰值。本发明在光谱用于质量检测和材料分析等方面提供了技术支撑,具有较强的实用价值。
-
公开(公告)号:CN105931220A
公开(公告)日:2016-09-07
申请号:CN201610227754.X
申请日:2016-04-13
Applicant: 南京邮电大学
CPC classification number: G06T7/0002 , G06K9/3233 , G06K9/4661 , G06T2207/30192
Abstract: 本发明涉及基于暗通道先验与最小图像熵的交通雾霾能见度检测方法。在图像特征提取模块,对待检测图像I经过暗通道先验处理,得到大气透射率的粗估计值,采用导向滤波边缘平滑算子对透射率粗估计值进行平滑细化处理,获得每个像素点的深度信息;在道路区域提取模块,采用区域增长方法提取I中的道路区域,所述区域增长包括设置初始种子点、设置目标增长区域、计算相邻灰度差的最小值、判断目标像素是否为道路区域、更新种子点等步骤;在能见度估计模块,计算该区域的最小图像熵,得到消光系数最优值,有效估计出雾霾能见度大小。本发明的优势是在求图像熵过程中加入目标兴趣区域提取步骤,减少了算法的计算量,提高了运算速度和鲁棒性。
-
-
-
-
-
-
-
-