-
-
公开(公告)号:CN107577994A
公开(公告)日:2018-01-12
申请号:CN201710708646.9
申请日:2017-08-17
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于深度学习的行人、车辆附属品识别及检索方法。首先对图像中像素点的八个方向进行采样,经量化采样得到纹理信息,并用双交叉编码器编码每像素点上两组十字双交叉的子集,形成总描述符;根据描述符及局部灰度联合分布密度提取局部直方图向量,形成纹理特征;根据提取纹理特征训练得到初始分类器,设定学习次数及精度要求;采用主动学习算法优化分类器,到预设精度要求时停止;最后使用训练完成的多示例多标签分类器进行识别,得到高精度的识别结果。本发明提出的系统具有自适应性强、可信度强、整体性能稳健的优点。在提取图像特征时采用双交叉模式的编码方法,可以实现最大联合熵,使图像信噪比最大化,增大图像鲁棒性。
-
公开(公告)号:CN107256392A
公开(公告)日:2017-10-17
申请号:CN201710413642.8
申请日:2017-06-05
Applicant: 南京邮电大学
CPC classification number: G06K9/00288 , G06K9/00308 , G06K9/6269 , G06K9/6277 , G06K9/6292 , G10L25/63
Abstract: 本发明公开了一种联合图像、语音的全面情绪识别方法和系统,识别的过程是信息采集装置从输入视频中采集到相应语音、视频信号后,分别传送到对应的情感分类模块,经分类处理后,集成学习训练器分配权重,经加权处理后,输出识别结果,完成识别过程。系统由信息采集装置、情感分类器和集成处理器组成,信息采集装置包括视频采集器和音频采集器;情感分类器包括对采集的视频信息进行情感分类的表情情感分类模块和对采集的音频信息进行情感分类的语音情感分类模块;集成处理器包括加权模块、集成学习训练器。本发明具有情感分类可靠性更高、调整置信度参量灵活、精度高的优点,通过表情语音双向识别,极大程度上模拟了人类情感识别过程。
-
-