一种基于递归神经网络的离散情感识别方法

    公开(公告)号:CN105469065B

    公开(公告)日:2019-04-23

    申请号:CN201510889388.X

    申请日:2015-12-07

    Abstract: 本发明提出的一种基于递归神经网络的离散情感识别方法,步骤为:1、对视频中的图像信号进行人脸检测及跟踪,得到人脸区域后,提取人脸关键点作为人脸的形变特征;将人脸区域裁剪并归一化到统一大小,提取人脸的外观特征;2、对视频中的音频信号进行加窗处理,分割出音频序列单元并提取音频特征;3、利用具有长短时记忆模型的递归神经网络分别对上述得到的三项特征进行时序编码,获得固定长度的情感表征向量;并将其相串联,得到最终情感表述特征;4、基于的支持向量机分类器,利用3中得到的最终情感表述特征进行情感类别预测。该方法能够充分利用情感表达过程中的动态信息,从而实现视频中参与者情感的精确识别。

    一种融合长跨度情感历史的语音情感识别方法

    公开(公告)号:CN103531207B

    公开(公告)日:2016-07-27

    申请号:CN201310481318.1

    申请日:2013-10-15

    Abstract: 本发明公开了一种融合长跨度情感历史的语音情感识别方法。该方法包括以下步骤:利用时域和变换域上的不同参数进行端点检测,剔除原始语音序列中的非语音数据,获得待识别语音段数据;将待识别语音段数据切分为独立的语音段数据单元;利用第一支持向量机对语音段数据单元分别进行情感状态初步分类;对情感状态初步分类结果进行加窗,并利用第二支持向量机进行融合,得到融合长跨度情感历史的情感识别结果。本发明在保证对语音信号的局部单元进行高精度分类的同时,又充分利用信号序列的长跨度内的上下文信息,以达到对序列中的每一单元达到最优的分类结果。本发明能够用于语音信号的情感识别,具有实时性好、并能够大幅度提高识别精度等优点。

    一种基于边缘特征的道路检测方法

    公开(公告)号:CN103577828A

    公开(公告)日:2014-02-12

    申请号:CN201310597554.X

    申请日:2013-11-22

    Abstract: 本发明公开了一种基于边缘特征分析的自动道路检测方法,该方法包括:对于目标图像,采用边缘梯度算子计算得到多幅梯度图像,对其进行二值化处理,得到多幅初步道路边缘图像;基于自动获取的阈值将多幅初步道路边缘图像中像素个数小于该阈值的连通区域去除,获得多个方向上的道路边缘图像;将多个方向的道路边缘图像中的道路边缘信息整合到同一幅图像中,并根据道路两侧具有相似边缘的原理夹逼出道路像素区域,得到初步道路图像;采用基于线段拟合的生长算法进行道路区域间的连接,并根据道路区域的长宽比去除一些非道路区域,最终获得检测得到的道路。本发明适用于航拍图像的自动道路检测,具有检测精度高、实时性好、抗干扰性强等优点。

    一种基于多尺度时序建模的维度情感识别方法

    公开(公告)号:CN104361316B

    公开(公告)日:2017-04-19

    申请号:CN201410601169.2

    申请日:2014-10-30

    Abstract: 本发明公开了一种基于多尺度时序建模的维度情感识别方法,该方法包括以下步骤:对于视频序列中的每帧图像进行人脸检测及跟踪,并提取人脸关键点作为第一类组人脸特征;提取人脸区域图像、人脸嘴部区域图像和人脸眼睛区域图像中像素的灰度值作为第二、三、四类组人脸特征;根据单位时间段t内多帧图像的四类组人脸特征进行维度情感初步预测;根据连续N个单位时间段t的情感初步预测结果用线性回归器进行时序及模态融合,输出视频序列的情感预测值。本发明方法对视频序列信号进行不同尺度的时序建模,实现了序列中每一时序单元的精确预测。本发明适用于视频中人脸信号的情感识别,具有实时性好、并能够大幅度提高识别精度等优点。

    一种基于多尺度时序建模的维度情感识别方法

    公开(公告)号:CN104361316A

    公开(公告)日:2015-02-18

    申请号:CN201410601169.2

    申请日:2014-10-30

    Abstract: 本发明公开了一种基于多尺度时序建模的维度情感识别方法,该方法包括以下步骤:对于视频序列中的每帧图像进行人脸检测及跟踪,并提取人脸关键点作为第一类组人脸特征;提取人脸区域图像、人脸嘴部区域图像和人脸眼睛区域图像中像素的灰度值作为第二、三、四类组人脸特征;根据单位时间段t内多帧图像的四类组人脸特征进行维度情感初步预测;根据连续N个单位时间段t的情感初步预测结果用线性回归器进行时序及模态融合,输出视频序列的情感预测值。本发明方法对视频序列信号进行不同尺度的时序建模,实现了序列中每一时序单元的精确预测。本发明适用于视频中人脸信号的情感识别,具有实时性好、并能够大幅度提高识别精度等优点。

    一种基于递归神经网络的离散情感识别方法

    公开(公告)号:CN105469065A

    公开(公告)日:2016-04-06

    申请号:CN201510889388.X

    申请日:2015-12-07

    CPC classification number: G06K9/00315 G06K9/6256 G06K9/6269 G06K9/6288

    Abstract: 本发明提出的一种基于递归神经网络的离散情感识别方法,步骤为:1、对视频中的图像信号进行人脸检测及跟踪,得到人脸区域后,提取人脸关键点作为人脸的形变特征;将人脸区域裁剪并归一化到统一大小,提取人脸的外观特征;2、对视频中的音频信号进行加窗处理,分割出音频序列单元并提取音频特征;3、利用具有长短时记忆模型的递归神经网络分别对上述得到的三项特征进行时序编码,获得固定长度的情感表征向量;并将其相串联,得到最终情感表述特征;4、基于的支持向量机分类器,利用3中得到的最终情感表述特征进行情感类别预测。该方法能够充分利用情感表达过程中的动态信息,从而实现视频中参与者情感的精确识别。

    一种融合长跨度情感历史的语音情感识别方法

    公开(公告)号:CN103531207A

    公开(公告)日:2014-01-22

    申请号:CN201310481318.1

    申请日:2013-10-15

    Abstract: 本发明公开了一种融合长跨度情感历史的语音情感识别方法。该方法包括以下步骤:利用时域和变换域上的不同参数进行端点检测,剔除原始语音序列中的非语音数据,获得待识别语音段数据;将待识别语音段数据切分为独立的语音段数据单元;利用第一支持向量机对语音段数据单元分别进行情感状态初步分类;对情感状态初步分类结果进行加窗,并利用第二支持向量机进行融合,得到融合长跨度情感历史的情感识别结果。本发明在保证对语音信号的局部单元进行高精度分类的同时,又充分利用信号序列的长跨度内的上下文信息,以达到对序列中的每一单元达到最优的分类结果。本发明能够用于语音信号的情感识别,具有实时性好、并能够大幅度提高识别精度等优点。

Patent Agency Ranking