-
公开(公告)号:CN110070895B
公开(公告)日:2021-06-22
申请号:CN201910179592.0
申请日:2019-03-11
Applicant: 江苏大学
Abstract: 本发明公开了一种基于监督变分编码器因素分解的混合声音事件检测方法,包括如下步骤:接收语音信号,并对语音信号进行预处理;提取预处理后的语音信号特征;使用监督变分自动编码器提取声音事件潜在属性空间;使用因素分解方法分解构成混合声音的各种因素,进而学习得到每个特定声音事件相关的特征表示;再使用对应的声音事件检测器检测特定声音事件是否发生。本发明采用因素分解学习的方法解决混合声音中声音事件类别较多的情况下,声音事件检测准确率不高的问题,有效提高真实场景声音事件检测的准确度,且该方法还可用于说话人识别等任务。
-
公开(公告)号:CN106778563A
公开(公告)日:2017-05-31
申请号:CN201611099825.9
申请日:2016-12-02
Applicant: 江苏大学
CPC classification number: G06K9/00302 , G06K9/00281 , G06K9/6262 , G06K9/6269
Abstract: 本发明公开了一种基于空间连贯特征的快速任意姿态人脸表情识别方法。首先合成任意姿态人脸图像对应的正脸图像。其次基于合成的正脸图像检测51个关键特征点,并以特征点为中心提取关键区域。然后基于关键区域进行快速无监督特征学习。最后以每个关键区域为单位进行卷积和池化得到基于无监督特征学习的高层特征,联合每个关键区域的高层特征与几何位置特征得到最终用于任意姿态人脸表情识别的空间连贯特征,将此特征送入SVM训练得到统一表情识别模型,完成任意姿态的人脸表情识别。本发明解决了传统特征由于不具有空间约束关系而导致识别率低、以及传统多姿态人脸表情识别中需要为每种姿态建立模型而导致效率低等问题,有效提高识别准确率及效率。
-
公开(公告)号:CN104881639A
公开(公告)日:2015-09-02
申请号:CN201510245196.5
申请日:2015-05-14
Applicant: 江苏大学
Abstract: 本发明公开了一种基于层次TDP模型的自然人脸检测、分割和表情识别方法,首先对原始图像进行预处理,提取SIFT特征以及对应的位置信息,再采用一种有效的迁移狄利克雷过程将这两种特征组合得到的具有几何约束的特征向量输入到TDP模型,得到第一层的结果——人脸与非人脸。分割完成的人脸作为第二层的输入,经过相同的过程得到子区域的分割结果。最终将子区域作为第三层——人脸表情识别层的输入,经过同样的特征提取与组合,得到人脸图像的表情识别结果。本发明解决了传统多姿态表情识别中需要为每种姿态分别建立模型,以及由于姿态等因素造成模型识别率低的问题,能够有效地提高多姿态人脸图像表情识别的准确率。
-
公开(公告)号:CN105447473B
公开(公告)日:2019-01-08
申请号:CN201510926925.3
申请日:2015-12-14
Applicant: 江苏大学
Abstract: 本发明公开了一种基于PCANet‑CNN的任意姿态人脸表情识别方法。首先对原始图像进行预处理得到统一大小的灰度人脸图像,包括正脸图像和侧脸图像。正脸图像输入无监督特征学习模型PCANet中,学习得到正脸图像所对应的特征。将侧脸图像输入有监督特征学习模型CNN中,并将无监督特征学习得到的正脸特征作为标签,训练得到正脸特征和侧脸特征之间的映射关系。通过此映射关系便可以得到任意姿态的人脸图像所对应的统一正脸特征,最终将统一正脸特征送入SVM中训练得到针对任意姿态的统一识别模型。本发明解决了传统多姿态人脸表情识别中需要为每种姿态分别建立模型,以及由于姿态等因素造成的模型识别率低的问题,能够有效地提高多姿态人脸图像表情识别的准确率。
-
公开(公告)号:CN105447473A
公开(公告)日:2016-03-30
申请号:CN201510926925.3
申请日:2015-12-14
Applicant: 江苏大学
CPC classification number: G06K9/00302 , G06K9/00295 , G06K9/6269
Abstract: 本发明公开了一种基于PCANet-CNN的任意姿态人脸表情识别方法。首先对原始图像进行预处理得到统一大小的灰度人脸图像,包括正脸图像和侧脸图像。正脸图像输入无监督特征学习模型PCANet中,学习得到正脸图像所对应的特征。将侧脸图像输入有监督特征学习模型CNN中,并将无监督特征学习得到的正脸特征作为标签,训练得到正脸特征和侧脸特征之间的映射关系。通过此映射关系便可以得到任意姿态的人脸图像所对应的统一正脸特征,最终将统一正脸特征送入SVM中训练得到针对任意姿态的统一识别模型。本发明解决了传统多姿态人脸表情识别中需要为每种姿态分别建立模型,以及由于姿态等因素造成的模型识别率低的问题,能够有效地提高多姿态人脸图像表情识别的准确率。
-
公开(公告)号:CN113057215A
公开(公告)日:2021-07-02
申请号:CN202110351383.7
申请日:2021-03-31
Applicant: 江苏大学
Abstract: 本发明属于食品冷冻储藏技术领域,涉及一种基于高压电场改善冻融鱼肉品质的方法。首先提供一种高压电场辅助冷冻装置,包括高压输出电源、冷冻柜、正极板、负极板、阻挡隔板和样品台;冷冻柜内部的上下两端对应设有正极板和负极板,外部设有高压输出电源;正极板和负极板分别与高压输出电源的输出端和接地端相连;正、负极板相对应的表面上设有阻挡隔板,其长度长于正、负极板的长度;负极板设于样品台上,样品台设于冷冻柜底部。具体方法为:将冷冻柜进行预冷后,放置鱼块于负极板上表面的阻挡隔板上,然后设置电场强度、脉冲频率和脉冲宽度进行冷冻,即实现冻融鱼肉品质的改善。本发明是一种非热的微能处理技术,效果显著、操作简单且安全环保。
-
公开(公告)号:CN110070895A
公开(公告)日:2019-07-30
申请号:CN201910179592.0
申请日:2019-03-11
Applicant: 江苏大学
Abstract: 本发明公开了一种基于监督变分编码器因素分解的混合声音事件检测方法,包括如下步骤:接收语音信号,并对语音信号进行预处理;提取预处理后的语音信号特征;使用监督变分自动编码器提取声音事件潜在属性空间;使用因素分解方法分解构成混合声音的各种因素,进而学习得到每个特定声音事件相关的特征表示;再使用对应的声音事件检测器检测特定声音事件是否发生。本发明采用因素分解学习的方法解决混合声音中声音事件类别较多的情况下,声音事件检测准确率不高的问题,有效提高真实场景声音事件检测的准确度,且该方法还可用于说话人识别等任务。
-
公开(公告)号:CN108846350A
公开(公告)日:2018-11-20
申请号:CN201810588534.9
申请日:2018-06-08
Applicant: 江苏大学
Abstract: 本发明公开了容忍年龄变化的人脸识别方法,通过训练深度网络VGG-Face来完成容忍年龄变化的人脸识别,因而需要收集用于训练的不同年龄阶段的人脸数据。但是收集同一人的不同时期的人脸,是比较困难的任务。于是,本发明借助生成对抗网络来完成人在不同年龄段人脸的生成,从而构建一个由多个人在不同年龄阶段的人脸图片组成的跨年龄数据库。然后将数据库部分年龄阶段的人脸作为训练集,剩余年龄阶段的人脸作为测试集,来对网络进行训练,通过softmax来实现不同人脸的分类,从而完成容忍年龄变化的人脸识别。本发明主要用途在于,帮助解决在人们不同时间图片不完整的情况下,实现跨年龄的人脸识别。
-
公开(公告)号:CN104881639B
公开(公告)日:2018-06-26
申请号:CN201510245196.5
申请日:2015-05-14
Applicant: 江苏大学
Abstract: 本发明公开了一种基于层次TDP模型的自然人脸检测、分割和表情识别方法,首先对原始图像进行预处理,提取SIFT特征以及对应的位置信息,再采用一种有效的迁移狄利克雷过程将这两种特征组合得到的具有几何约束的特征向量输入到TDP模型,得到第一层的结果——人脸与非人脸。分割完成的人脸作为第二层的输入,经过相同的过程得到子区域的分割结果。最终将子区域作为第三层——人脸表情识别层的输入,经过同样的特征提取与组合,得到人脸图像的表情识别结果。本发明解决了传统多姿态表情识别中需要为每种姿态分别建立模型,以及由于姿态等因素造成模型识别率低的问题,能够有效地提高多姿态人脸图像表情识别的准确率。
-
-
-
-
-
-
-
-