-
公开(公告)号:CN106782505A
公开(公告)日:2017-05-31
申请号:CN201710092394.1
申请日:2017-02-21
Applicant: 南京工程学院
Abstract: 本发明公开了基于放电声音识别高压开关柜状态的方法:步骤1、分别采集高压开关柜电晕态和高压放电态的放电声音信号;步骤2、分别对放电声音信号进行预处理,得到对应的训练样本;步骤3、提取训练样本短时能量相关特征参数;步骤4、提取训练样本MFCC参数;步骤5、设计分类器;步骤6、对高斯混和模型进行参数训练;步骤7、监测高压开关柜,对监测到的放电声音进行预处理得到待识别样本,提取待识别样本的短时能量相关特征参数和MFCC参数,当短时能量超过阈值,则进入步骤8;步骤8、计算待识别样本在高斯混和模型下的概率值;步骤9、根据计算结果判断高压开关柜状态,包括正常态,电晕态和高压放电态。可靠性更高、响应速度更快、更智能化。
-
公开(公告)号:CN106097656A
公开(公告)日:2016-11-09
申请号:CN201610698291.5
申请日:2016-08-22
Applicant: 南京工程学院
CPC classification number: G08B21/043 , G08B21/0476 , G08B25/10
Abstract: 本发明提供一种基于物联网的老人看护系统,包括环境监控单元、视频监控单元、监控平台和数据库,环境监控单元通过传感器组实时采集居住环境数据,并通过自组织的无线网络发送给监控平台;视频监控单元通过数字摄像头采集监控视频,并发送监控视频给监控平台;监控平台对居住环境进行实时监控;对监控视频中的运动目标进行识别,在视频监测到运动目标处于摔倒状态时,同时分析智能手环采集的生命体征信息是否发生突变,如发生突变,则确认老人确实处于摔倒状态。该种基于物联网的老人看护系统,能够实现视频监控的同时,实现老人的生命体征的监控,实现家居环境的自动监控与调节,可用于局部区域内,位置相对集中,低成本下对人员的看护。
-
公开(公告)号:CN104637497A
公开(公告)日:2015-05-20
申请号:CN201510020519.0
申请日:2015-01-16
Applicant: 南京工程学院
Abstract: 本发明公开了一种面向语音情感识别的语谱特征提取方法,步骤一,对语音信号分帧,并进行快速傅里叶变换得到对应的语谱图;步骤二,对语谱图进行分解;步骤三,对分解图像进行中央周边差运算并归一化,得到每幅分解图的特征图;步骤四,提取每幅特征图的特征矩阵;步骤五,特征矩阵降维并重构。本发明从分析语音语谱特征的角度,综合运用图像处理的一些方法,从创新的角度挖掘情感识别的特征,采用多尺度多通道的滤波器对语谱图进行分解,在不同的特征域进行处理,并结合PCA分析,更好的挖掘对语音情感有益的信息。
-
公开(公告)号:CN103152672B
公开(公告)日:2015-04-15
申请号:CN201310110995.2
申请日:2013-04-03
Applicant: 南京工程学院
IPC: H04R3/00
Abstract: 本发明提出了一种微麦克风阵列接收信号压缩编码及信号恢复方法。其具体方法是对每个时刻微麦克风阵列接收的信号进行压缩变换,并对压缩变换后的信号进行编码。压缩变换矩阵为对角元为1的下三角阵,其非对角元系数由自适应过程更新。自适应过程及其代价函数在更新过程中最小化压缩变换后的信号能量,对各麦克风阵元接收信号解相关,消除各阵元信号之间的冗余信息。每一时刻的压缩编码信号可以通过压缩变换矩阵的逆矩阵恢复出原始接收信号。由于压缩变换矩阵始终保持对角元为1的下三角阵,所以其逆矩阵始终存在,信号恢复过程稳定可靠。
-
公开(公告)号:CN104038880A
公开(公告)日:2014-09-10
申请号:CN201410295526.7
申请日:2014-06-26
Applicant: 南京工程学院
IPC: H04R25/00 , G10L21/034
Abstract: 本发明公开了一种双耳助听器语音增强方法,该方法包括以下步骤:拾取双耳声学信号;将双耳声学信号分别进行频带分解,得到子带声学信号;计算双耳子带声学信号的联合特征,估计声源所在位置;分别延迟左耳和右耳的子带声学信号,并与不延迟的右耳和左耳的子带声学信号相减或相加,增强指定方向声音;根据噪声源位置,自适应调节延迟参数,抑制噪声信号,得到增强的语音信号。该方法可实现语音信号的方向性增强,并保留语音的自然度。
-
公开(公告)号:CN101458290A
公开(公告)日:2009-06-17
申请号:CN200810136691.2
申请日:2008-12-31
Applicant: 江苏省电力公司苏州供电公司 , 南京工程学院 , 赵力
IPC: G01R31/02
Abstract: 本发明涉及一种基于调频数字编码的多芯电缆测序方法及其装置,该装置由发送器和接收器组成,分别连接待测多芯电缆的两端;测量时,发射器对每一根待测电缆设计数字编码信号,并对编码信号进行频率调制后发送到待测电缆上;接收端利用测量探头连接任意两根电缆,两根电缆的接收信号通过差分电路获得其中标识为“+”端的电缆的有效接收信号,对有效接收信号进行解调,从而获得所连接的电缆序号并显示结果。采用本发明测量方法的测量装置,体积较小,便于现场使用,在测量时不需使用公共参考线,而且采用本发明的测量方法使得测量的可靠性更高,可进行远距离测试。
-
公开(公告)号:CN119517061A
公开(公告)日:2025-02-25
申请号:CN202411576166.8
申请日:2024-11-06
Applicant: 南京工程学院
IPC: G10L21/0208 , G10L21/0216 , G10L21/0232 , G10L25/30 , G10L25/18
Abstract: 本发明公开了基于异构多尺度卷积循环网络的回声消除方法及系统,首先基于多帧上下文提取相关特征模式构建相关编码器,再根据单帧提取频谱模式构建频谱编码器,接着采用相关编码器和频谱编码器组成异构多尺度编码器并获得多路编码特征;本发明实现了具有利用异构双路编码器从输入混合信号频谱和参考信号频谱中提取不同特征的功能,且为适应参考信号和混合信号之间的时延情况而采用相关性编码并从多帧频谱中提取相关性特征表达,同时为了加强当前帧的频谱分辨率而采用频谱编码从当前帧中提取频谱模式表达,还实现了对于双路特征具有进一步采用通道注意力特征软选择机制融合相关性特征编码和频谱编码的功能,适合被广泛推广和使用。
-
公开(公告)号:CN114067819B
公开(公告)日:2024-06-21
申请号:CN202111385676.3
申请日:2021-11-22
Applicant: 南京工程学院
IPC: G10L21/02 , G06N3/0464 , G06F18/214 , G06F18/22 , G06N3/0442 , G06F18/25 , G06N3/096
Abstract: 本发明公开了基于跨层相似性知识蒸馏的语音增强方法,包括提取深度神经网络的输入特征,再构建基于深度复卷积循环语音增强网络结构的蒸馏基础模型,接着根据蒸馏基础模型构建基于跨层相似性蒸馏的师生学习框架,并预训练大规模参数的蒸馏基础模型作为教师模型,再利用预训练好的教师模型对学生模型进行蒸馏;本发明提出了跨级路径连接的策略,并融合了多层教师模型的有效信息来引导单层学生网络,且为了更好地适应语音增强任务,引入了帧级相似性蒸馏损失,并在教师和学生的表示空间中保留成对相似性以最终实现知识转移,还用大规模的教师模型引导轻量的学生模型,能够有效的提升低复杂度语音增强模型的效果,具有良好的应用前景。
-
公开(公告)号:CN112330713B
公开(公告)日:2023-12-19
申请号:CN202011346536.0
申请日:2020-11-26
Applicant: 南京工程学院
IPC: G06T7/207 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于唇语识别的重度听障患者言语理解度的改进方法,包括:使用图像采集设备从现实环境中采集唇部运动图像序列,作为深度神经网络的输入特征;构建基于深度学习的视觉模态语音端点检测方法,在低信噪比条件下确认语音段位置;构建基于三维卷积‑残差网络‑双向GRU结构的深度学习模型作为基线模型;在基线模型的基础上构建基于时空信息特征的唇语识别模型;利用交叉熵损失训练网络模型,根据训练后的唇语识别模型识别出说话内容。本发明通过时空信息反馈来捕捉唇语图像的细粒度特征和时域关键帧,从而提高对复杂环境中唇语特征的适应性,提高唇语识别性能,改善了重度听障患者的语言理解能力,具有良好的应(56)对比文件Yue Xie;Cai-Rong Zou;Rui-Yu Liang;Hua-Wei Tao.Phoneme Recognition Based onDeep Belief Network《.2016 InternationalConference on Information System andArtificial Intelligence (ISAI)》.2016,全文.马宁;田国栋;周曦.一种基于long short-term memory的唇语识别方法.中国科学院大学学报.2018,(01),全文.荣传振;岳振军;贾永兴;王渊;杨宇.唇语识别关键技术研究进展.数据采集与处理.2012,(S2),全文.刘大运;房国志;骆天依;魏华杰;王倩.基于BiLSTM-Attention唇语识别的研究《.计算技术与自动化》.2020,全文.Bor-Shing Lin;Yu-Hsien Yao;Ching-FengLiu;Ching-Feng Lien;Bor-ShyhLin.Development of Novel Lip-ReadingRecognition Algorithm《.IEEE Access》.2017,全文.
-
公开(公告)号:CN116699523A
公开(公告)日:2023-09-05
申请号:CN202310630829.9
申请日:2023-05-31
Applicant: 南京工程学院
IPC: G01S5/22 , G01S3/802 , G06F17/15 , G06F17/14 , G06N3/0464
Abstract: 本发明公开了一种基于复倒谱差函数和深度神经网络的声源定位方法,属于语音识别领域,本方法从空间特征和模型构建两方面入手,首先提取复倒谱差函数作为特征参数,然后设计深度神经网络的声源定位模型,建立复倒谱差函数与声源方位之间的映射关系,从而实现复杂环境中高准确率的声源定位。不同声学环境下的实验结果表明,本发明显著了提高声源定位的性能,并且对混响具有较好的鲁棒性。
-
-
-
-
-
-
-
-
-