-
公开(公告)号:CN109151692B
公开(公告)日:2020-09-01
申请号:CN201810767514.8
申请日:2018-07-13
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于深度学习网络的助听器自验配方法,通过构建患者综合信息库,通过对患者和验配过程的深入分析,发现验配过程中有效的策略,从而构建新的智能助听器自验配模型,提高验配效率;引入深度学习网络,通过大量的数据训练,使网络具有人工智能,能根据患者的基本信息快速生成符合患者听损特性的语音信息,同时还能根据患者的评价反馈,自动调节输入增益,大大缩短验配时间,改善用户满意度。
-
公开(公告)号:CN111402929A
公开(公告)日:2020-07-10
申请号:CN202010185119.6
申请日:2020-03-16
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于域不变的小样本语音情感识别方法,包括如下步骤:从数据库提取具有时序信息的语音特征;建立LSTM模型,确定待训练的参数及初值;通过多任务学习同时进行情感识别与数据库分类,采用交叉熵结合加权系数,建立损失函数;在数据库分类任务的梯度更新中采取梯度取反的对抗学习方法;在梯度反向传播过程中,按各数据库样本比例对共享层进行梯度加权,得到最终的梯度公式;得到训练好的网络参数值;用预训练好的共享层参数来初始化新的模型,并在未知数据集上重训练,然后用重训练的模型对小样本测试集进行测试验证。本发明利用已知的情感数据集为未知小样本数据提供预训练,提高未知小样本数据库的情感识别性能。
-
公开(公告)号:CN105679330B
公开(公告)日:2019-11-29
申请号:CN201610150663.0
申请日:2016-03-16
Applicant: 南京工程学院
IPC: G10L21/0216 , H04R25/00
Abstract: 本发明提供一种基于改进子带信噪比估计的数字助听器降噪方法,采用分解滤波器组将原信号分解成若干个子带;然后计算出每个子带中相邻两帧信号的互相关函数和各自的均方值,从而估计出该子带的信噪比;其次根据估计出的信噪比计算各子带增益,并与子带信号相乘得到修正的子带信号;最后将修正的各子带信号综合得到降噪处理后的语音。该方法更为精准的子带信噪比估计方法使得背景噪声抑制效果更好,减轻助听器用户的听觉疲劳;方法简单高效,避免了傅里叶逆变换使得时间延迟性能获得较大程度的改善,较传统谱减法改善了60.6%,较传统维纳滤波法改善了40.7%。
-
公开(公告)号:CN109199412A
公开(公告)日:2019-01-15
申请号:CN201811135081.0
申请日:2018-09-28
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于眼动数据分析的异常情绪识别方法,包括以下步骤,拍摄多个受测者的眼动视频样本,并提取各受测者对应的眼动视频样本内的32维眼动特征;对多个受测者的32维眼动特征的数据进行异常分析,并将异常的样本数据归为异常情绪类别,将非异常的样本数据归为非异常特征样本;基于非异常特征样本,从32维眼动特征中提取6维有效眼动特征;基于提取的6维有效眼动特征,输入训练好的支撑向量机模型,从而识别具有异常情绪的样本。本发明基于眼动数据分析引入的异常数据处理机制,大大提高了算法效率;并采用特征选择方法,降低了特征维度,在改善训练时间的同时,有效提高类似犯罪知情者的异常情绪识别。
-
公开(公告)号:CN109199411A
公开(公告)日:2019-01-15
申请号:CN201811135018.7
申请日:2018-09-28
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于模型融合的案件知情者识别方法,包括以下步骤,提取各个被测试者在观看单一图片时的32维眼动特征;基于32维眼动特征训练支撑向量机模型A,来识别每个被测试者在单一图片时的言语置信度,并输出每个被测试者在单一图片时的概率f1(xi)和f2(xi);提取各个被测试者在观看组合图片时的110维眼动特征;基于110维眼动特征训练支撑向量机模型B,来识别每个被测试者在组合图片时的言语置信度,并输出每个被测试者在组合图片时的概率g1(xi)和g2(xi);运用乘法规则,融合支撑向量机模型A和B的分类器概率,得到联合概率,取各个被测试者的概率最大的类别为最后的决策结果。本发明可以有效抑制反测谎手段,提高了算法效率。
-
公开(公告)号:CN105260719A
公开(公告)日:2016-01-20
申请号:CN201510674299.3
申请日:2015-10-16
Applicant: 南京工程学院
IPC: G06K9/00
CPC classification number: G06K9/00369
Abstract: 本发明提供一种铁路站台越线检测方法,实时采集当前画面,对采集的当前画面使用基于卡尔曼滤波算法的背景差分法提取运动目标;给靠近边界的运动目标做标记,标记运动目标的当前位置状态,在边界区域内部且为穿越边界线动作的标记为-1;在边界区域外面且为穿越边界线动作的标记为1;将前一帧目标标记减去后一帧目标标记,选出最终标记值为2的判定为进入,对其进行标记,并进行告警,-2的判断为离开,不对其进行标记告警;通过计算旅客的质心与各区域的距离判断旅客是否越线,若旅客发生越线进入危险区域,即刻进行告警,解决了铁路巡查人员顾后方又顾及不到前方,无法实时提醒和看护的问题。该方法成本低廉、安装简便。
-
公开(公告)号:CN116341616B
公开(公告)日:2023-10-17
申请号:CN202211412348.2
申请日:2022-11-11
Applicant: 南京工程学院
IPC: G06Q50/06 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了基于矩阵重构二维卷积网络的电力负载信息获取方法,首先采集电器的总用电功率并作为输入序列y,再在输入序列y中加入余弦位置编码并得到编码序列ye,接着对编码序列ye进行滑窗截取并得到序列重构矩阵M,随后对输入序列y进行单位延时并得到延时序列y1,再求得动态检测序列yd,然后对序列重构矩阵M进行奇异值分解并得到分解重构子矩阵Mi,再对动态检测序列yd进行滑窗截取并得到动态检测重构矩阵Md;本发明通过采用将序列延时重构为矩阵的方法,能够充分利用序列的时序特性,并能在压缩网络参数量和训练时间的前提下增加网络层数,提升了负荷监测的精度,适合被广泛推广和使用。
-
公开(公告)号:CN116471528A
公开(公告)日:2023-07-21
申请号:CN202310579592.6
申请日:2023-05-22
Applicant: 南京工程学院
IPC: H04R25/00
Abstract: 本发明公开了一种双耳助听器自声处理方法,该方法包括以下步骤:麦克风拾取佩戴者自声信号作为训练声学信号;根据双耳训练声学信号,估计佩戴者嘴部位置对应的耳间相对传递函数;麦克风拾取实际使用场景中的双耳声学信号,利用耳间相对传递函数分别抑制左右耳声学信号中的自声成分;自适应估计补偿滤波器,恢复自声抑制后信号中的外界声源成分,最终得到自声被抑制的输出语音信号。该方法可以实现对助听器佩戴者自声的抑制,并保留外界声源的自然度和空间信息。
-
公开(公告)号:CN111402929B
公开(公告)日:2022-09-20
申请号:CN202010185119.6
申请日:2020-03-16
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于域不变的小样本语音情感识别方法,包括如下步骤:从数据库提取具有时序信息的语音特征;建立LSTM模型,确定待训练的参数及初值;通过多任务学习同时进行情感识别与数据库分类,采用交叉熵结合加权系数,建立损失函数;在数据库分类任务的梯度更新中采取梯度取反的对抗学习方法;在梯度反向传播过程中,按各数据库样本比例对共享层进行梯度加权,得到最终的梯度公式;得到训练好的网络参数值;用预训练好的共享层参数来初始化新的模型,并在未知数据集上重训练,然后用重训练的模型对小样本测试集进行测试验证。本发明利用已知的情感数据集为未知小样本数据提供预训练,提高未知小样本数据库的情感识别性能。
-
公开(公告)号:CN109243493B
公开(公告)日:2022-09-16
申请号:CN201811273025.3
申请日:2018-10-30
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于改进长短时记忆网络的婴儿哭声情感识别方法,将婴儿哭声数据集语音进行端点检测并分帧,提取该婴儿哭声数据集语音的时序相关特征,并针对不同长度的时序相关特征建立长短时记忆网络的处理算法;然后,将注意力机制结合时序的深度的策略引入长短时记忆网络的遗忘门,输入门上,实验结果显示,该方法不但能大量减少模型参数,而且在实录的婴儿情感数据库上体现出显著的识别性能,且识别效率高,具有良好的应用前景。
-
-
-
-
-
-
-
-
-