一种面向语音情感识别的语谱特征提取方法

    公开(公告)号:CN104637497A

    公开(公告)日:2015-05-20

    申请号:CN201510020519.0

    申请日:2015-01-16

    Abstract: 本发明公开了一种面向语音情感识别的语谱特征提取方法,步骤一,对语音信号分帧,并进行快速傅里叶变换得到对应的语谱图;步骤二,对语谱图进行分解;步骤三,对分解图像进行中央周边差运算并归一化,得到每幅分解图的特征图;步骤四,提取每幅特征图的特征矩阵;步骤五,特征矩阵降维并重构。本发明从分析语音语谱特征的角度,综合运用图像处理的一些方法,从创新的角度挖掘情感识别的特征,采用多尺度多通道的滤波器对语谱图进行分解,在不同的特征域进行处理,并结合PCA分析,更好的挖掘对语音情感有益的信息。

    一种基于融合空间特征的多通道语音增强方法

    公开(公告)号:CN119446166A

    公开(公告)日:2025-02-14

    申请号:CN202411674055.0

    申请日:2024-11-21

    Abstract: 本发明公开了一种基于融合空间特征的多通道语音增强方法,首先从带噪多通道语音中分别提取多通道复频谱特征和融合空间特征,再将提取的多通道复频谱特征和融合空间特征输入深度神经网络进行处理并设定处理目标为理想复值比率掩蔽,再构建基于复卷积编码器解码器结构的深度复卷积循环语音增强网络,再利用深度复卷积循环语音增强网络对多通道复频谱特征和融合空间特征进行处理,输出预测复值比率掩蔽。本发明充分整合光谱信息、方向特征、通道间特征和相关系数特征,并对动态声源进行空间建模,使得网络对于语音信号的理解和处理能力远超传统方法,能够有效应对复杂多变的语音场景,有效地提升静态场景和动态场景下的语音增强效果。

    一种风热机组最优模型预测抗干扰控制器参数整定方法

    公开(公告)号:CN117872729A

    公开(公告)日:2024-04-12

    申请号:CN202311404984.5

    申请日:2023-10-26

    Abstract: 本发明公开了一种风热机组最优模型预测抗干扰控制器参数整定方法,包括以下步骤:基于拉普拉斯运算推导风热机组最优模型预测抗干扰控制器的频域形式;根据频域形式的控制律求解风热机组开环传递函数,确定控制器的待整定参数;基于频域特性法分析待整定参数对风热机组闭环系统稳定裕度的影响;根据待整定参数对闭环系统稳定裕度的影响对待整定参数进行重要性排序,结合重要性排序的结果和期望的风热机组闭环系统稳定裕度,对待整定参数进行整定。本发明提供的一种风热机组最优模型预测抗干扰控制器参数整定方法,能够直观反映与保证风热机组的闭环稳定性,避免系统在最优模型预测抗干扰控制器控制下存在失稳的风险,使风热机组能够安全稳定运行。

    适于智慧医疗的信道均方根时延扩展预测方法

    公开(公告)号:CN111212003B

    公开(公告)日:2023-04-25

    申请号:CN202010092945.6

    申请日:2020-02-14

    Abstract: 本发明公开了一种适于智慧医疗的信道均方根时延扩展预测方法,包括:(1)模拟智慧医疗的多种场景,对实际环境中发送和接收天线之间的信道进行测量,(2)计算实测信道的均方根时延扩展,(3)利用实测所得均方根时延扩展对基于多层前馈神经网络的信道均方根时延扩展模型进行训练和参数提取,(4)使用均方根时延扩展模型和提取出的模型参数预测智慧医疗场景下的信道均方根时延扩展特性。本发明能够精确地估计多种较短距离智慧医疗场景下的信道均方根时延扩展特性,考虑了收发天线之间距离、收发天线高度、不同环境和传播情况的因素,且具有较好的扩展性和通用性,对智慧医疗中通信系统信号和算法设计以及网络部署都有重要的实际价值。

    一种工业物联网环境中路径损耗预测方法和系统

    公开(公告)号:CN114866168A

    公开(公告)日:2022-08-05

    申请号:CN202210463903.8

    申请日:2022-04-29

    Abstract: 本发明提供一种工业物联网环境中路径损耗预测方法和系统,其中方法包括获取信号发送功率、信号接收功功率、信号发送频率以及信号发送点与信号接收点的距离;构建实际路径损耗模型;拟合实际路径损耗模型的参数;计算频率路径损耗修正项;计算传播条件路径损耗修正项;计算金属机器遮挡路径损耗修正项;根据频率路径损耗修正项、传播条件路径损耗修正项和金属机器遮挡路径损耗修正项,构建路径损耗预测模型。本发明考虑工业物联网场景多频段、不同传播条件和金属机器遮挡的特点,能够精确地估计工业物联网场景下的路径损耗特性。解决现有的路径损耗预测方法可扩展性较差且难以适用于工业物联网场景的问题。

    一种基于双目立体的身体模型测量装置及方法

    公开(公告)号:CN111721197B

    公开(公告)日:2022-02-01

    申请号:CN202010406959.0

    申请日:2020-05-14

    Abstract: 本发明是一种基于双目立体的身体模型测量装置及方法,测量装置包括双目相机和若干阵列状贴覆在人体表面单色LED发光管,每一行单色LED发光管的负极均相互连接并通过一组负极控制器与电源负极连接;每一列单色LED发光管的正极均相互连接并通过一组正极控制器与电源正极连接;单色LED发光管在同一时间有且只有一组处于工作状态;双目相机的两组镜头用于同时拍摄人体正面或反面内每个单色LED发光管坐标位置图像,通过两组镜头在拍摄任意一组单色LED发光管时的焦距和该单色LED发光管在拍摄图像中的坐标位置计算得到每一个单色LED发光管的精确空间坐标。通过采集人体表面全部单色LED发光管的三维坐标,进而获取人体表面的三维坐标集合,能够完成人体模型的重建。

    基于多种特征融合的语音篡改检测方法

    公开(公告)号:CN110853668B

    公开(公告)日:2022-02-01

    申请号:CN201910845466.4

    申请日:2019-09-06

    Abstract: 本发明公开了一种基于多种特征融合的语音篡改检测方法,检测语音文件是否为拼接而成,包括以下步骤:步骤S1、将待检测的语音数据进行分帧,划分为多组语音数据帧;步骤S2、对每组语音数据帧提取多维特征;步骤S3、构建基于Attention‑RNN的模型作为分类器;步骤S4、将步骤S2中提取到的多维特征输入训练好的分类器,从而判断当前帧语音是否被篡改。本发明的方法通过提取帧级特征能够有效挖掘语音信号中前后特征的差异,将多种特征相结合,语音特征挖掘更加丰富,利用注意力机制为同一样本的局部赋予不同的重要性,自动学习出时序信号的特征。

    基于网络模型融合的声场景分类方法

    公开(公告)号:CN110600054B

    公开(公告)日:2021-09-21

    申请号:CN201910845467.9

    申请日:2019-09-06

    Abstract: 本发明公开了一种基于网络模型融合的声场景分类方法,并通过声道分离方式和音频切割等方式构造出多种不同的输入特征,提取音频信号的伽马通滤波器倒谱系数、梅尔频谱特征及其一阶和二阶差分作为输入特征,分别训练对应的多种不同的卷积神经网络模型,最后采用支撑向量机堆叠方法实现最终的融合模型。本发明采用声道分离和音频切割等方式提取出识别性强的音频输入特征,构造了单双两种通道的卷积神经网络,最终生成独特的模型融合结构,能够获得更加丰富与立体的信息,有效提高了不同的声场景分类识别率和鲁棒性,具有良好的应用前景。

Patent Agency Ranking