一种语音识别中的特征参数提取方法

    公开(公告)号:CN102646415A

    公开(公告)日:2012-08-22

    申请号:CN201210102804.3

    申请日:2012-04-10

    Applicant: 苏州大学

    Abstract: 本发明公开了一种语音识别中的特征参数提取方法,将数字语音样本采用低通滤波器和高通滤波器进行分割,低通滤波器滤波后的信号采用基于人耳听觉特性的巴克滤波器组方法提取巴克频率倒谱参数,并进行规整化处理;高通滤波器滤波后的信号采用非线性动力学的最大李雅普诺夫参数来描述;所述一种语音识别中的特征参数提取方法包括巴克频率倒谱系数参数的提取和最大李雅普诺夫参数的提取两个步骤。本发明采用低通滤波器和高通滤波器进行分割,使处理之后的信号更加符合人类的听觉特性,从而能够提取出性能更优秀的语音特征参数。

    一种基于音频处理的无损管道风险等级检测方法

    公开(公告)号:CN120089160A

    公开(公告)日:2025-06-03

    申请号:CN202510538735.8

    申请日:2025-04-27

    Applicant: 苏州大学

    Abstract: 本发明涉及管道检测技术领域,具体指一种基于音频处理的无损管道风险等级检测方法,包括:若音频分帧初始噪声模式为居民噪声模式,且该音频分帧中工业噪声特征带占比大于预设倍数的居民噪声特征带占比,则该音频分帧目标噪声模式为工业噪声模式;若音频分帧初始噪声模式为工业噪声模式,且该音频分帧中居民噪声特征带占比大于预设倍数的工业噪声特征带占比,则该音频分帧目标噪声模式为居民噪声模式;选择与每个音频分帧的目标噪声模式频率对应的滤波器进行去噪,得到每个目标音频分帧后进行合帧和特征处理,得到目标音频信号的特征集,输入训练好的分类器中,得到待检测管道的风险等级分类结果。本发明提升了管道风险等级分类结果精度。

    一种水声目标识别方法、装置及计算机可读存储介质

    公开(公告)号:CN120071969A

    公开(公告)日:2025-05-30

    申请号:CN202510550176.2

    申请日:2025-04-29

    Applicant: 苏州大学

    Abstract: 本发明属于目标识别技术领域,涉及一种水声目标识别方法、装置及计算机可读存储介质,从对应不同海域的数据集中获取多个类别相同的水声信号样本;获取每个水声信号样本属于各类别的预测概率;对每个水声信号样本属于各类别的预测概率进行参数化,输出每个水声信号样本的预测概率置信度分布不确定度;对多个水声信号样本属于各类别的预测概率和预测概率置信度分布不确定度进行融合,得到综合基本概率赋值和综合概率分布不确定度,输出多个水声信号样本的预测类别并计算水声目标识别损失函数的值;对卷积神经网络模块和基本概率分配模块进行训练,得到水声目标识别模型。本方案的水声目标识别模型对不同海域的水声信号均具有较高的识别准确率。

    深度强化学习方法、装置、设备及存储介质

    公开(公告)号:CN117591868A

    公开(公告)日:2024-02-23

    申请号:CN202210946401.0

    申请日:2022-08-08

    Applicant: 苏州大学

    Abstract: 本发明涉及一种深度强化学习方法、装置、设备及存储介质。所述深度强化学习方法包括:获取模型在分类任务的执行中针对样本的分类动作,并与获取的所述样本的标签进行对比;根据分类动作与所述标签的符合情况,确定当前轮的分类任务的终止状态;其中,所述样本包括第一样本和第二样本,所述第一样本的数量小于所述第二样本的数量。本发明所提供的深度强化学习方法、装置、设备及存储介质,能实现正负样本的均衡分类,进而提高模型对样本分类的准确性。

    基于特征提取和神经网络的水声目标测距方法

    公开(公告)号:CN111624586B

    公开(公告)日:2022-09-23

    申请号:CN202010463267.X

    申请日:2020-05-27

    Applicant: 苏州大学

    Abstract: 本发明一种基于特征提取和神经网络的水声目标测距方法,包括:第一步:采集水声目标在不同距离发出的水声信号,并按秒拆分数据,一秒的数据作为一个样本;第二步:对每个样本进行分帧;第三步:对每个样本的每一帧数据分别计算时域波形的过零率、MFCC的第2、5、8个系数、频谱质心、频谱偏度、频谱熵和频谱尖锐度。本发明的有益效果:本发明提出的基于特征提取和神经网络的水声目标测距方法直接对接收到的水声信号数据进行处理,实时性高,反应速度快。

    纳米材料的参数获取的方法和系统

    公开(公告)号:CN112733387A

    公开(公告)日:2021-04-30

    申请号:CN202110104896.8

    申请日:2021-01-26

    Applicant: 苏州大学

    Abstract: 本申请涉及纳米材料的参数获取的方法和系统。所述方法包括获取目标纳米材料的期望散射光谱。所述方法还包括基于所述期望散射光谱,利用第一训练后的模型,确定所述目标纳米材料的目标信息,所述目标纳米材料是由一个中心核和至少一层壳体组成的具有球壳结构的纳米粒子,所述目标信息包括目标结构参数、目标材料参数或所述目标纳米材料的目标温度中的至少一种。

    一种体现情感细节信息的情感语料库构建方法

    公开(公告)号:CN109509486B

    公开(公告)日:2021-04-09

    申请号:CN201811255066.X

    申请日:2018-10-26

    Applicant: 苏州大学

    Abstract: 本发明公开了一种体现情感细节信息的情感语料库构建方法,步骤一、构建语料库所使用的语句文本列表,步骤二、确认语料库使用的情感类别和表达程度,步骤三、通过若干录制人分别对语料库中的语句文本列表进行语音录制,生成若干情感语音样本;步骤四、通过若干评价人对所录制的情感语音样本进行评测,并以使用唤醒‑效价二维坐标的方式对每条情感语音样本进行情感标注,得到评测结果;步骤五、根据步骤四中得到的测评结果,对步骤三中每个录制人所录制的所有情感语音样本所表达的情感状态准确程度进行验证,步骤六、通过语句文本列表、经验证合格的情感语音样本和评测结果共同构建得到情感语料库。本发明解决了现有情感语料库不能体现情感强度的技术。

    一种基于声带特征参数的语音识别分类方法

    公开(公告)号:CN112562650A

    公开(公告)日:2021-03-26

    申请号:CN202011198843.9

    申请日:2020-10-31

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于声带特征参数的语音识别分类方法,首先搭建声带分层生物力学模型,以声带模型初始参数作为输入,求解声带耦合振动方程,输出声门波;同时采用迭代逆滤波算法获取实际嗓音信号中的声门波,构造两者关于时频域的目标函数以建立模型输出特征与嗓音信号之间的联系,匹配目标嗓音源,最终输出声带特征参数,将其与MFCC融合作为特征输入,对语音测试样本进行识别分类,确定测试样本类型。本发明根据声带分层生物力学模型提取了实际嗓音的声带特征参数,将基本声学特征与其融合,增加了语音声源信息,提高测试样本的识别率。

    一种在声门闭相下估计声道面积的方法

    公开(公告)号:CN108133713B

    公开(公告)日:2020-10-02

    申请号:CN201711206456.3

    申请日:2017-11-27

    Applicant: 苏州大学

    Abstract: 本发明公开了一种在声门闭相下声道面积的估计方法,首先采用DYPSA算法确定声门两个相邻闭合点位置,以相邻的两个闭合点为单位同步计算衰减的权重激励函数;接着利用加权线性预测方法计算声门闭相下声道模型的反射系数;然后迭代计算离散声道面积函数。从逆滤波角度验证本方法的优越性,选取六类声道面积特征进行识别分析,相比于用同一个语音库的特征融合优化算法实现了7%的准确率提升。

    基于大数据的水声目标智能识别方法

    公开(公告)号:CN110390949A

    公开(公告)日:2019-10-29

    申请号:CN201910661350.5

    申请日:2019-07-22

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于大数据的水声目标智能识别方法。本发明一种基于大数据的水声目标智能识别方法,包括:第一步:采集大量的水声目标声音信号数据,所述采集大量的水声目标声音信号数据满足预设时间、预设分类数量、预设通道数量,要求目标位置变化。本发明的有益效果:1、本发明提出的基于大数据的水声目标智能识别方法直接对接收到的水声信号数据进行处理,实时性高,反应速度快。

Patent Agency Ranking