基于多种特征融合的语音篡改检测方法

    公开(公告)号:CN110853668A

    公开(公告)日:2020-02-28

    申请号:CN201910845466.4

    申请日:2019-09-06

    Abstract: 本发明公开了一种基于多种特征融合的语音篡改检测方法,检测语音文件是否为拼接而成,包括以下步骤:步骤S1、将待检测的语音数据进行分帧,划分为多组语音数据帧;步骤S2、对每组语音数据帧提取多维特征;步骤S3、构建基于Attention-RNN的模型作为分类器;步骤S4、将步骤S2中提取到的多维特征输入训练好的分类器,从而判断当前帧语音是否被篡改。本发明的方法通过提取帧级特征能够有效挖掘语音信号中前后特征的差异,将多种特征相结合,语音特征挖掘更加丰富,利用注意力机制为同一样本的局部赋予不同的重要性,自动学习出时序信号的特征。

    基于改进神经网络的音频篡改识别算法

    公开(公告)号:CN110853656A

    公开(公告)日:2020-02-28

    申请号:CN201910845468.3

    申请日:2019-09-06

    Abstract: 本发明公开了一种基于改进神经网络的音频篡改识别算法,其将任意大小的谱图池化成固定长度的谱图表示的CNNs结构和具有注意力机制的LSTM结构,将信号的梅尔谱图和帧级特征引入到语音篡改识别算法中,综合了音频信号的频谱和时序信息;通过在CNNs结构中加入改进池化层,使得CNNs可以输入任意尺寸谱图,解决音频长度不固定问题;增加注意力机制挖掘高层特征的权重比例,最终得到优质的音频特征;并利用数据融合理论进行决策融合的算法;提高音频篡改识别的识别率和模型的鲁棒性。本发明能够有效识别出音频篡改与否,克服了传统音频篡改识别率较低的问题。

    基于多重注意力机制长短时记忆网络的儿童情感识别方法

    公开(公告)号:CN109243494A

    公开(公告)日:2019-01-18

    申请号:CN201811273105.9

    申请日:2018-10-30

    Abstract: 本发明公开了一种基于多重注意力机制长短时记忆网络的儿童情感识别方法,将测试集语音进行端点检测且分帧切割,提取时序相关特征;对于长度不同的提取时序相关特征建立长短时记忆网络的处理算法;将注意力机制结合时序的深度的策略引入长短时记忆网络的遗忘门,输入门以及最终输出上;最后,将待测样本输入训练过程中的改进长短时记忆网络,可显著识别出其情感信息,本发明通过将注意力机制结合时序的深度引入长短时记忆网络的遗忘门,输出门,以及长短时记忆网络的最终输出上,在大量减少参数量的同时,提升了算法性能,增加了方法设计上的灵活性,且识别效率高,具有良好的应用前景。

    基于改进长短时记忆网络的婴儿哭声情感识别方法

    公开(公告)号:CN109243493A

    公开(公告)日:2019-01-18

    申请号:CN201811273025.3

    申请日:2018-10-30

    Abstract: 本发明公开了一种基于改进长短时记忆网络的婴儿哭声情感识别方法,将婴儿哭声数据集语音进行端点检测并分帧,提取该婴儿哭声数据集语音的时序相关特征,并针对不同长度的时序相关特征建立长短时记忆网络的处理算法;然后,将注意力机制结合时序的深度的策略引入长短时记忆网络的遗忘门,输入门上,实验结果显示,该方法不但能大量减少模型参数,而且在实录的婴儿情感数据库上体现出显著的识别性能,且识别效率高,具有良好的应用前景。

    一种助听器自验配方法

    公开(公告)号:CN104053112A

    公开(公告)日:2014-09-17

    申请号:CN201410292892.7

    申请日:2014-06-26

    Abstract: 本发明公开了一种助听器自验配方法,该方法首先建立知识库,找出与当前患者最相似的历史患者,获得该历史患者的最优化助听器算法参数,然后当前患者对声音质量进行满意度评估,根据评价指标迭代更新助听器算法参数,并与知识库进行交互,然后根据更新的助听器算法参数生成测试声音给当前患者,直到当前患者满意为止。本发明引入知识库,极大地缩小了助听器算法参数匹配范围,显著提高了助听器验配效率;根据评价指标迭代更新助听器算法参数,最大限度的满足当前患者对助听器的期望值,提高了助听器算法参数的精确性。

    基于矩阵重构二维卷积网络的电力负载信息获取方法

    公开(公告)号:CN116341616B

    公开(公告)日:2023-10-17

    申请号:CN202211412348.2

    申请日:2022-11-11

    Abstract: 本发明公开了基于矩阵重构二维卷积网络的电力负载信息获取方法,首先采集电器的总用电功率并作为输入序列y,再在输入序列y中加入余弦位置编码并得到编码序列ye,接着对编码序列ye进行滑窗截取并得到序列重构矩阵M,随后对输入序列y进行单位延时并得到延时序列y1,再求得动态检测序列yd,然后对序列重构矩阵M进行奇异值分解并得到分解重构子矩阵Mi,再对动态检测序列yd进行滑窗截取并得到动态检测重构矩阵Md;本发明通过采用将序列延时重构为矩阵的方法,能够充分利用序列的时序特性,并能在压缩网络参数量和训练时间的前提下增加网络层数,提升了负荷监测的精度,适合被广泛推广和使用。

    一种双耳助听器自声处理方法
    37.
    发明公开

    公开(公告)号:CN116471528A

    公开(公告)日:2023-07-21

    申请号:CN202310579592.6

    申请日:2023-05-22

    Abstract: 本发明公开了一种双耳助听器自声处理方法,该方法包括以下步骤:麦克风拾取佩戴者自声信号作为训练声学信号;根据双耳训练声学信号,估计佩戴者嘴部位置对应的耳间相对传递函数;麦克风拾取实际使用场景中的双耳声学信号,利用耳间相对传递函数分别抑制左右耳声学信号中的自声成分;自适应估计补偿滤波器,恢复自声抑制后信号中的外界声源成分,最终得到自声被抑制的输出语音信号。该方法可以实现对助听器佩戴者自声的抑制,并保留外界声源的自然度和空间信息。

    基于改进长短时记忆网络的婴儿哭声情感识别方法

    公开(公告)号:CN109243493B

    公开(公告)日:2022-09-16

    申请号:CN201811273025.3

    申请日:2018-10-30

    Abstract: 本发明公开了一种基于改进长短时记忆网络的婴儿哭声情感识别方法,将婴儿哭声数据集语音进行端点检测并分帧,提取该婴儿哭声数据集语音的时序相关特征,并针对不同长度的时序相关特征建立长短时记忆网络的处理算法;然后,将注意力机制结合时序的深度的策略引入长短时记忆网络的遗忘门,输入门上,实验结果显示,该方法不但能大量减少模型参数,而且在实录的婴儿情感数据库上体现出显著的识别性能,且识别效率高,具有良好的应用前景。

    基于注意力机制和双路径深度残差网络的声场景分类方法

    公开(公告)号:CN111754988B

    公开(公告)日:2022-08-16

    申请号:CN202010585359.5

    申请日:2020-06-23

    Abstract: 本发明公开了一种基于注意力机制和双路径深度残差网络的声场景分类方法,包括如下步骤:对原始语音信号计算原始语音频谱图、水平频谱图和垂直频谱图,将水平频谱图和垂直频谱图变换得到新的两路时域信号;分别计算原始语音信号、新的两路时域信号的对数梅尔谱图以及一阶差分对数梅尔谱图和二阶差分对数梅尔谱图,并在通道维度上进行融合得到融合谱图;割在频率轴上将融合谱图平均分为高频谱图和低频谱图;搭建带有注意力层的双路径深度残差网络;将高频谱图和低频谱图输入深度残差网络,输出原始语音信号所属的声场景类别。本发明可以更好的捕获高频和低频分量的时频特性以及特征图中不同通道的重要度,提升了声场景分类系统的准确性和鲁棒性。

    基于序列延时重构CSP卷积神经网络的非侵入式负荷监测方法

    公开(公告)号:CN114745299A

    公开(公告)日:2022-07-12

    申请号:CN202210259630.5

    申请日:2022-03-16

    Abstract: 本发明公开了基于序列延时重构CSP卷积神经网络的非侵入式负荷监测方法,首先利用阵列信号处理的特性对数据集中的2xL长度时序序列通过序列延时重构为LxLx2维度的矩阵M,再针对矩阵M的特点利用CSP网络特性针对性的构建卷积神经网络,接着使用重构的矩阵M数据及CSP卷积神经网络进行训练并得到最优的网络参数,再在监测端布置网络并加载相应参数,再对输入数据进行分解,得到负荷电器的工作状态;本发明实现了在监测时考虑数据中的时序关系及状态变化,且在提升监测的精度的同时也保障了监测的效率,能够针对性的指导用户或企业合理和安全用电,并辅助电力供应部门完善电力调度工作,具有方法科学合理、适用性强和效果佳等优点。

Patent Agency Ranking