Patent search ap:("中国科学院自动化研究所") AND inv:"聂帅" Page 1

1.

发明授权
一种骨传麦克风语音增强方法及装置、设备及存储介质有权

公开(公告)号：CN115862656B

公开(公告)日：2023-06-02

申请号：CN202310054459.9

申请日：2023-02-03

Applicant: 中国科学院自动化研究所

Inventor： 梁山 , 陶建华 , 聂帅 , 李冠君 , 易江燕

IPC: G10L21/0224 , G10L21/0232 , G10L19/26 , H04R1/08

Abstract: 本公开涉及一种骨传麦克风语音增强方法及装置、设备及存储介质，所述方法包括：获取两种频域信号，并根据预设的截止频率，对所述两种频域信号分别进行截取，得到两种截取后频域信号；对所述两种截取后频域信号分别进行半波整流，得到两种半波整流后时域信号；按照预设的中间频带，根据所述两种半波整流后时域信号确定融合因子；根据融合因子对所述两种截取后频域信号进行融合，得到骨传麦克风语音增强语音，根据预设的截止频率作为滤波器组，先对两种频域信号进行截取和融合，并通过半波整流对整体信号进行修正，实现对噪声的有效抑制，能够保留骨传导麦克风清晰的低频信号，同时对其缺失的中、高频信息进行补充，得到感知质量更高的音频信号。

2.

发明公开
一种骨传麦克风语音增强方法及装置、设备及存储介质有权

公开(公告)号：CN115862656A

公开(公告)日：2023-03-28

申请号：CN202310054459.9

申请日：2023-02-03

Applicant: 中国科学院自动化研究所

Inventor： 梁山 , 陶建华 , 聂帅 , 李冠君 , 易江燕

IPC: G10L21/0224 , G10L21/0232 , G10L19/26 , H04R1/08

Abstract: 本公开涉及一种骨传麦克风语音增强方法及装置、设备及存储介质，所述方法包括：获取两种频域信号，并根据预设的截止频率，对所述两种频域信号分别进行截取，得到两种截取后频域信号；对所述两种截取后频域信号分别进行半波整流，得到两种半波整流后时域信号；按照预设的中间频带，根据所述两种半波整流后时域信号确定融合因子；根据融合因子对所述两种截取后频域信号进行融合，得到骨传麦克风语音增强语音，根据预设的截止频率作为滤波器组，先对两种频域信号进行截取和融合，并通过半波整流对整体信号进行修正，实现对噪声的有效抑制，能够保留骨传导麦克风清晰的低频信号，同时对其缺失的中、高频信息进行补充，得到感知质量更高的音频信号。

3.

发明授权
篡改音频的检测方法、装置及存储介质有权

公开(公告)号：CN113421592B

公开(公告)日：2021-12-14

申请号：CN202110983510.5

申请日：2021-08-25

Applicant: 中国科学院自动化研究所

Inventor： 梁山 , 陶建华 , 聂帅 , 易江燕

IPC: G10L25/51

Abstract: 本公开涉及一种篡改音频的检测方法、装置及存储介质，上述方法包括：获取待检测信号，并分别通过低通滤波器和高通滤波器提取所述待检测信号的低频成分和高频成分；分别对所述低频成分和所述高频成分进行离散小波变换，并计算经过所述离散小波变换之后的低频成分对应的低频小波系数和经过所述离散小波变换之后的高频成分对应的高频小波系数；根据所述低频小波系数和所述高频小波系数，计算高低频能量比特征；根据所述高低频能量比特征对所述待检测信号进行篡改音频检测。采用上述技术手段，可以解决现有技术中，现有的检测篡改音频的方法的应用场景受限，在一些场景无法使用的问题。

4.

发明授权
篡改音频的检测方法、装置、电子设备及存储介质有权

公开(公告)号：CN113488070B

公开(公告)日：2021-11-16

申请号：CN202111048241.X

申请日：2021-09-08

Applicant: 中国科学院自动化研究所

Inventor： 梁山 , 陶建华 , 聂帅 , 易江燕

IPC: G10L25/24 , G10L25/18 , G10L25/51

Abstract: 本公开涉及一种篡改音频的检测方法、装置、电子设备及存储介质，上述方法包括：获取待检测信号，并对待检测信号进行第一预设阶数的小波变换，得到数量等于第一预设阶数的待检测信号对应的第一低频系数和第一高频系数；对阶数大于等于第二预设阶数的第一高频系数进行小波逆变换，得到待检测信号对应的第一高频分量信号；以帧为单位计算第一高频分量信号的第一梅尔倒谱特征，并将第一高频分量信号的当前帧信号和当前帧信号之前的预设数量的帧信号的第一梅尔倒谱特征融合，得到第一融合特征；通过深度学习模型对第一融合特征进行篡改音频检测。

5.

发明授权
麦克风阵列语音增强的方法、装置、电子设备及存储介质有权

公开(公告)号：CN113889137B

公开(公告)日：2022-04-01

申请号：CN202111473848.2

申请日：2021-12-06

Applicant: 中国科学院自动化研究所

Inventor： 聂帅 , 梁山 , 陶建华 , 易江燕

IPC: G10L21/0216 , G10L21/0232

Abstract: 本申请涉及一种麦克风阵列语音增强的方法、装置、电子设备及存储介质，所述方法包括：通过麦克风阵列获取已知声源方向的待增强语音信号；提取所述待增强语音信号的频谱特征和方向相干特征；将所述待增强语音信号的频谱特征和方向相干特征输入预先训练好的语音增强网络中，得到所述待增强语音信号的增强后傅里叶系数；对所述待增强语音信号的增强后傅里叶系数进行逆傅里叶变换，得到增强后语音信号，本申请通过语音增强网络实现了波束形成的滤波操作，并且波束形成的权重系数基于数据驱动的监督性学习方法训练得到，更接近实际应用场景，以提高语音增强效果。

6.

发明授权
一种语音鉴伪与说话人识别联合建模的方法有权

公开(公告)号：CN113555023B

公开(公告)日：2022-01-11

申请号：CN202111098690.5

申请日：2021-09-18

Applicant: 中国科学院自动化研究所

Inventor： 聂帅 , 陶建华 , 梁山 , 易江燕 , 傅睿博

IPC: G10L17/04 , G10L17/18 , G10L17/02 , G06N3/08 , G06N3/04

Abstract: 本发明提供一种语音鉴伪与说话人识别联合建模的方法及系统，其中方法包括：前端信号处理：把训练数据通过信号重采样统一到一个固定采样率，得到信号处理后的训练数据；特征提取：对信号处理后的训练数据的每帧信号提取Fbank特征；表示向量提取：通过滑窗的方式将训练数据的Fbank特征切分成若干长度为T的片段序列，再将片段序列输入可以识别说话人的深度学习网络，得到说话人片段表示向量，并构造帧级别说话人识别损失函数；语音鉴伪和说话人识别联合分类：定说话人识别网络的目标函数；定义语音鉴伪网路的目标函数；联合帧级别说话人识别损失函数、片段级别说话人识别目标函数和语音鉴伪目标函数三个函数进行联合优化。

7.

发明公开
一种语音鉴伪与说话人识别联合建模的方法有权

公开(公告)号：CN113555023A

公开(公告)日：2021-10-26

申请号：CN202111098690.5

申请日：2021-09-18

Applicant: 中国科学院自动化研究所

Inventor： 聂帅 , 陶建华 , 梁山 , 易江燕 , 傅睿博

IPC: G10L17/04 , G10L17/18 , G10L17/02 , G06N3/08 , G06N3/04

Abstract: 本发明提供一种语音鉴伪与说话人识别联合建模的方法及系统，其中方法包括：前端信号处理：把训练数据通过信号重采样统一到一个固定采样率，得到信号处理后的训练数据；特征提取：对信号处理后的训练数据的每帧信号提取Fbank特征；表示向量提取：通过滑窗的方式将训练数据的Fbank特征切分成若干长度为T的片段序列，再将片段序列输入可以识别说话人的深度学习网络，得到说话人片段表示向量，并构造帧级别说话人识别损失函数；语音鉴伪和说话人识别联合分类：定义片段级别说话人识别目标函数；定义语音鉴伪目标函数；联合帧级别说话人识别损失函数、片段级别说话人识别目标函数和语音鉴伪目标函数三个目标进行联合优化。

8.

发明公开
篡改音频的检测方法、装置、电子设备及存储介质有权

公开(公告)号：CN113488070A

公开(公告)日：2021-10-08

申请号：CN202111048241.X

申请日：2021-09-08

Applicant: 中国科学院自动化研究所

Inventor： 梁山 , 陶建华 , 聂帅 , 易江燕

IPC: G10L25/24 , G10L25/18 , G10L25/51

Abstract: 本公开涉及一种篡改音频的检测方法、装置、电子设备及存储介质，上述方法包括：获取待检测信号，并对待检测信号进行第一预设阶数的小波变换，得到数量等于第一预设阶数的待检测信号对应的第一低频系数和第一高频系数；对阶数大于等于第二预设阶数的第一高频系数进行小波逆变换，得到待检测信号对应的第一高频分量信号；以帧为单位计算第一高频分量信号的第一梅尔倒谱特征，并将第一高频分量信号的当前帧信号和当前帧信号之前的预设数量的帧信号的第一梅尔倒谱特征融合，得到第一融合特征；通过深度学习模型对第一融合特征进行篡改音频检测。

9.

发明授权
基于相位偏移检测的数字音频篡改取证方法有权

公开(公告)号：CN113178199B

公开(公告)日：2021-08-31

申请号：CN202110727936.4

申请日：2021-06-29

Applicant: 中国科学院自动化研究所

Inventor： 梁山 , 聂帅 , 陶建华 , 易江燕

IPC: G10L19/02 , G10L25/21 , G10L25/51

Abstract: 本发明提供基于相位偏移检测的数字音频篡改取证方法，包括：将待鉴别信号与时间标签做乘积，得到待鉴别信号的调制信号；再对所述待鉴别信号和所述调制信号进行短时傅里叶变换，得到鉴别信号功率谱和调制信号功率谱；应用所述鉴别信号功率谱和调制信号功率谱计算群延迟特征；对所述群延迟特征做均值计算，再应用均值计算结果做平滑计算，得到当前帧信号的相位信息；应用所述当前帧信号的相位信息计算动态阈值，在应用所述动态阈值和所述当前帧信号的相位信息来判定所述待鉴别信号是否被篡改。

10.

发明授权
语音控制方法、装置、电子设备及存储介质有权

公开(公告)号：CN113436629B

公开(公告)日：2024-06-04

申请号：CN202110997178.8

申请日：2021-08-27

Applicant: 中国科学院自动化研究所

Inventor： 聂帅 , 陶建华 , 梁山 , 易江燕 , 傅睿博

IPC: G10L15/22 , G10L15/14 , G10L15/06

Abstract: 本申请涉及一种语音控制方法、装置、电子设备及存储介质，所述语音控制方法，包括以下步骤：获取已知唤醒词的音节；确定与所述唤醒词对应的非唤醒词的音节；根据所述唤醒词的音节、所述非唤醒词的音节和预设的垃圾词信息构建唤醒词解码网络，以根据所述唤醒词解码网络对输入的语音进行解码，并根据解码结果确定是否执行唤醒操作，本申请在解码网络中引入非唤醒词的音节从而统一描述非唤醒词，能够降低非唤醒词引起的误唤醒率。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification