-
公开(公告)号:CN101645273A
公开(公告)日:2010-02-10
申请号:CN200910088731.5
申请日:2009-07-10
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L21/02
Abstract: 本发明提供一种采样率差异估计与校正系统及其处理方法。该系统包括采样率差异估计模块和采样率校正模块。首先通过采样率差异估计模块,利用改进的相位变换算法IPHAT,求两路信号的互相关函数;然后,计算它们之间的整数点采样率差异;接着进一步采用基于sinc函数内插的方法,获得分数阶的采样率差异;将整数点的采样率差异与分数阶采样率差异相加,即得到两路信号之间的更为精确的采样率差异值;在计算出两路信号之间的采样率差异以后,通过采样率校正模块,利用抽取和内插滤波器对其中一路信号进行重采样校正。该方法可解决ANC/BSS等多通道信号处理算法在实际应用中存在的由于设备或者环境的原因导致标称为同一采样率的多通道信号出现采样率不一致的问题。
-
公开(公告)号:CN101452698A
公开(公告)日:2009-06-10
申请号:CN200710178362.X
申请日:2007-11-29
Applicant: 中国科学院声学研究所 , 中国科学院物理研究所
IPC: G10L11/00
Abstract: 本发明提供一种自动嗓音谐噪比分析方法,包括:1)从录音中切分出进行谐噪比分析的有效语音段;2)基于听觉模型,对所述语音段进行滤波处理,然后计算听觉模型中各滤波器通道中的在时域和频域二维的能量相关系数;3)设定所述相关系数的阈值,当步骤2)得出的相关系数大于该阈值时,则该相关系数所对应的时域和频域坐标点为谐波成份,否则,该相关系数所对应的时域和频域坐标点为噪音成份,最后计算谐波成份与噪音成份的比值得出谐噪比。本发明使用自相关图表征的时域和耳蜗谱域通道之间相关性来判断谐波成份,不受基频检测位置的影响,能够更准确更鲁棒的检测出谐波成份。由于使用耳蜗谱,本发明与人耳的真实听觉更加匹配。
-
公开(公告)号:CN1703923A
公开(公告)日:2005-11-30
申请号:CN200380101122.X
申请日:2003-10-17
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
CPC classification number: H04M1/271 , G10L15/26 , G10L2015/027
Abstract: 本发明公开一种具有语音操作系统的便携式数字移动通讯设备及语音操作控制方法,在进行语音识别时是利用特征码本对语音的特征矢量序列进行量化编码,而在解码运算中对有效语音特征码字矢量序列的各个码字,是直接从概率表中查到其在搜索路径上的观察概率;采用本发明,可以在手机中实现全音节的语音识别,无需训练,并可实现汉字语音输入和全音节的语音提示,系统具有语义分析、对话管理和语言生成模块,可以处理复杂的对话过程并产生灵活的提示信息反馈给用户,本发明还可由用户进行语音命令和提示内容的定制。
-
公开(公告)号:CN1567428A
公开(公告)日:2005-01-19
申请号:CN03137014.4
申请日:2003-06-19
Applicant: 北京中科信利技术有限公司 , 中国科学院声学研究所
Abstract: 本发明公开了一种基于数字信号处理的语音变声方法,包括步骤(1)选取需要变声的原始语音信号;(2)得到原始语音信号的基音周期长度;(3)根据基音周期长度定位整个原始语音信号的每一个基音周期的位置;(4)在原始语音信号中的基音周期之间删除/插入基音周期,得到缩短/伸长的语音信号;(5)将缩短/伸长的语音信号线性伸长/压缩至与原始语音信号一致的长度,得到变声后的语音信号。本发明是基于数字信号处理的语音变声方法,该方法简单实用,运算量很小,适于在DSP芯片上实时实现,变声的语音的自然度很高。而且变声后的语音的长度与原始语音长度一致,有利于实时传送变声后的语音信号。
-
公开(公告)号:CN1491018A
公开(公告)日:2004-04-21
申请号:CN02148685.9
申请日:2002-11-15
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明涉及一种对话交互前端的回声消除和语音检测方法,包括下述步骤:利用含有录音和放音通道的电话卡作为通信机对话交互前端的声音接口卡,及利用电话卡的两个通道进行回声消除步骤得到干净的语音残差数据;然后将语音残差数据进行语音信号自适应检测步骤,判断语音残差数据的类型;及当语音残差数据判断为语音时,则停止进行回声消除步骤并关闭放音通道;本发明利用普通电话卡的录音和放音通道,结合语音增强、语音识别和信号处理手段,实现回声的实时消除及语音的实时检测,以实现对话交互功能。
-
公开(公告)号:CN1455386A
公开(公告)日:2003-11-12
申请号:CN02146655.6
申请日:2002-11-01
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L13/02
Abstract: 本发明公开了一种嵌入式语音合成方法及系统,用于手持数字移动通讯设备的操作系统,通过在该操作系统中加载文本分析模块、码字序列生成模块、语音解音码模块输入模块和波形拼接合成模块,可以使输入的文本信息转换成数字语音信号输出。该方法和系统可以充分利用该设备本身的资源,从而大大降低语音合成系统所占用的系统资源。依据本发明的语音合成系统占用的总资源不到500K字节,计算复杂度小于5MIPS,能够运行在当前主流的手机之中。
-
公开(公告)号:CN118885872A
公开(公告)日:2024-11-01
申请号:CN202410911218.6
申请日:2024-07-09
Applicant: 中国科学院声学研究所
IPC: G06F18/241 , A61B5/372 , A61B5/38 , G06F18/214 , G06F18/213 , G06F18/10 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及脑机接口技术领域,公开了一种听觉方位注意解码方法及装置,方法包括:采集听者的脑电信号,得到一段脑电信号;预处理所述一段脑电信号,得到预处理后的脑电信号;对预处理后的脑电信号进行时频变换,得到脑电信号的时频能量谱;对得到的时频能量谱进行分帧处理,得到决策窗集合;把决策窗集合依次输入训练好的听觉方位注意解码模型,得到脑电信号的空间方位注意的分类概率;听觉方位注意解码模型包括:特征提取器、平均池化层、由全连接网络和Softmax激活函数构成的分类器。因为将脑电信号的时频能量谱作为输入,使解码模型更容易捕捉对听觉方位注意较为重要的脑电能量分布线索,所以有利于提高跨试次脑电数据解码的准确率。
-
公开(公告)号:CN114822582B
公开(公告)日:2024-10-18
申请号:CN202110120278.2
申请日:2021-01-28
Applicant: 中国科学院声学研究所
IPC: G10L21/0272
Abstract: 本发明公开了一种采用级联掩蔽估计的语音分离方法,所述方法包括:将混合声源信号输入编码器,输出隐藏空间矩阵;将隐藏空间矩阵输入声源分离器,输出待分离声源信号的掩蔽矩阵;所述声源分离器采用级联掩蔽估计分离器;将隐藏空间矩阵和掩蔽矩阵进行点乘,得到待分离声源信号在隐藏空间的估计值;将估计值输入解码器,输出分离后的目标信号波形。本发明的方法为了进一步提高多粒度特征融合的质量和效率,以跨粒度特征融合单元为基础,通过多级细化和逐粒度融合,逐步优化多时间粒度的融合特征,从而提高了分离出的目标信号的质量。
-
公开(公告)号:CN114400024B
公开(公告)日:2024-09-03
申请号:CN202210046402.X
申请日:2022-01-14
Applicant: 中国科学院声学研究所
IPC: G10L25/66 , G10L25/18 , G10L25/30 , G06F18/2415 , G06F18/25 , G06N3/0464 , G06N3/0442 , G06N3/08 , G16H50/20
Abstract: 本说明书实施例提供一种利用音频判别模型对音频进行判别的判别设备及存储介质,判别设备包括:第一预处理模块,配置为对待判别咳嗽音频进行处理,得到目标梅尔谱特征;第一划分模块,配置为对目标梅尔谱特征进行划分,得到处于不同频段的第一梅尔谱特征和第二梅尔谱特征;频域特征提取模块,配置为将第一梅尔谱特征以及第二梅尔谱特征输入频域特征提取层,得到第一频域特征和第二频域特征;时序特征提取模块,配置为将第一梅尔谱特征及第二梅尔谱特征输入时序特征提取层,得到第一时序特征和第二时序特征;分类模块,配置为将第一频域特征、第二频域特征、第一时序特征和第二时序特征输入分类层,得到待判别咳嗽音频携带指定肺炎信息的概率。
-
公开(公告)号:CN112434716B
公开(公告)日:2024-03-29
申请号:CN201910774388.3
申请日:2019-08-21
Applicant: 中国科学院声学研究所
IPC: G06F18/24 , G06F18/213 , G06F18/10 , G01S15/00 , G01H3/00 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本发明公开了一种基于条件对抗生成网络的水下目标数据扩增方法及系统,所述方法包括:将某一目标类别对应的one‑hot向量与随机高斯白噪声级联,输入预先训练好的生成器,输出该目标类别的生成样本。本发明的方法能够利用少量的水下目标数据产生足量的与原样本类似的数据,使得其数据量能够满足深度学习的需求;而且能够利用一个模型实现多个目标类别的样本生成。
-
-
-
-
-
-
-
-
-