一种采样率差异估计与校正系统及其处理方法

    公开(公告)号:CN101645273A

    公开(公告)日:2010-02-10

    申请号:CN200910088731.5

    申请日:2009-07-10

    Inventor: 付强 颜永红 覃波

    Abstract: 本发明提供一种采样率差异估计与校正系统及其处理方法。该系统包括采样率差异估计模块和采样率校正模块。首先通过采样率差异估计模块,利用改进的相位变换算法IPHAT,求两路信号的互相关函数;然后,计算它们之间的整数点采样率差异;接着进一步采用基于sinc函数内插的方法,获得分数阶的采样率差异;将整数点的采样率差异与分数阶采样率差异相加,即得到两路信号之间的更为精确的采样率差异值;在计算出两路信号之间的采样率差异以后,通过采样率校正模块,利用抽取和内插滤波器对其中一路信号进行重采样校正。该方法可解决ANC/BSS等多通道信号处理算法在实际应用中存在的由于设备或者环境的原因导致标称为同一采样率的多通道信号出现采样率不一致的问题。

    一种自动嗓音谐噪比分析方法

    公开(公告)号:CN101452698A

    公开(公告)日:2009-06-10

    申请号:CN200710178362.X

    申请日:2007-11-29

    Abstract: 本发明提供一种自动嗓音谐噪比分析方法,包括:1)从录音中切分出进行谐噪比分析的有效语音段;2)基于听觉模型,对所述语音段进行滤波处理,然后计算听觉模型中各滤波器通道中的在时域和频域二维的能量相关系数;3)设定所述相关系数的阈值,当步骤2)得出的相关系数大于该阈值时,则该相关系数所对应的时域和频域坐标点为谐波成份,否则,该相关系数所对应的时域和频域坐标点为噪音成份,最后计算谐波成份与噪音成份的比值得出谐噪比。本发明使用自相关图表征的时域和耳蜗谱域通道之间相关性来判断谐波成份,不受基频检测位置的影响,能够更准确更鲁棒的检测出谐波成份。由于使用耳蜗谱,本发明与人耳的真实听觉更加匹配。

    一种基于数字信号处理的语音变声方法

    公开(公告)号:CN1567428A

    公开(公告)日:2005-01-19

    申请号:CN03137014.4

    申请日:2003-06-19

    Abstract: 本发明公开了一种基于数字信号处理的语音变声方法,包括步骤(1)选取需要变声的原始语音信号;(2)得到原始语音信号的基音周期长度;(3)根据基音周期长度定位整个原始语音信号的每一个基音周期的位置;(4)在原始语音信号中的基音周期之间删除/插入基音周期,得到缩短/伸长的语音信号;(5)将缩短/伸长的语音信号线性伸长/压缩至与原始语音信号一致的长度,得到变声后的语音信号。本发明是基于数字信号处理的语音变声方法,该方法简单实用,运算量很小,适于在DSP芯片上实时实现,变声的语音的自然度很高。而且变声后的语音的长度与原始语音长度一致,有利于实时传送变声后的语音信号。

    一种对话交互前端的回声消除和语音检测方法及装置

    公开(公告)号:CN1491018A

    公开(公告)日:2004-04-21

    申请号:CN02148685.9

    申请日:2002-11-15

    Abstract: 本发明涉及一种对话交互前端的回声消除和语音检测方法,包括下述步骤:利用含有录音和放音通道的电话卡作为通信机对话交互前端的声音接口卡,及利用电话卡的两个通道进行回声消除步骤得到干净的语音残差数据;然后将语音残差数据进行语音信号自适应检测步骤,判断语音残差数据的类型;及当语音残差数据判断为语音时,则停止进行回声消除步骤并关闭放音通道;本发明利用普通电话卡的录音和放音通道,结合语音增强、语音识别和信号处理手段,实现回声的实时消除及语音的实时检测,以实现对话交互功能。

    一种嵌入式语音合成方法及系统

    公开(公告)号:CN1455386A

    公开(公告)日:2003-11-12

    申请号:CN02146655.6

    申请日:2002-11-01

    Abstract: 本发明公开了一种嵌入式语音合成方法及系统,用于手持数字移动通讯设备的操作系统,通过在该操作系统中加载文本分析模块、码字序列生成模块、语音解音码模块输入模块和波形拼接合成模块,可以使输入的文本信息转换成数字语音信号输出。该方法和系统可以充分利用该设备本身的资源,从而大大降低语音合成系统所占用的系统资源。依据本发明的语音合成系统占用的总资源不到500K字节,计算复杂度小于5MIPS,能够运行在当前主流的手机之中。

    一种听觉方位注意解码方法及装置

    公开(公告)号:CN118885872A

    公开(公告)日:2024-11-01

    申请号:CN202410911218.6

    申请日:2024-07-09

    Abstract: 本发明涉及脑机接口技术领域,公开了一种听觉方位注意解码方法及装置,方法包括:采集听者的脑电信号,得到一段脑电信号;预处理所述一段脑电信号,得到预处理后的脑电信号;对预处理后的脑电信号进行时频变换,得到脑电信号的时频能量谱;对得到的时频能量谱进行分帧处理,得到决策窗集合;把决策窗集合依次输入训练好的听觉方位注意解码模型,得到脑电信号的空间方位注意的分类概率;听觉方位注意解码模型包括:特征提取器、平均池化层、由全连接网络和Softmax激活函数构成的分类器。因为将脑电信号的时频能量谱作为输入,使解码模型更容易捕捉对听觉方位注意较为重要的脑电能量分布线索,所以有利于提高跨试次脑电数据解码的准确率。

    一种采用级联掩蔽估计的语音分离方法

    公开(公告)号:CN114822582B

    公开(公告)日:2024-10-18

    申请号:CN202110120278.2

    申请日:2021-01-28

    Abstract: 本发明公开了一种采用级联掩蔽估计的语音分离方法,所述方法包括:将混合声源信号输入编码器,输出隐藏空间矩阵;将隐藏空间矩阵输入声源分离器,输出待分离声源信号的掩蔽矩阵;所述声源分离器采用级联掩蔽估计分离器;将隐藏空间矩阵和掩蔽矩阵进行点乘,得到待分离声源信号在隐藏空间的估计值;将估计值输入解码器,输出分离后的目标信号波形。本发明的方法为了进一步提高多粒度特征融合的质量和效率,以跨粒度特征融合单元为基础,通过多级细化和逐粒度融合,逐步优化多时间粒度的融合特征,从而提高了分离出的目标信号的质量。

    利用音频判别模型对音频进行判别的判别设备及存储介质

    公开(公告)号:CN114400024B

    公开(公告)日:2024-09-03

    申请号:CN202210046402.X

    申请日:2022-01-14

    Abstract: 本说明书实施例提供一种利用音频判别模型对音频进行判别的判别设备及存储介质,判别设备包括:第一预处理模块,配置为对待判别咳嗽音频进行处理,得到目标梅尔谱特征;第一划分模块,配置为对目标梅尔谱特征进行划分,得到处于不同频段的第一梅尔谱特征和第二梅尔谱特征;频域特征提取模块,配置为将第一梅尔谱特征以及第二梅尔谱特征输入频域特征提取层,得到第一频域特征和第二频域特征;时序特征提取模块,配置为将第一梅尔谱特征及第二梅尔谱特征输入时序特征提取层,得到第一时序特征和第二时序特征;分类模块,配置为将第一频域特征、第二频域特征、第一时序特征和第二时序特征输入分类层,得到待判别咳嗽音频携带指定肺炎信息的概率。

Patent Agency Ranking