一种音调检测方法及装置
    11.
    发明授权

    公开(公告)号:CN106373594B

    公开(公告)日:2019-11-26

    申请号:CN201610797829.8

    申请日:2016-08-31

    发明人: 许丽净

    IPC分类号: G10L25/90

    摘要: 本发明公开了一种音调检测方法及装置,用于解决现有技术存在的检测的音调分量不准确的问题。该方法包括:获取音频信号的数据帧;确定所述数据帧包括的N种音频信号类型;所述N为大于1的正整数;针对所述数据帧按照第i种音频信号类型对应的初始音调检测规则进行检测,得到所述第i种音频信号类型的初始音调分量;其中,所述第i种音频信号类型为所述N种音频信号类型中的一种,i取遍不大于N的所有正整数;将得到的N种音频信号类型中每种音频信号类型的初始音调分量均作为所述数据帧包括的初始音调分量。

    人声增强方法、装置及设备

    公开(公告)号:CN110097888A

    公开(公告)日:2019-08-06

    申请号:CN201810089567.9

    申请日:2018-01-30

    发明人: 许丽净

    摘要: 本申请提供一种人声增强方法、装置及设备,该方法包括:对第一音频帧的频域信号进行初始音调分量检测、周期性分析和连续性分析;若在所述频域信号中检测到音调分量,则在所述频域信号中确定音调分量所处的频带集合,所述音调分量用于表达人声,所述频带集合中包括N个频带,所述N为大于或等于1的正整数;根据所述N个频带,确定N个增强滤波器;通过所述N个增强滤波器,对所述频域信号进行增强处理,得到频域增强信号;对所述第一音频帧的频域信号和所述频域增强信号进行混音,得到人声增强信号。提高了对人声增强的效果。

    一种根据频域能量对音频信号进行检测的方法和装置

    公开(公告)号:CN105338148A

    公开(公告)日:2016-02-17

    申请号:CN201410344826.X

    申请日:2014-07-18

    发明人: 许丽净

    IPC分类号: H04M1/24 G10L25/48

    摘要: 本发明实施例公开了一种根据频域能量对音频信号进行检测的方法和装置,该方法可包括:接收音频信号帧;获取所述音频信号帧的频域能量分布,其中,所述频域能量分布表示所述音频信号帧在频域上的能量分布特性;根据所述音频信号帧的所述频域能量分布,得到所述音频信号帧的频域能量分布导数的极大值分布特征;将所述音频信号帧及所述音频信号帧预设邻域范围内的每一帧作为一个帧集合,该帧集合包括待检测帧;根据所述帧集合的频域能量分布导数的极大值分布特征对所述待检测帧进行检测。本发明实施例可以实现对音频信号的检测。

    一种清浊音分类方法和装置

    公开(公告)号:CN102655000B

    公开(公告)日:2014-02-19

    申请号:CN201110052891.1

    申请日:2011-03-04

    发明人: 许丽净

    IPC分类号: G10L25/93

    摘要: 本发明实施例公开了一种清浊音分类方法和装置,其中方法的实现包括:接收音频的帧的数据;对接收到的数据进行音调分量检测得到音调分量;统计所述得到的音调分量获取全频带声压级、高频声压级、音调分量分布的周期性、音调分量分布的连续性中的至少一项;根据获取的全频带声压级、高频声压级、音调分量分布的周期性、音调分量分布的连续性中的至少一项确定当前帧属于清音还是浊音。据获取的全频带声压级、高频声压级、音调分量分布的周期性、音调分量分布的连续性中的至少一项确定当前帧属于清音还是浊音。不用试各种可能的编码模式,减少计算复杂度,从而提高编码效率。

    语音编解码收发方法及装置

    公开(公告)号:CN101325059B

    公开(公告)日:2011-12-21

    申请号:CN200710126718.5

    申请日:2007-06-15

    摘要: 本发明涉及通信领域,公开了一种语音编解码收发方法及装置,使得语音信号的编码效率得以增加,并提高了语音质量。本发明中对语音信号进行时频变换,得到X个频域变换系数,对这X个频域变换系数进行量化得到宽带编码信号,其中对相对重要的Y个频域变换系数以第一码本进行量化,对剩余的X-Y个频域变换系数以第二码本进行量化,第一码本的码字数量大于第二码本的码字数量,X≥Y≥1,发送得到的宽带编码信号。根据每个量化块的平均频谱幅度和最大频谱幅度的比值,来裁减该量化块中频域量化信号的精细频谱结构,其中,比值越小对精细频谱结构的裁减程度越大。

    生成心理声学模型的方法及装置

    公开(公告)号:CN102169694A

    公开(公告)日:2011-08-31

    申请号:CN201010123999.0

    申请日:2010-02-26

    IPC分类号: G10L19/02 G10L19/00

    摘要: 本发明公开了一种生成心理声学模型的方法及装置,属于音频处理技术领域。该方法包括:以修正离散余弦变换MDCT对输入的时域音频信号帧进行时频分析,得到MDCT频域参数;根据MDCT频域参数计算谱平坦测度函数、频谱局部最大主导分量扩展包络和频谱局部最小主导分量平均包络,并根据所述谱平坦测度函数、频谱局部最大主导分量扩展包络和频谱局部最小主导分量平均包络计算局部掩蔽门限;根据局部掩蔽门限,生成并输出全局掩蔽门限。本发明通过采用谱平坦测度函数计算局部掩蔽门限,实现对音频信号的音调掩蔽特性及非音调掩蔽特性进行区分处理,从而可以达到更合理地分配量化比特数,有效地提高量化效率的效果。

    一种噪声整形的方法和装置

    公开(公告)号:CN101388215B

    公开(公告)日:2011-01-12

    申请号:CN200710153953.1

    申请日:2007-09-15

    摘要: 本发明提供了一种噪声整形的方法和装置,对语音信号s(n)进行自适应的噪声整形处理,得到信号s1(n);对所述信号s1(n)进行固定的噪声整形处理,得到信号u(n);对信号u(n)进行语音编码,形成编码端的输出信号。还提供了一种噪声整形的方法和装置,将语音信号s(n)进行固定的噪声整形处理,得到信号s1′(n);对所述信号s1′(n)进行自适应的噪声整形处理,得到信号u′(n);对所述信号u′(n)进行语音编码,形成编码端的输出信号。由于固定的噪声整形处理和自适应的噪声整形处理均是对语音信号本身所做的噪声整形处理,而不涉及语音信号与预测滤波器的残差信号,所以,在解码端不需要做任何改变即可解码还原出经噪声整形的语音信号。

    音频信号的分类方法及装置

    公开(公告)号:CN101847412A

    公开(公告)日:2010-09-29

    申请号:CN200910129157.3

    申请日:2009-03-27

    IPC分类号: G10L19/02 G10L15/08

    摘要: 本发明的实施例公开了一种音频信号的分类方法及装置,涉及通信技术领域,解决了现有技术中在对音频信号的类型进行分类时,分类复杂度高问题。本发明实施例在接收到待分类音频信号后,获取待分类音频信号在至少一个子带中的音调特征参数;根据获取的特征参数判定所述待分类音频信号的类型。本发明实施例主要应用于对音频信号进行分类时的场景,实现可通过较简单的方法完成对音频信号的分类。

    一种在编解码中调整量化质量的方法和装置

    公开(公告)号:CN101192410B

    公开(公告)日:2010-05-19

    申请号:CN200610164330.X

    申请日:2006-12-01

    IPC分类号: G10L19/14 G10L19/08 H03M7/30

    CPC分类号: G10L19/032

    摘要: 本发明公开了一种在编码中调整量化质量的方法,该方法包括:利用两个或两个以上缩放因子,对用于编码的第一采样值进行调整后,对调整后的第一采样值进行量化得到量化采样值;从所得到的量化采样值中去除缩放因子的影响得到第二采样值,并利用第一采样值和第二采样值得到全局增益;将所得到的量化采样值、所述两个或两个以上的缩放因子的信息以及所得到的全局增益作为编码流输出。本发明还公开了一种在解码中调整量化质量的方法,在编码、解码中调整量化质量的装置。根据本发明公开的方法和装置,能够大大降低实现复杂度,能够更好地调整重要部分的量化质量,能够获得更好的编码效果。