一种混音编码方法、装置和系统

    公开(公告)号:CN101414463B

    公开(公告)日:2011-08-10

    申请号:CN200710181376.7

    申请日:2007-10-19

    IPC分类号: G10L19/00 G10L11/00 G10L11/02

    摘要: 本发明公开了一种终端侧编码方法,根据混音策略对声音信息设置混音标识,根据所述混音标识信息对所述声音信息进行编码获得核心编码数据;若所述混音标识信息为需要混音,则计算动态边信息,生成并输出包含所述混音标识、核心编码数据和动态边信息的音频编码码流;若所述混音标识信息为不需要混音,则终端生成并输出包含所述混音标识和核心编码数据的音频编码码流。本发明还公开了相应的网络侧的混音编码方法,以及用于进行混音编码的装置和系统。本发明方案可以解决混音时信号溢出以及引入误差的问题,并且不会降低编码效率。

    编码解码系统、方法及装置

    公开(公告)号:CN101547010B

    公开(公告)日:2011-07-06

    申请号:CN200810102577.8

    申请日:2008-03-24

    IPC分类号: H03M7/30

    摘要: 本发明实施例涉及一种编码解码系统、方法及装置。该编码方法包括:编码模式判别器,用于根据待编码信号的动态范围、预测编码模式编码所需比特数估计值和动态范围编码模式编码所需比特数估计值判别待编码信号应采用的编码模式,生成并发送编码模式相对应的编码模式标识位及相对应的编码所需参数;编码器,用于根据编码模式相对应的编码模式标识位对所述待编码信号进行编码;复用器,用于对编码后的信号进行复用,其中所述编码后的信号包括编码后的待编码信号、所述编码模式标识位及所述编码所需参数。本发明实施例能够根据待编码信号的类型和特性选择不同编码模式来满足不同的复杂度和压缩效率应用需求,从而实现较高的压缩效率和较低的复杂度。

    一种舒适噪声参数产生方法和装置

    公开(公告)号:CN101303855B

    公开(公告)日:2011-06-22

    申请号:CN200710104395.X

    申请日:2007-05-11

    IPC分类号: G10L19/00

    CPC分类号: G10L19/012

    摘要: 本发明实施例公开了一种舒适噪声参数产生方法,包括:计算当前一组连续帧中各帧的能量特征值以及频谱特征值;从所述计算出的各帧能量特征值中选择出一个能量特征值,作为当前舒适噪声的能量参数输出;从所述计算出的各帧频谱特征值中选择出一个频谱特征值,将所述选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数输出。本发明实施例同时公开了一种舒适噪声参数产生装置,应用该方法和装置能够实现简单方便地生成舒适噪声参数。

    一种音频编码方法和音频编码器

    公开(公告)号:CN101740033A

    公开(公告)日:2010-06-16

    申请号:CN200810181909.6

    申请日:2008-11-24

    IPC分类号: G10L19/12 G10L19/14

    摘要: 本发明公开了一种音频编码方法和音频编码器方法。本发明实施例还提供相应的音频编码器。本发明技术方案由于利用线性预测LP和卷曲线性预测WLP的频率分辨特性非常接近人类听觉特性中的临界频带和掩蔽特性的特点,建立心理声学模型,获取到掩蔽门限,根据获取的掩蔽门限对音频信号进行编码,降低了建立心理声学模型的复杂度,易于实现,降低了心理声学模型在硬件实现的成本,降低了硬件的功率消耗。

    一种解码方法及装置
    36.
    发明授权

    公开(公告)号:CN100578618C

    公开(公告)日:2010-01-06

    申请号:CN200610162678.5

    申请日:2006-12-04

    CPC分类号: G10L19/005

    摘要: 本发明涉及一种解码方法及装置。本发明中主要包括接收编码端发来的数据帧,若发生坏帧,则计算确定当前坏帧的谱参数,根据计算确定的坏帧的谱参数进行解码操作获得解码后的数据,其中,确定坏帧的谱参数的处理过程包括:首先,确定当前发生的连续坏帧数量、坏帧之前的好帧的谱参数及谱参数的常数平均值;之后,根据所述连续坏帧数量,将所述的好帧的谱参数向所述谱参数的常数平均值进行自适应偏移,计算获得当前坏帧的谱参数信息。由于本发明是在发生连续坏帧时,逐渐减小最近好帧谱参数与当前坏帧谱参数的相关度,因而可以获得更为准确的当前坏帧的谱参数,进而令在相同码率及帧错误率情况下可获得更好的语音质量。

    声音信号分类方法和装置
    37.
    发明授权

    公开(公告)号:CN100483509C

    公开(公告)日:2009-04-29

    申请号:CN200610164456.7

    申请日:2006-12-05

    IPC分类号: G10L19/14 G10L19/08 G10L19/00

    CPC分类号: G10L25/78 G10L19/20

    摘要: 本发明公开了一种声音信号分类方法,包括:接收声音信号,根据背景噪声频谱分布参数和所述声音信号的频谱分布参数确定背景噪声的更新速率;根据所述更新速率对噪声参数进行更新,并根据子带能量参数和更新后的噪声参数对所述声音信号进行分类。本发明还公开了一种声音信号分类装置,包括:背景噪声参数更新模块,用于根据背景噪声频谱分布参数和当前声音信号的频谱分布参数确定背景噪声的更新速率,并发送所述确定的更新速率;PSC模块,用于接收来自所述背景噪声参数更新模块的更新速率,对噪声参数进行更新,并根据子带能量参数和更新后的噪声参数对当前声音信号进行分类,并发送分类确定的声音信号类型。

    语音解码器中实现语音解码的方法及装置

    公开(公告)号:CN101226744A

    公开(公告)日:2008-07-23

    申请号:CN200710001186.2

    申请日:2007-01-19

    IPC分类号: G10L19/00 G10L19/12 G10L19/14

    摘要: 本发明涉及一种解码方法及装置。其包括接收编码端发来的数据帧,若发生坏帧,则计算确定坏帧的基音延迟参数,根据计算确定的坏帧的基音延迟参数进行解码操作,获得解码后的数据;其中,所述确定坏帧的基音延迟参数的处理过程具体包括:首先,确定发生的连续坏帧数量和之前帧的基音延迟参数;之后,根据所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,计算获得当前坏帧的基音延迟参数,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动。从而可以克服解码过程中可能出现的过度周期性问题,且可以保证解码的准确性。

    人声增强方法、装置及设备

    公开(公告)号:CN110097888B

    公开(公告)日:2021-08-20

    申请号:CN201810089567.9

    申请日:2018-01-30

    发明人: 许丽净

    摘要: 本申请提供一种人声增强方法、装置及设备,该方法包括:对第一音频帧的频域信号进行初始音调分量检测、周期性分析和连续性分析;若在所述频域信号中检测到音调分量,则在所述频域信号中确定音调分量所处的频带集合,所述音调分量用于表达人声,所述频带集合中包括N个频带,所述N为大于或等于1的正整数;根据所述N个频带,确定N个增强滤波器;通过所述N个增强滤波器,对所述频域信号进行增强处理,得到频域增强信号;对所述第一音频帧的频域信号和所述频域增强信号进行混音,得到人声增强信号。提高了对人声增强的效果。