一种极低速率高质量语音编解码方法及装置

    公开(公告)号:CN114400012B

    公开(公告)日:2024-10-22

    申请号:CN202210093723.5

    申请日:2022-01-26

    申请人: 武汉大学

    摘要: 一种极低速率高质量语音编解码方法及装置,涉及音频技术领域,方法包括步骤:S1.将待传输干净语音输入编码器;S2.编码器提取线性预测系数输入量化器量化后,打包为比特流进行传输;S3.接收所述比特流,并输入解量化器,得到解量化后的线性预测系数;S4.将该线性预测系数输入转换模型,转换模型输出该线性预测系数对应的梅尔谱向量;S5.将所述梅尔谱向量输入神经声码器得到重建解码语音。本发明去除参数的信息冗余,以降低编码比特率,同时提升解码语音质量,满足极低传输带宽环境下对高质量语音通信的需求。

    基于QMF的处理数据的时间对齐
    3.
    发明公开

    公开(公告)号:CN118262739A

    公开(公告)日:2024-06-28

    申请号:CN202410362409.1

    申请日:2014-09-08

    摘要: 本公开涉及基于QMF的处理数据的时间对齐。一种被配置为根据接收到的数据流的存取单元(110)来确定音频信号(237)的重构帧的音频解码器(100,300)被描述。存取单元(110)包括波形数据(111)和元数据(112),其中波形数据(111)和元数据(112)与音频信号(127)的同一重构帧相关联。音频解码器(100,300)包括被配置为根据波形数据(111)生成多个波形子带信号(123)的波形处理路径(101,102,103,104,105),以及被配置为根据元数据(111)生成解码后的元数据(128)的元数据处理路径(108,109)。

    基于频谱拉伸的带宽扩展音频编解码方法及装置

    公开(公告)号:CN111210831B

    公开(公告)日:2024-06-04

    申请号:CN201811397265.4

    申请日:2018-11-22

    发明人: 闫建新 王磊

    摘要: 基于频谱拉伸的带宽扩展音频编解码方法及装置。本发明涉及用于带宽扩展的音频编码方法及装置。所述音频具有低频部分与高频部分,所述方法包括步骤:将高频部分进行频域栅格划分得到频域栅格区域;在低频部分选择与所述频域栅格区域中的M个频域栅格区域对应匹配的拷贝频谱,M为自然数;确定拉伸因子,所述拉伸因子为与M个频域栅格区域中的频域栅格区域以及匹配的相应拷贝频谱相关的线性拉伸因子;和向解码端传送与拉伸因子有关的拉伸信息。本发明还涉及用于带宽扩展的音频解码方法及装置。

    基于QMF的处理数据的时间对齐

    公开(公告)号:CN111312279B

    公开(公告)日:2024-02-06

    申请号:CN202010087641.0

    申请日:2014-09-08

    摘要: 本公开涉及基于QMF的处理数据的时间对齐。一种被配置为根据接收到的数据流的存取单元(110)来确定音频信号(237)的重构帧的音频解码器(100,300)被描述。存取单元(110)包括波形数据(111)和元数据(112),其中波形数据构帧相关联。音频解码器(100,300)包括被配置为根据波形数据(111)生成多个波形子带信号(123)的波形处理路径(101,102,103,104,105),以及被配置为根据元数据(111)生成解码后的元数据(128)的元数据处理路径(108,109)。(111)和元数据(112)与音频信号(127)的同一重

    音频编码方法及装置、存储介质、电子设备

    公开(公告)号:CN112767955B

    公开(公告)日:2024-01-23

    申请号:CN202010710476.X

    申请日:2020-07-22

    发明人: 梁俊斌

    摘要: 本公开提供一种音频编码方法及装置、电子设备、存储介质;涉及音视频编码技术领域。所述音频编码方法包括:获取音频数据,并将音频数据发送到预设的语音编码器;通过语音编码器对音频数据进行关键帧检测,确定音频数据对应的音频关键帧;对音频关键帧进行关键性量化处理,得到音频关键帧对应的关键性量化结果;基于音编码器,根据关键性量化结果分配音频关键帧在进行带内前向纠错编码时的编码比特数,以完成对音频数据的带内前向纠错编码,生成音频数据对应的标准音频数据。本公开可以分析音频数据中音频帧的关键性,进而根据音频帧的关键性对音频数据进行编码,从而提升实时音频数据传输时的音频数据的音频质量。

    一种语音频信号切换系统

    公开(公告)号:CN117373465A

    公开(公告)日:2024-01-09

    申请号:CN202311679076.7

    申请日:2023-12-08

    发明人: 陈国强

    摘要: 本发明公开了一种语音频信号切换系统,涉及语音频处理技术领域,本发明借助处理终端的常规模式和习惯模式来对目标对象进行编码处理,根据来源对象的个数是否超过预设数量,从而确定采用常规模式还是习惯模式进行处理,常规模式下能够借助选择算法对目标对象进行编码处理;灵活选择最适合用户的编码方式,切合实际使用场景;习惯模式下能够根据用户过往数据快速确定何种编译方式对语音频信号进行编码,本发明简单有效,且易于实用。

    用于声音信号的统一时域/频域编码的方法和装置

    公开(公告)号:CN117178322A

    公开(公告)日:2023-12-05

    申请号:CN202280009268.4

    申请日:2022-01-05

    IPC分类号: G10L19/032

    摘要: 一种用于对输入声音信号进行编码的统一时域/频域编码方法和设备,包括将输入声音信号分类为多个声音信号类别中的一个的分类器,所述多个声音信号类别包括表示输入声音信号的性质不清楚的不清楚信号类型类别。用于在输入声音信号被分类为不清楚信号类型类别的情况下对输入声音信号进行编码的多个编码子模式中的一个被选择。混合时域/频域编码器使用所选择的编码子模式对输入声音信号进行编码。混合时域/频域编码器包括频带选择器和比特分配器,用于选择要量化的频带和用于在所选择的频带之间分配可用于量化的比特预算。还提供了对应的声音信号解码器和解码方法。