-
公开(公告)号:CN114400012B
公开(公告)日:2024-10-22
申请号:CN202210093723.5
申请日:2022-01-26
申请人: 武汉大学
IPC分类号: G10L19/032 , G10L19/04 , G10L25/18 , G10L25/30
摘要: 一种极低速率高质量语音编解码方法及装置,涉及音频技术领域,方法包括步骤:S1.将待传输干净语音输入编码器;S2.编码器提取线性预测系数输入量化器量化后,打包为比特流进行传输;S3.接收所述比特流,并输入解量化器,得到解量化后的线性预测系数;S4.将该线性预测系数输入转换模型,转换模型输出该线性预测系数对应的梅尔谱向量;S5.将所述梅尔谱向量输入神经声码器得到重建解码语音。本发明去除参数的信息冗余,以降低编码比特率,同时提升解码语音质量,满足极低传输带宽环境下对高质量语音通信的需求。
-
公开(公告)号:CN115116455B
公开(公告)日:2024-09-24
申请号:CN202210681037.X
申请日:2022-06-15
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L19/16 , G10L19/032 , G10L19/008
摘要: 本申请提供了一种音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:对音频信号进行多通道信号分解处理,得到音频信号的N个子带信号,其中,N为大于2的整数,N个子带信号的频段依次递增;对每个子带信号进行信号压缩处理,得到每个子带信号的子带信号特征;对每个子带信号的子带信号特征进行量化编码处理,得到每个子带信号的码流。通过本申请,能够提高音频编码效率。
-
公开(公告)号:CN118262739A
公开(公告)日:2024-06-28
申请号:CN202410362409.1
申请日:2014-09-08
申请人: 杜比国际公司
IPC分类号: G10L21/0388 , G10L19/16 , G10L19/005 , G10L19/018 , G10L19/008 , G10L19/02 , G10L19/032
摘要: 本公开涉及基于QMF的处理数据的时间对齐。一种被配置为根据接收到的数据流的存取单元(110)来确定音频信号(237)的重构帧的音频解码器(100,300)被描述。存取单元(110)包括波形数据(111)和元数据(112),其中波形数据(111)和元数据(112)与音频信号(127)的同一重构帧相关联。音频解码器(100,300)包括被配置为根据波形数据(111)生成多个波形子带信号(123)的波形处理路径(101,102,103,104,105),以及被配置为根据元数据(111)生成解码后的元数据(128)的元数据处理路径(108,109)。
-
公开(公告)号:CN111210831B
公开(公告)日:2024-06-04
申请号:CN201811397265.4
申请日:2018-11-22
申请人: 广州广晟数码技术有限公司
IPC分类号: G10L19/02 , G10L19/032 , G10L19/04 , G10L19/26
摘要: 基于频谱拉伸的带宽扩展音频编解码方法及装置。本发明涉及用于带宽扩展的音频编码方法及装置。所述音频具有低频部分与高频部分,所述方法包括步骤:将高频部分进行频域栅格划分得到频域栅格区域;在低频部分选择与所述频域栅格区域中的M个频域栅格区域对应匹配的拷贝频谱,M为自然数;确定拉伸因子,所述拉伸因子为与M个频域栅格区域中的频域栅格区域以及匹配的相应拷贝频谱相关的线性拉伸因子;和向解码端传送与拉伸因子有关的拉伸信息。本发明还涉及用于带宽扩展的音频解码方法及装置。
-
公开(公告)号:CN111312279B
公开(公告)日:2024-02-06
申请号:CN202010087641.0
申请日:2014-09-08
申请人: 杜比国际公司
IPC分类号: G10L21/0388 , G10L19/16 , G10L19/02 , G10L19/032
摘要: 本公开涉及基于QMF的处理数据的时间对齐。一种被配置为根据接收到的数据流的存取单元(110)来确定音频信号(237)的重构帧的音频解码器(100,300)被描述。存取单元(110)包括波形数据(111)和元数据(112),其中波形数据构帧相关联。音频解码器(100,300)包括被配置为根据波形数据(111)生成多个波形子带信号(123)的波形处理路径(101,102,103,104,105),以及被配置为根据元数据(111)生成解码后的元数据(128)的元数据处理路径(108,109)。(111)和元数据(112)与音频信号(127)的同一重
-
公开(公告)号:CN112767955B
公开(公告)日:2024-01-23
申请号:CN202010710476.X
申请日:2020-07-22
申请人: 腾讯科技(深圳)有限公司
发明人: 梁俊斌
IPC分类号: G10L19/00 , G10L19/032 , G10L19/04
摘要: 本公开提供一种音频编码方法及装置、电子设备、存储介质;涉及音视频编码技术领域。所述音频编码方法包括:获取音频数据,并将音频数据发送到预设的语音编码器;通过语音编码器对音频数据进行关键帧检测,确定音频数据对应的音频关键帧;对音频关键帧进行关键性量化处理,得到音频关键帧对应的关键性量化结果;基于音编码器,根据关键性量化结果分配音频关键帧在进行带内前向纠错编码时的编码比特数,以完成对音频数据的带内前向纠错编码,生成音频数据对应的标准音频数据。本公开可以分析音频数据中音频帧的关键性,进而根据音频帧的关键性对音频数据进行编码,从而提升实时音频数据传输时的音频数据的音频质量。
-
公开(公告)号:CN117373465A
公开(公告)日:2024-01-09
申请号:CN202311679076.7
申请日:2023-12-08
申请人: 富迪科技(南京)有限公司
发明人: 陈国强
IPC分类号: G10L19/18 , G10L19/22 , G10L19/04 , G10L19/032
摘要: 本发明公开了一种语音频信号切换系统,涉及语音频处理技术领域,本发明借助处理终端的常规模式和习惯模式来对目标对象进行编码处理,根据来源对象的个数是否超过预设数量,从而确定采用常规模式还是习惯模式进行处理,常规模式下能够借助选择算法对目标对象进行编码处理;灵活选择最适合用户的编码方式,切合实际使用场景;习惯模式下能够根据用户过往数据快速确定何种编译方式对语音频信号进行编码,本发明简单有效,且易于实用。
-
公开(公告)号:CN117316168A
公开(公告)日:2023-12-29
申请号:CN202311134080.5
申请日:2017-04-06
申请人: 弗劳恩霍夫应用研究促进协会
IPC分类号: G10L19/02 , G10L19/028 , G10L19/03 , G10L19/032 , G10L19/04 , G10L19/06 , G10L19/12 , G10L19/16 , G10L19/26 , G10L21/007 , G10L21/02 , G10L21/0208 , G10L21/0324 , G10L21/038 , G10L25/15 , G10L25/18
摘要: 一种用于对具有下频带和上频带的音频信号进行编码的音频编码器,包括:检测器(802),用于检测该音频信号的上频带中的尖峰频谱区域;整形器(804),用于使用下频带的整形信息来对该下频带进行整形,并且用于使用该下频带的整形信息的至少一部分来对上频带进行整形,其中,该整形器(804)被配置为额外地衰减上频带中的检测到的尖峰频谱区域中的频谱值;以及量化器和编码器级(806),用于对经整形的下频带和经整形的上频带进行量化,并且用于对来自该经整形的下频带和该经整形的上频带的经量化的频谱值进行熵编码。
-
公开(公告)号:CN117178322A
公开(公告)日:2023-12-05
申请号:CN202280009268.4
申请日:2022-01-05
申请人: 沃伊斯亚吉公司
IPC分类号: G10L19/032
摘要: 一种用于对输入声音信号进行编码的统一时域/频域编码方法和设备,包括将输入声音信号分类为多个声音信号类别中的一个的分类器,所述多个声音信号类别包括表示输入声音信号的性质不清楚的不清楚信号类型类别。用于在输入声音信号被分类为不清楚信号类型类别的情况下对输入声音信号进行编码的多个编码子模式中的一个被选择。混合时域/频域编码器使用所选择的编码子模式对输入声音信号进行编码。混合时域/频域编码器包括频带选择器和比特分配器,用于选择要量化的频带和用于在所选择的频带之间分配可用于量化的比特预算。还提供了对应的声音信号解码器和解码方法。
-
公开(公告)号:CN111768790B
公开(公告)日:2023-11-21
申请号:CN201910195180.6
申请日:2019-03-14
申请人: 百度在线网络技术(北京)有限公司
IPC分类号: G10L19/00 , G10L19/032
-
-
-
-
-
-
-
-
-