-
公开(公告)号:CN111933160B
公开(公告)日:2024-02-13
申请号:CN202010749865.3
申请日:2018-11-08
申请人: 弗劳恩霍夫应用研究促进协会
IPC分类号: G10L19/002 , G10L19/18 , G10L19/02 , G10L19/032
摘要: 一种用于基于经编码音频信息提供经解码音频信息的音频解码器经配置以基于表示频谱值的经编码信息获得经解码频谱值。音频解码器经配置以使用算术解码,针对一组频谱值,基于相应符号码来联合地解码每频谱值两个或更多个最高有效比特,其中相应符号码表示针对一个或多个频谱值的每频谱值两个或更多个最高有效比特。音频解码器经配置以取决于多少最低有效比特信息可用而解码与频谱值中的一个或多个相关联的一个或多个最低有效比特,使得与频谱值中的一个或多个相关联的一个或多个最低有效比特被解码,而针对解码一个或多个最高有效比特所针对的一个或多个其他频谱值,最低有效比特不被解码,一个或多个其他频谱值包括多于一个或多个最高有效比特的比特。音频解码器(56)对比文件Marie Oger等.Transform Audio Codingwith Arithmetic-Coded Scalar Quantizationand Model-Based Bit Allocation《.2007 IEEEInternational Conference on Acoustics,Speech and Signal Processing - ICASSP '07》.2007,第IV-545-548页.
-
公开(公告)号:CN107077854B
公开(公告)日:2021-06-22
申请号:CN201580052557.2
申请日:2015-07-24
申请人: 弗劳恩霍夫应用研究促进协会
IPC分类号: G10L19/025
摘要: 一种用于处理音频信号(200)的处理器包括:用于从音频信号(200)得出指示从第一不对称窗口(1400)至第二窗口(1402)的改变或指示从第三窗口(1450)至第四不对称窗口(1452)的改变的窗口控制信号(204)的分析器(202),其中第二窗口(1402)短于第一窗口(1400),或其中第三窗口(1450)短于第四窗口(1452);用于使用第一不对称窗口(1400)的第一重叠部分(800)构建第二窗口(1402)的窗口构建器(206),其中窗口构建器(206)用于使用第一不对称窗口的经截短的第一重叠部分确定第二窗口(1402)的第一重叠部分(1000),或其中窗口构建器用于使用第四不对称窗口(1452)的经截短的第二重叠部分(814)计算第三窗口(1450)的第二重叠部分(1330);以及用于应用第一窗口及第二窗口或第三窗口及第四窗口以获得经窗口化的音频信号部分(210)的窗口化器(208)。
-
公开(公告)号:CN111656443A
公开(公告)日:2020-09-11
申请号:CN201880085999.0
申请日:2018-11-08
申请人: 弗劳恩霍夫应用研究促进协会
IPC分类号: G10L19/02 , G10L19/032 , G10L25/18
摘要: 一种用于基于经编码音频信息提供经解码音频信息的音频解码器经配置以基于表示频谱值的经编码信息获得经解码频谱值。音频解码器经配置以使用算术解码,针对一组频谱值,基于相应符号码来联合地解码每频谱值两个或更多个最高有效比特,其中相应符号码表示针对一个或多个频谱值的每频谱值两个或更多个最高有效比特。音频解码器经配置以取决于多少最低有效比特信息可用而解码与频谱值中的一个或多个相关联的一个或多个最低有效比特,使得与频谱值中的一个或多个相关联的一个或多个最低有效比特被解码,而针对解码一个或多个最高有效比特所针对的一个或多个其他频谱值,最低有效比特不被解码,一个或多个其他频谱值包括多于一个或多个最高有效比特的比特。音频解码器经配置以使用频谱值来提供经解码音频信息。音频解码器的修改是可能的。还描述了一种音频编码器。
-
公开(公告)号:CN108885879A
公开(公告)日:2018-11-23
申请号:CN201780019674.8
申请日:2017-01-20
申请人: 弗劳恩霍夫应用研究促进协会
发明人: 吉约姆·福克斯 , 伊曼纽尔·拉维利 , 马库斯·缪特拉斯 , 马库斯·施内尔 , 斯蒂芬·多拉 , 马丁·迪茨 , 戈兰·马尔科维奇 , 埃伦妮·福托波罗 , 斯特凡·拜尔 , 沃尔夫冈·耶格斯
IPC分类号: G10L19/022 , G10L19/008
CPC分类号: G10L19/008 , G10L19/02 , G10L19/022 , G10L19/04 , G10L25/18 , H04S3/008 , H04S2400/01 , H04S2400/03 , H04S2420/03
摘要: 使用用于将取样值的块的序列转换成频谱值的块的序列的时间‑频谱转换器、用于对频谱值的块应用联合多声道处理以获得块的至少一个结果序列的多声道处理器、用于将频谱值的块的结果序列转换成包括取样值的块的输出序列的时域表示的频谱‑时间转换器以及用于对取样值的块的输出序列进行编码以获得经编码的多声道信号的核心编码器对多声道音频信号进行编码,其中核心编码器以第一帧控制进行操作,并且其中时间‑频谱转换器或频谱‑时间转换器以与第一帧控制同步的第二帧控制进行操作,其中起始帧边界或结束帧边界与时间‑频谱转换器使用的窗口的重叠部分的起始时刻或结束时刻呈预定关系。
-
公开(公告)号:CN118197326A
公开(公告)日:2024-06-14
申请号:CN202410317506.9
申请日:2019-01-31
申请人: 弗劳恩霍夫应用研究促进协会
IPC分类号: G10L19/008 , G10L19/18 , G10L19/02
摘要: 一种用于编码音频场景的音频场景编码器,音频场景包括至少两个分量信号,音频场景编码器包括:用于对至少两个分量信号进行核心编码的核心编码器(160),其中核心编码器(160)被配置用以针对至少两个分量信号的第一部分产生第一编码表示(310),并且用以针对至少两个分量信号的第二部分产生第二编码表示(320),用于分析音频场景以得出针对第二部分的一个或多个空间参数(330)或一个或多个空间参数集的空间分析器(200);以及用于形成经编码音频场景信号(340)的输出接口(300),经编码音频场景信号(340)包括第一编码表示(310)、针对第二部分的第二编码表示(320)及一个或多个空间参数(330)或一个或多个空间参数集。
-
公开(公告)号:CN111933159B
公开(公告)日:2024-04-09
申请号:CN202010749863.4
申请日:2018-11-08
申请人: 弗劳恩霍夫应用研究促进协会
IPC分类号: G10L19/002 , G10L19/18 , G10L19/02 , G10L19/032
摘要: 一种用于基于经编码音频信息提供经解码音频信息的音频解码器经配置以基于表示频谱值的经编码信息获得经解码频谱值。音频解码器经配置以使用算术解码,针对一组频谱值,基于相应符号码来联合地解码每频谱值两个或更多个最高有效比特,其中相应符号码表示针对一个或多个频谱值的每频谱值两个或更多个最高有效比特。音频解码器经配置以取决于多少最低有效比特信息可用而解码与频谱值中的一个或多个相关联的一个或多个最低有效比特,使得与频谱值中的一个或多个相关联的一个或多个最低有效比特被解码,而针对解码一个或多个最高有效比特所针对的一个或多个其他频谱值,最低有效比特不被解码,一个或多个其他频谱值包括多于一个或多个最高有效比特的比特。音频解码器经配置以使用频谱值来提供经解码音频信息。音频解码器的修改是可能的。还描述了一种音频编码器。
-
公开(公告)号:CN117238300A
公开(公告)日:2023-12-15
申请号:CN202311130088.4
申请日:2017-01-20
申请人: 弗劳恩霍夫应用研究促进协会
发明人: 吉约姆·福克斯 , 伊曼纽尔·拉维利 , 马库斯·缪特拉斯 , 马库斯·施内尔 , 斯蒂芬·多拉 , 马丁·迪茨 , 戈兰·马尔科维奇 , 埃伦妮·福托波罗 , 斯特凡·拜尔 , 沃尔夫冈·耶格斯
IPC分类号: G10L19/008 , G10L19/04 , G10L19/02 , G10L19/022 , G10L25/18 , H04S3/00
摘要: 使用用于将取样值的块的序列转换成频谱值的块的序列的时间‑频谱转换器、用于对频谱值的块应用联合多声道处理以获得块的至少一个结果序列的多声道处理器、用于将频谱值的块的结果序列转换成包括取样值的块的输出序列的时域表示的频谱‑时间转换器以及用于对取样值的块的输出序列进行编码以获得经编码的多声道信号的核心编码器对多声道音频信号进行编码,其中核心编码器以第一帧控制进行操作,并且其中时间‑频谱转换器或频谱‑时间转换器以与第一帧控制同步的第二帧控制进行操作。
-
公开(公告)号:CN108885879B
公开(公告)日:2023-09-15
申请号:CN201780019674.8
申请日:2017-01-20
申请人: 弗劳恩霍夫应用研究促进协会
发明人: 吉约姆·福克斯 , 伊曼纽尔·拉维利 , 马库斯·缪特拉斯 , 马库斯·施内尔 , 斯蒂芬·多拉 , 马丁·迪茨 , 戈兰·马尔科维奇 , 埃伦妮·福托波罗 , 斯特凡·拜尔 , 沃尔夫冈·耶格斯
IPC分类号: G10L19/022 , G10L19/008
摘要: 使用用于将取样值的块的序列转换成频谱值的块的序列的时间‑频谱转换器、用于对频谱值的块应用联合多声道处理以获得块的至少一个结果序列的多声道处理器、用于将频谱值的块的结果序列转换成包括取样值的块的输出序列的时域表示的频谱‑时间转换器以及用于对取样值的块的输出序列进行编码以获得经编码的多声道信号的核心编码器对多声道音频信号进行编码,其中核心编码器以第一帧控制进行操作,并且其中时间‑频谱转换器或频谱‑时间转换器以与第一帧控制同步的第二帧控制进行操作,其中起始帧边界或结束帧边界与时间‑频谱转换器使用的窗口的重叠部分的起始时刻或结束时刻呈预定关系。
-
公开(公告)号:CN116686042A
公开(公告)日:2023-09-01
申请号:CN202180084626.3
申请日:2021-10-13
申请人: 弗劳恩霍夫应用研究促进协会
IPC分类号: G10L13/02
摘要: 公开了用于生成音频信号和训练音频发生器的技术。音频发生器(10)可以从表示音频信号(16)的目标数据(12)和输入信号(14)生成音频信号(16),包括:第一处理块(40,50,50a‑50h),接收从输入信号(14)得出的第一数据(15,59a)并输出第一输出数据(69);第二处理块(45),作为第二数据接收第一输出数据(69)或从第一输出数据(69)得出的数据。第一处理块(50)包括:可学习层(71,72,73)的条件集,被配置为处理目标数据(12)以获得条件特征参数(74,75);以及样式元件(77),被配置为将条件特征参数(74,75)应用于第一数据(15,59a)或归一化的第一数据(59,76')。
-
公开(公告)号:CN116648742A
公开(公告)日:2023-08-25
申请号:CN202180084618.9
申请日:2021-10-13
申请人: 弗劳恩霍夫应用研究促进协会
IPC分类号: G10L13/02
摘要: 公开了用于生成音频信号和训练音频发生器的技术。音频发生器(10)可以从表示音频信号(16)的目标数据(12)和输入信号(14)生成音频信号(16)。目标数据(12)从文本得出。音频发生器包括:第一处理块(40,50,50a‑50h),接收从输入信号(14)得出的第一数据(15,59a)并输出第一输出数据(69);第二处理块(45),作为第二数据接收第一输出数据(69)或从第一输出数据(69)得出的数据。第一处理块(50)包括:可学习层(71,72,73)的条件集,被配置为处理目标数据(12)以获得条件特征参数(74,75);以及样式元件(77),被配置为将条件特征参数(74,75)应用于第一数据(15,59a)或归一化的第一数据(59,76')。
-
-
-
-
-
-
-
-
-