-
公开(公告)号:CN118197326A
公开(公告)日:2024-06-14
申请号:CN202410317506.9
申请日:2019-01-31
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: G10L19/008 , G10L19/18 , G10L19/02
Abstract: 一种用于编码音频场景的音频场景编码器,音频场景包括至少两个分量信号,音频场景编码器包括:用于对至少两个分量信号进行核心编码的核心编码器(160),其中核心编码器(160)被配置用以针对至少两个分量信号的第一部分产生第一编码表示(310),并且用以针对至少两个分量信号的第二部分产生第二编码表示(320),用于分析音频场景以得出针对第二部分的一个或多个空间参数(330)或一个或多个空间参数集的空间分析器(200);以及用于形成经编码音频场景信号(340)的输出接口(300),经编码音频场景信号(340)包括第一编码表示(310)、针对第二部分的第二编码表示(320)及一个或多个空间参数(330)或一个或多个空间参数集。
-
公开(公告)号:CN111933159B
公开(公告)日:2024-04-09
申请号:CN202010749863.4
申请日:2018-11-08
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: G10L19/002 , G10L19/18 , G10L19/02 , G10L19/032
Abstract: 一种用于基于经编码音频信息提供经解码音频信息的音频解码器经配置以基于表示频谱值的经编码信息获得经解码频谱值。音频解码器经配置以使用算术解码,针对一组频谱值,基于相应符号码来联合地解码每频谱值两个或更多个最高有效比特,其中相应符号码表示针对一个或多个频谱值的每频谱值两个或更多个最高有效比特。音频解码器经配置以取决于多少最低有效比特信息可用而解码与频谱值中的一个或多个相关联的一个或多个最低有效比特,使得与频谱值中的一个或多个相关联的一个或多个最低有效比特被解码,而针对解码一个或多个最高有效比特所针对的一个或多个其他频谱值,最低有效比特不被解码,一个或多个其他频谱值包括多于一个或多个最高有效比特的比特。音频解码器经配置以使用频谱值来提供经解码音频信息。音频解码器的修改是可能的。还描述了一种音频编码器。
-
公开(公告)号:CN117238300A
公开(公告)日:2023-12-15
申请号:CN202311130088.4
申请日:2017-01-20
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 吉约姆·福克斯 , 伊曼纽尔·拉维利 , 马库斯·缪特拉斯 , 马库斯·施内尔 , 斯蒂芬·多拉 , 马丁·迪茨 , 戈兰·马尔科维奇 , 埃伦妮·福托波罗 , 斯特凡·拜尔 , 沃尔夫冈·耶格斯
IPC: G10L19/008 , G10L19/04 , G10L19/02 , G10L19/022 , G10L25/18 , H04S3/00
Abstract: 使用用于将取样值的块的序列转换成频谱值的块的序列的时间‑频谱转换器、用于对频谱值的块应用联合多声道处理以获得块的至少一个结果序列的多声道处理器、用于将频谱值的块的结果序列转换成包括取样值的块的输出序列的时域表示的频谱‑时间转换器以及用于对取样值的块的输出序列进行编码以获得经编码的多声道信号的核心编码器对多声道音频信号进行编码,其中核心编码器以第一帧控制进行操作,并且其中时间‑频谱转换器或频谱‑时间转换器以与第一帧控制同步的第二帧控制进行操作。
-
公开(公告)号:CN108885879B
公开(公告)日:2023-09-15
申请号:CN201780019674.8
申请日:2017-01-20
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 吉约姆·福克斯 , 伊曼纽尔·拉维利 , 马库斯·缪特拉斯 , 马库斯·施内尔 , 斯蒂芬·多拉 , 马丁·迪茨 , 戈兰·马尔科维奇 , 埃伦妮·福托波罗 , 斯特凡·拜尔 , 沃尔夫冈·耶格斯
IPC: G10L19/022 , G10L19/008
Abstract: 使用用于将取样值的块的序列转换成频谱值的块的序列的时间‑频谱转换器、用于对频谱值的块应用联合多声道处理以获得块的至少一个结果序列的多声道处理器、用于将频谱值的块的结果序列转换成包括取样值的块的输出序列的时域表示的频谱‑时间转换器以及用于对取样值的块的输出序列进行编码以获得经编码的多声道信号的核心编码器对多声道音频信号进行编码,其中核心编码器以第一帧控制进行操作,并且其中时间‑频谱转换器或频谱‑时间转换器以与第一帧控制同步的第二帧控制进行操作,其中起始帧边界或结束帧边界与时间‑频谱转换器使用的窗口的重叠部分的起始时刻或结束时刻呈预定关系。
-
公开(公告)号:CN116686042A
公开(公告)日:2023-09-01
申请号:CN202180084626.3
申请日:2021-10-13
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: G10L13/02
Abstract: 公开了用于生成音频信号和训练音频发生器的技术。音频发生器(10)可以从表示音频信号(16)的目标数据(12)和输入信号(14)生成音频信号(16),包括:第一处理块(40,50,50a‑50h),接收从输入信号(14)得出的第一数据(15,59a)并输出第一输出数据(69);第二处理块(45),作为第二数据接收第一输出数据(69)或从第一输出数据(69)得出的数据。第一处理块(50)包括:可学习层(71,72,73)的条件集,被配置为处理目标数据(12)以获得条件特征参数(74,75);以及样式元件(77),被配置为将条件特征参数(74,75)应用于第一数据(15,59a)或归一化的第一数据(59,76')。
-
公开(公告)号:CN116648742A
公开(公告)日:2023-08-25
申请号:CN202180084618.9
申请日:2021-10-13
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: G10L13/02
Abstract: 公开了用于生成音频信号和训练音频发生器的技术。音频发生器(10)可以从表示音频信号(16)的目标数据(12)和输入信号(14)生成音频信号(16)。目标数据(12)从文本得出。音频发生器包括:第一处理块(40,50,50a‑50h),接收从输入信号(14)得出的第一数据(15,59a)并输出第一输出数据(69);第二处理块(45),作为第二数据接收第一输出数据(69)或从第一输出数据(69)得出的数据。第一处理块(50)包括:可学习层(71,72,73)的条件集,被配置为处理目标数据(12)以获得条件特征参数(74,75);以及样式元件(77),被配置为将条件特征参数(74,75)应用于第一数据(15,59a)或归一化的第一数据(59,76')。
-
公开(公告)号:CN107079152B
公开(公告)日:2021-04-02
申请号:CN201580050928.3
申请日:2015-07-24
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 吉约姆·福克斯 , 本杰明·舒伯特 , 格莱泽格尔兹·皮耶奇克 , 马库斯·缪特拉斯 , 伯恩哈特·格里尔
IPC: H04N19/13 , H04N19/126 , G10L19/035
Abstract: 本发明的实施例提供一种编码器,其包括量化阶段、熵编码器、残余量化阶段以及编码信号形成器。量化阶段用于使用死区对输入信号进行量化,以得到多个量化值。熵编码器用于使用熵编码方案编码多个量化值,以得到多个熵编码值。残余量化阶段用于对由量化阶段造成的残余信号进行量化,其中残余量化阶段用于根据量化阶段的死区确定至少一个量化残余值。编码信号形成器用于从多个熵编码值和至少一个量化残余值形成编码信号。
-
公开(公告)号:CN107408389B
公开(公告)日:2021-03-02
申请号:CN201680014670.6
申请日:2016-03-07
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 萨沙·迪施 , 吉约姆·福克斯 , 伊曼纽尔·拉维利 , 克里斯蒂安·诺伊卡姆 , 康斯坦丁·施密特 , 康拉德·本多尔夫 , 安德烈·尼德迈尔 , 本杰明·舒伯特 , 拉尔夫·盖格
IPC: G10L19/008 , G10L19/02 , G10L19/04 , G10L19/18 , G10L21/038
Abstract: 展示用于编码多声道信号(4)的音频编码器(2”)。音频编码器包括用于对多声道信号(4)进行降混以获得降混信号(14)的降混频器(12);用于对降混信号(14)进行编码的线性预测域核心编码器(16),其中降混信号(14)具有低频带和高频带,其中线性预测域核心编码器(16)用于施加用于对高频带进行参数化编码的带宽扩展处理;用于生成多声道信号(4)的频谱表示的滤波器组(82);以及用于处理包括多声道信号的低频带和高频带的频谱表示以生成多声道信息(20)的联合多声道编码器(18)。
-
公开(公告)号:CN112954323B
公开(公告)日:2024-12-31
申请号:CN202110277333.9
申请日:2015-07-24
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 吉约姆·福克斯 , 本杰明·舒伯特 , 格莱泽格尔兹·皮耶奇克 , 马库斯·缪特拉斯 , 伯恩哈特·格里尔
IPC: H04N19/13 , H04N19/126 , G10L19/035
Abstract: 本发明的实施例提供一种编码器,其包括量化阶段、熵编码器、残余量化阶段以及编码信号形成器。量化阶段用于使用死区对输入信号进行量化,以得到多个量化值。熵编码器用于使用熵编码方案编码多个量化值,以得到多个熵编码值。残余量化阶段用于对由量化阶段造成的残余信号进行量化,其中残余量化阶段用于根据量化阶段的死区确定至少一个量化残余值。编码信号形成器用于从多个熵编码值和至少一个量化残余值形成编码信号。
-
公开(公告)号:CN111933160B
公开(公告)日:2024-02-13
申请号:CN202010749865.3
申请日:2018-11-08
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: G10L19/002 , G10L19/18 , G10L19/02 , G10L19/032
Abstract: 一种用于基于经编码音频信息提供经解码音频信息的音频解码器经配置以基于表示频谱值的经编码信息获得经解码频谱值。音频解码器经配置以使用算术解码,针对一组频谱值,基于相应符号码来联合地解码每频谱值两个或更多个最高有效比特,其中相应符号码表示针对一个或多个频谱值的每频谱值两个或更多个最高有效比特。音频解码器经配置以取决于多少最低有效比特信息可用而解码与频谱值中的一个或多个相关联的一个或多个最低有效比特,使得与频谱值中的一个或多个相关联的一个或多个最低有效比特被解码,而针对解码一个或多个最高有效比特所针对的一个或多个其他频谱值,最低有效比特不被解码,一个或多个其他频谱值包括多于一个或多个最高有效比特的比特。音频解码器(56)对比文件Marie Oger等.Transform Audio Codingwith Arithmetic-Coded Scalar Quantizationand Model-Based Bit Allocation《.2007 IEEEInternational Conference on Acoustics,Speech and Signal Processing - ICASSP '07》.2007,第IV-545-548页.
-
-
-
-
-
-
-
-
-