-
公开(公告)号:CN116529815A
公开(公告)日:2023-08-01
申请号:CN202180076553.3
申请日:2021-10-12
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 安德里亚·艾肯塞尔 , 斯里坎特·科斯 , 斯特凡·拜尔 , 法比恩·屈希 , 奥利弗·迪尔加特 , 纪尧姆·福克斯 , 多米尼克·韦克贝克 , 于尔根·赫勒 , 马库斯·马特拉斯
IPC: G10L19/008
Abstract: 一种用于对多个音频对象进行编码的装置,包括:对象参数计算器(100),被配置为:针对与时间帧相关的多个频率区间中的一个或多个频率区间,计算至少两个相关音频对象的参数数据,其中,至少两个相关音频对象的数量低于多个音频对象的总数;以及输出接口(200),被配置为输出编码音频信号,该编码音频信号包括关于一个或多个频率区间的至少两个相关音频对象的参数数据的信息。
-
公开(公告)号:CN117546237A
公开(公告)日:2024-02-09
申请号:CN202180098890.2
申请日:2021-08-06
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: G10L19/008 , G10L25/30 , G10L25/18 , G10L25/24 , G10L21/0208
Abstract: 公开了用于解码和/或生成音频信号以及训练音频解码器和/或生成器的技术。一种音频解码器(10),其被配置成从比特流(3)生成音频信号(16),比特流(3)表示音频信号(16),音频信号被细分为帧序列。音频解码器(10)包括:第一数据供应器(702),用于提供第一数据(15),第一数据(15)具有多个通道;第一处理块(40、50、50a‑50h),用于输出具有多个通道(47)的第一输出数据(69),以及第二处理块(45)。第一处理块(50)包括:可学习层(710),用于接收比特流(3),并且对于给定帧,利用针对给定帧的多个通道和多个样本输出表示给定帧中的音频信号(16)的目标数据(12);调节可学习层(71、72、73),用于处理目标数据(12)以获得给定帧的调节特征参数(74、75);以及样式元素(77),其将调节特征参数(74、75)应用于第一数据(15、59a)。第二处理块(45)组合第二数据(69)的多个通道(47)以获得音频信号(16)。
-