-
公开(公告)号:CN118511547A
公开(公告)日:2024-08-16
申请号:CN202280087616.X
申请日:2022-11-09
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 西蒙·施瓦尔 , 吴允瀚 , 于尔根·赫勒 , 马蒂亚斯·吉依尔 , 米哈伊尔·科罗蒂耶夫
IPC: H04S7/00 , G10L19/008
Abstract: 根据本发明的实施例包含一种用于渲染(例如在空间上渲染)声学场景的渲染器,其中渲染器被配置为使用空间扩展声源(例如SESS,例如作为空间扩展声源,例如,例如使用均匀扩展声源算法再现漫射声的空间扩展声源)在第二空间区域中(例如第二声学均匀空间中;例如第二房间中;例如第一空间区域外部的空间区域中)渲染(例如再现)(例如混响;例如后期混响的)漫射声的声学冲击,漫射声源自第一空间区域中(例如第一声学均匀空间,AHS中;例如第一房间中)。此外,公开了编码器、方法及比特流。
-
公开(公告)号:CN118648059A
公开(公告)日:2024-09-13
申请号:CN202280088351.5
申请日:2022-11-09
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 萨沙·迪施 , 西蒙·施瓦尔 , 卡利埃尔·波特·哈桑
IPC: G10L19/008 , G10L19/16 , H04S3/00 , H04S7/00
Abstract: 根据本发明的实施例涉及音频解码器,用于基于编码的音频表示提供解码的音频表示,其中音频解码器被配置为空间渲染一个或多个音频信号;其中,音频解码器被配置为接收不同数据包类型的多个数据包,数据包包括提供定义场景对象的使用和/或场景特征的使用的渲染器配置信息的一个或多个场景配置数据包,数据包包括定义用于渲染的场景元数据的更新的一个或多个场景更新数据包,数据包包括一个或多个场景有效载荷数据包,场景有效载荷数据包包括一个或多个场景对象的定义和/或一个或多个场景特征的定义;其中,音频解码器被配置为选择一个或多个场景对象的定义和/或一个或多个场景特征的定义,用于根据渲染器配置信息进行渲染,这些定义包括在场景有效载荷数据包中;以及其中,音频解码器被配置为根据一个或多个场景更新数据包的内容更新一个或多个场景元数据。进一步的实施例涉及编码器、方法和比特流。进一步的实施例涉及解码器、编码器、方法和比特流,具有带有更新条件的场景更新数据包、具有提供定义渲染场景的时间演变的渲染器配置信息以及具有时间戳信息和/或具有子场景单元信息的场景配置数据包,其中单元信息定义了一个或多个单元与相应的一个或多个数据结构之间的关联。
-
公开(公告)号:CN118633303A
公开(公告)日:2024-09-10
申请号:CN202280088335.6
申请日:2022-11-09
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 于尔根·赫勒 , 文桑·马兹曼扬 , 亚历山大·阿达米 , 尼尔斯·彼得斯 , 西蒙·施瓦尔 , 卡利埃尔·波特·哈桑 , 马蒂亚斯·吉依尔 , 苏杰特·马特 , 安蒂·埃罗宁 , 奥托·哈留
IPC: H04S7/00
Abstract: 根据实施例,提供了一种用于渲染虚拟音频场景的设备(100)。一个或多个声源正在虚拟音频场景中发射声音。设备(100)包括被配置用于接收音频信息的输入接口(110),其中,音频信息包括针对虚拟音频场景的音频信息。此外,设备(100)包括渲染器(120),该渲染器被配置用于根据针对虚拟音频场景的音频信息来生成用于再现虚拟音频场景的一个或多个音频输出声道。如果关于虚拟音频场景的当前声学环境的信息对于渲染器(120)不可用,则渲染器(120)被配置为根据关于默认声学环境的信息来生成用于再现虚拟音频场景的一个或多个音频输出声道。
-
公开(公告)号:CN118525331A
公开(公告)日:2024-08-20
申请号:CN202280088353.4
申请日:2022-11-09
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 萨沙·迪施 , 西蒙·施瓦尔 , 卡利埃尔·波特·哈桑
IPC: G10L19/022 , G06F3/16 , G10L19/16 , G10L19/008 , H04S7/00
Abstract: 根据本发明的实施例涉及音频解码器,用于基于编码的音频表示提供解码的音频表示,其中音频解码器被配置为空间渲染一个或多个音频信号;其中,音频解码器被配置为接收不同数据包类型的多个数据包,数据包包括提供定义场景对象的使用和/或场景特征的使用的渲染器配置信息的一个或多个场景配置数据包,数据包包括定义用于渲染的场景元数据的更新的一个或多个场景更新数据包,数据包包括一个或多个场景有效载荷数据包,场景有效载荷数据包包括一个或多个场景对象的定义和/或一个或多个场景特征的定义;其中,音频解码器被配置为选择一个或多个场景对象的定义和/或一个或多个场景特征的定义,用于根据渲染器配置信息进行渲染,这些定义包括在场景有效载荷数据包中;以及其中,音频解码器被配置为根据一个或多个场景更新数据包的内容更新一个或多个场景元数据。进一步的实施例涉及编码器、方法和比特流。进一步的实施例涉及解码器、编码器、方法和比特流,具有带有更新条件的场景更新数据包、具有提供定义渲染场景的时间演变的渲染器配置信息以及具有时间戳信息和/或具有子场景单元信息的场景配置数据包,其中单元信息定义了一个或多个单元与相应的一个或多个数据结构之间的关联。
-
公开(公告)号:CN118251907A
公开(公告)日:2024-06-25
申请号:CN202280074800.0
申请日:2022-11-07
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: H04S7/00
Abstract: 一种用于合成空间扩展声源(SESS)(7000)的装置包含:存储器(200,2000),用于存储用于覆盖倾听者的渲染范围的不同的基本空间扇区的渲染数据项;扇区识别处理器(4000),用于基于倾听者数据和空间扩展声源数据从不同的基本空间扇区识别属于空间扩展声源的基本空间扇区的集合;目标数据计算器(5000),用于从用于基本空间扇区的集合的渲染数据项计算目标渲染数据;以及音频处理器(300,3000),用于使用目标渲染数据处理表示空间扩展声源的音频信号。
-
公开(公告)号:CN118235434A
公开(公告)日:2024-06-21
申请号:CN202280074781.1
申请日:2022-11-07
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: H04S7/00
Abstract: 一种用于合成空间扩展声源的装置包含:输入接口(4020),用于接收音频场景的描述并用于接收倾听者数据,音频场景的描述包括关于空间扩展声源的空间扩展声源数据和关于潜在修改对象(7010)的修改数据;扇区识别处理器(4000),用于基于空间扩展声源数据和倾听者数据以及修改数据,在用于倾听者的渲染范围内识别用于空间扩展声源(7000)的有限的经修改空间扇区,用于倾听者的渲染范围大于有限的经修改空间扇区;目标数据计算器(5000),用于从从属于经修改的有限空间扇区的一个或多个渲染数据项计算目标渲染数据;以及音频处理器(300,3000),用于使用目标渲染数据处理表示空间扩展声源的音频信号。
-
公开(公告)号:CN118525528A
公开(公告)日:2024-08-20
申请号:CN202280088359.1
申请日:2022-11-09
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 萨沙·迪施 , 西蒙·施瓦尔 , 卡利埃尔·波特·哈桑
IPC: H04S3/00 , G10L19/008 , G10L19/16 , H04S7/00
Abstract: 根据本发明的实施例涉及音频解码器,用于基于编码的音频表示提供解码的音频表示,其中音频解码器被配置为空间渲染一个或多个音频信号;其中,音频解码器被配置为接收不同数据包类型的多个数据包,数据包包括提供定义场景对象的使用和/或场景特征的使用的渲染器配置信息的一个或多个场景配置数据包,数据包包括定义用于渲染的场景元数据的更新的一个或多个场景更新数据包,数据包包括一个或多个场景有效载荷数据包,场景有效载荷数据包包括一个或多个场景对象的定义和/或一个或多个场景特征的定义;其中,音频解码器被配置为选择一个或多个场景对象的定义和/或一个或多个场景特征的定义,用于根据渲染器配置信息进行渲染,这些定义包括在场景有效载荷数据包中;以及其中,音频解码器被配置为根据一个或多个场景更新数据包的内容更新一个或多个场景元数据。进一步的实施例涉及编码器、方法和比特流。进一步的实施例涉及解码器、编码器、方法和比特流,具有带有更新条件的场景更新数据包、具有提供定义渲染场景的时间演变的渲染器配置信息以及具有时间戳信息和/或具有子场景单元信息的场景配置数据包,其中单元信息定义了一个或多个单元与相应的一个或多个数据结构之间的关联。
-
公开(公告)号:CN118511221A
公开(公告)日:2024-08-16
申请号:CN202280088333.7
申请日:2022-11-09
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 萨沙·迪施 , 西蒙·施瓦尔 , 卡利埃尔·波特·哈桑
IPC: G10L19/008 , G10L19/16 , H04S7/00
Abstract: 根据本发明的实施例涉及音频解码器,用于基于编码的音频表示提供解码的音频表示,其中音频解码器被配置为空间渲染一个或多个音频信号;其中,音频解码器被配置为接收不同数据包类型的多个数据包,数据包包括提供定义场景对象的使用和/或场景特征的使用的渲染器配置信息的一个或多个场景配置数据包,数据包包括定义用于渲染的场景元数据的更新的一个或多个场景更新数据包,数据包包括一个或多个场景有效载荷数据包,场景有效载荷数据包包括一个或多个场景对象的定义和/或一个或多个场景特征的定义;其中,音频解码器被配置为选择一个或多个场景对象的定义和/或一个或多个场景特征的定义,用于根据渲染器配置信息进行渲染,这些定义包括在场景有效载荷数据包中;以及其中,音频解码器被配置为根据一个或多个场景更新数据包的内容更新一个或多个场景元数据。进一步的实施例涉及编码器、方法和比特流。进一步的实施例涉及解码器、编码器、方法和比特流,具有带有更新条件的场景更新数据包、具有提供定义渲染场景的时间演变的渲染器配置信息以及具有时间戳信息和/或具有子场景单元信息的场景配置数据包,其中单元信息定义了一个或多个单元与相应的一个或多个数据结构之间的关联。
-
公开(公告)号:CN118235433A
公开(公告)日:2024-06-21
申请号:CN202280074749.3
申请日:2022-11-07
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: H04S7/00
Abstract: 一种用于合成空间扩展声源(SESS)的装置包含:存储器(200,2000),用于存储用于不同的有限空间扇区的一个或多个渲染数据项,其中不同的有限空间扇区位于用于倾听者的渲染范围中,其中用于有限空间扇区的一个或多个渲染数据项包含左方差数据项、右方差数据项、以及左‑右协方差数据项中的至少一个;扇区识别处理器(4000),用于基于空间扩展声源数据在用于倾听者的渲染范围内识别用于空间扩展声源的一个或多个有限空间扇区;目标数据计算器(5000),用于从所存储的左方差数据、所存储右方差数据或所存储的协方差数据计算目标渲染数据;以及音频处理器(300,3000),用于使用目标渲染数据处理表示空间扩展声源的音频信号。
-
-
-
-
-
-
-
-