Patent search ap:("弗劳恩霍夫应用研究促进协会") AND inv:"西蒙·施瓦尔" Page 1

1.

发明公开
使用空间扩展声源的渲染器、解码器、编码器、方法及比特流审中-实审

公开(公告)号：CN118511547A

公开(公告)日：2024-08-16

申请号：CN202280087616.X

申请日：2022-11-09

Applicant: 弗劳恩霍夫应用研究促进协会

Inventor： 西蒙·施瓦尔 , 吴允瀚 , 于尔根·赫勒 , 马蒂亚斯·吉依尔 , 米哈伊尔·科罗蒂耶夫

IPC: H04S7/00 , G10L19/008

Abstract: 根据本发明的实施例包含一种用于渲染(例如在空间上渲染)声学场景的渲染器，其中渲染器被配置为使用空间扩展声源(例如SESS，例如作为空间扩展声源，例如，例如使用均匀扩展声源算法再现漫射声的空间扩展声源)在第二空间区域中(例如第二声学均匀空间中；例如第二房间中；例如第一空间区域外部的空间区域中)渲染(例如再现)(例如混响；例如后期混响的)漫射声的声学冲击，漫射声源自第一空间区域中(例如第一声学均匀空间，AHS中；例如第一房间中)。此外，公开了编码器、方法及比特流。

2.

发明公开
音频解码器、音频编码器、使用多个数据包、数据包包括定义渲染场景的时间演变的一个或多个场景配置数据包以及包括时间戳信息的解码方法、编码方法和比特流审中-实审

公开(公告)号：CN118648059A

公开(公告)日：2024-09-13

申请号：CN202280088351.5

申请日：2022-11-09

Applicant: 弗劳恩霍夫应用研究促进协会

Inventor： 萨沙·迪施 , 西蒙·施瓦尔 , 卡利埃尔·波特·哈桑

IPC: G10L19/008 , G10L19/16 , H04S3/00 , H04S7/00

Abstract: 根据本发明的实施例涉及音频解码器，用于基于编码的音频表示提供解码的音频表示，其中音频解码器被配置为空间渲染一个或多个音频信号；其中，音频解码器被配置为接收不同数据包类型的多个数据包，数据包包括提供定义场景对象的使用和/或场景特征的使用的渲染器配置信息的一个或多个场景配置数据包，数据包包括定义用于渲染的场景元数据的更新的一个或多个场景更新数据包，数据包包括一个或多个场景有效载荷数据包，场景有效载荷数据包包括一个或多个场景对象的定义和/或一个或多个场景特征的定义；其中，音频解码器被配置为选择一个或多个场景对象的定义和/或一个或多个场景特征的定义，用于根据渲染器配置信息进行渲染，这些定义包括在场景有效载荷数据包中；以及其中，音频解码器被配置为根据一个或多个场景更新数据包的内容更新一个或多个场景元数据。进一步的实施例涉及编码器、方法和比特流。进一步的实施例涉及解码器、编码器、方法和比特流，具有带有更新条件的场景更新数据包、具有提供定义渲染场景的时间演变的渲染器配置信息以及具有时间戳信息和/或具有子场景单元信息的场景配置数据包，其中单元信息定义了一个或多个单元与相应的一个或多个数据结构之间的关联。

3.

发明公开
采用关于默认声学环境的信息渲染虚拟音频场景的设备和方法审中-实审

公开(公告)号：CN118633303A

公开(公告)日：2024-09-10

申请号：CN202280088335.6

申请日：2022-11-09

Applicant: 弗劳恩霍夫应用研究促进协会

Inventor： 于尔根·赫勒 , 文桑·马兹曼扬 , 亚历山大·阿达米 , 尼尔斯·彼得斯 , 西蒙·施瓦尔 , 卡利埃尔·波特·哈桑 , 马蒂亚斯·吉依尔 , 苏杰特·马特 , 安蒂·埃罗宁 , 奥托·哈留

IPC: H04S7/00

Abstract: 根据实施例，提供了一种用于渲染虚拟音频场景的设备(100)。一个或多个声源正在虚拟音频场景中发射声音。设备(100)包括被配置用于接收音频信息的输入接口(110)，其中，音频信息包括针对虚拟音频场景的音频信息。此外，设备(100)包括渲染器(120)，该渲染器被配置用于根据针对虚拟音频场景的音频信息来生成用于再现虚拟音频场景的一个或多个音频输出声道。如果关于虚拟音频场景的当前声学环境的信息对于渲染器(120)不可用，则渲染器(120)被配置为根据关于默认声学环境的信息来生成用于再现虚拟音频场景的一个或多个音频输出声道。

4.

发明公开
音频解码器、音频编码器、使用定义一个或多个单元与相应的一个或多个数据结构之间的关联的场景配置数据包单元信息的解码方法、编码方法和比特流审中-实审

公开(公告)号：CN118525331A

公开(公告)日：2024-08-20

申请号：CN202280088353.4

申请日：2022-11-09

Applicant: 弗劳恩霍夫应用研究促进协会

Inventor： 萨沙·迪施 , 西蒙·施瓦尔 , 卡利埃尔·波特·哈桑

IPC: G10L19/022 , G06F3/16 , G10L19/16 , G10L19/008 , H04S7/00

Abstract: 根据本发明的实施例涉及音频解码器，用于基于编码的音频表示提供解码的音频表示，其中音频解码器被配置为空间渲染一个或多个音频信号；其中，音频解码器被配置为接收不同数据包类型的多个数据包，数据包包括提供定义场景对象的使用和/或场景特征的使用的渲染器配置信息的一个或多个场景配置数据包，数据包包括定义用于渲染的场景元数据的更新的一个或多个场景更新数据包，数据包包括一个或多个场景有效载荷数据包，场景有效载荷数据包包括一个或多个场景对象的定义和/或一个或多个场景特征的定义；其中，音频解码器被配置为选择一个或多个场景对象的定义和/或一个或多个场景特征的定义，用于根据渲染器配置信息进行渲染，这些定义包括在场景有效载荷数据包中；以及其中，音频解码器被配置为根据一个或多个场景更新数据包的内容更新一个或多个场景元数据。进一步的实施例涉及编码器、方法和比特流。进一步的实施例涉及解码器、编码器、方法和比特流，具有带有更新条件的场景更新数据包、具有提供定义渲染场景的时间演变的渲染器配置信息以及具有时间戳信息和/或具有子场景单元信息的场景配置数据包，其中单元信息定义了一个或多个单元与相应的一个或多个数据结构之间的关联。

5.

发明公开
用于使用基本空间扇区合成空间扩展声源的装置、方法或计算机程序审中-实审

公开(公告)号：CN118251907A

公开(公告)日：2024-06-25

申请号：CN202280074800.0

申请日：2022-11-07

Applicant: 弗劳恩霍夫应用研究促进协会

Inventor： 吴允瀚 , 于尔根·赫勒 , 米哈伊尔·科罗蒂耶夫 , 马蒂亚斯·吉依尔 , 西蒙·施瓦尔 , 亚历山大·阿达米 , 卡洛塔·阿内米勒

IPC: H04S7/00

Abstract: 一种用于合成空间扩展声源(SESS)(7000)的装置包含：存储器(200，2000)，用于存储用于覆盖倾听者的渲染范围的不同的基本空间扇区的渲染数据项；扇区识别处理器(4000)，用于基于倾听者数据和空间扩展声源数据从不同的基本空间扇区识别属于空间扩展声源的基本空间扇区的集合；目标数据计算器(5000)，用于从用于基本空间扇区的集合的渲染数据项计算目标渲染数据；以及音频处理器(300，3000)，用于使用目标渲染数据处理表示空间扩展声源的音频信号。

6.

发明公开
用于使用关于潜在修改对象的修改数据合成空间扩展声源的装置、方法或计算机程序审中-实审

公开(公告)号：CN118235434A

公开(公告)日：2024-06-21

申请号：CN202280074781.1

申请日：2022-11-07

Applicant: 弗劳恩霍夫应用研究促进协会

Inventor： 吴允瀚 , 于尔根·赫勒 , 米哈伊尔·科罗蒂耶夫 , 马蒂亚斯·吉依尔 , 西蒙·施瓦尔 , 亚历山大·阿达米

IPC: H04S7/00

Abstract: 一种用于合成空间扩展声源的装置包含：输入接口(4020)，用于接收音频场景的描述并用于接收倾听者数据，音频场景的描述包括关于空间扩展声源的空间扩展声源数据和关于潜在修改对象(7010)的修改数据；扇区识别处理器(4000)，用于基于空间扩展声源数据和倾听者数据以及修改数据，在用于倾听者的渲染范围内识别用于空间扩展声源(7000)的有限的经修改空间扇区，用于倾听者的渲染范围大于有限的经修改空间扇区；目标数据计算器(5000)，用于从从属于经修改的有限空间扇区的一个或多个渲染数据项计算目标渲染数据；以及音频处理器(300，3000)，用于使用目标渲染数据处理表示空间扩展声源的音频信号。

7.

发明公开
音频解码器、音频编码器、使用多个数据包、数据包包括一个或多个场景配置数据包、一个或多个场景更新数据包、一个或多个场景有效载荷数据包的解码方法、编码方法和比特流审中-实审

公开(公告)号：CN118525528A

公开(公告)日：2024-08-20

申请号：CN202280088359.1

申请日：2022-11-09

Applicant: 弗劳恩霍夫应用研究促进协会

Inventor： 萨沙·迪施 , 西蒙·施瓦尔 , 卡利埃尔·波特·哈桑

IPC: H04S3/00 , G10L19/008 , G10L19/16 , H04S7/00

Abstract: 根据本发明的实施例涉及音频解码器，用于基于编码的音频表示提供解码的音频表示，其中音频解码器被配置为空间渲染一个或多个音频信号；其中，音频解码器被配置为接收不同数据包类型的多个数据包，数据包包括提供定义场景对象的使用和/或场景特征的使用的渲染器配置信息的一个或多个场景配置数据包，数据包包括定义用于渲染的场景元数据的更新的一个或多个场景更新数据包，数据包包括一个或多个场景有效载荷数据包，场景有效载荷数据包包括一个或多个场景对象的定义和/或一个或多个场景特征的定义；其中，音频解码器被配置为选择一个或多个场景对象的定义和/或一个或多个场景特征的定义，用于根据渲染器配置信息进行渲染，这些定义包括在场景有效载荷数据包中；以及其中，音频解码器被配置为根据一个或多个场景更新数据包的内容更新一个或多个场景元数据。进一步的实施例涉及编码器、方法和比特流。进一步的实施例涉及解码器、编码器、方法和比特流，具有带有更新条件的场景更新数据包、具有提供定义渲染场景的时间演变的渲染器配置信息以及具有时间戳信息和/或具有子场景单元信息的场景配置数据包，其中单元信息定义了一个或多个单元与相应的一个或多个数据结构之间的关联。

8.

发明公开
音频解码器、音频编码器、使用多个数据包、数据包包括一个或多个场景配置数据包和带有一个或多个更新条件的一个或多个场景更新数据包的解码方法、编码方法和比特流审中-实审

公开(公告)号：CN118511221A

公开(公告)日：2024-08-16

申请号：CN202280088333.7

申请日：2022-11-09

Applicant: 弗劳恩霍夫应用研究促进协会

Inventor： 萨沙·迪施 , 西蒙·施瓦尔 , 卡利埃尔·波特·哈桑

IPC: G10L19/008 , G10L19/16 , H04S7/00

Abstract: 根据本发明的实施例涉及音频解码器，用于基于编码的音频表示提供解码的音频表示，其中音频解码器被配置为空间渲染一个或多个音频信号；其中，音频解码器被配置为接收不同数据包类型的多个数据包，数据包包括提供定义场景对象的使用和/或场景特征的使用的渲染器配置信息的一个或多个场景配置数据包，数据包包括定义用于渲染的场景元数据的更新的一个或多个场景更新数据包，数据包包括一个或多个场景有效载荷数据包，场景有效载荷数据包包括一个或多个场景对象的定义和/或一个或多个场景特征的定义；其中，音频解码器被配置为选择一个或多个场景对象的定义和/或一个或多个场景特征的定义，用于根据渲染器配置信息进行渲染，这些定义包括在场景有效载荷数据包中；以及其中，音频解码器被配置为根据一个或多个场景更新数据包的内容更新一个或多个场景元数据。进一步的实施例涉及编码器、方法和比特流。进一步的实施例涉及解码器、编码器、方法和比特流，具有带有更新条件的场景更新数据包、具有提供定义渲染场景的时间演变的渲染器配置信息以及具有时间戳信息和/或具有子场景单元信息的场景配置数据包，其中单元信息定义了一个或多个单元与相应的一个或多个数据结构之间的关联。

9.

发明公开
用于使用方差或协方差数据合成空间扩展声源的装置、方法或计算机程序审中-实审

公开(公告)号：CN118235433A

公开(公告)日：2024-06-21

申请号：CN202280074749.3

申请日：2022-11-07

Applicant: 弗劳恩霍夫应用研究促进协会

Inventor： 吴允瀚 , 于尔根·赫勒 , 米哈伊尔·科罗蒂耶夫 , 马蒂亚斯·吉依尔 , 西蒙·施瓦尔 , 亚历山大·阿达米 , 卡洛塔·阿内米勒

IPC: H04S7/00

Abstract: 一种用于合成空间扩展声源(SESS)的装置包含：存储器(200，2000)，用于存储用于不同的有限空间扇区的一个或多个渲染数据项，其中不同的有限空间扇区位于用于倾听者的渲染范围中，其中用于有限空间扇区的一个或多个渲染数据项包含左方差数据项、右方差数据项、以及左‑右协方差数据项中的至少一个；扇区识别处理器(4000)，用于基于空间扩展声源数据在用于倾听者的渲染范围内识别用于空间扩展声源的一个或多个有限空间扇区；目标数据计算器(5000)，用于从所存储的左方差数据、所存储右方差数据或所存储的协方差数据计算目标渲染数据；以及音频处理器(300，3000)，用于使用目标渲染数据处理表示空间扩展声源的音频信号。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification