-
公开(公告)号:CN111954904B
公开(公告)日:2024-07-09
申请号:CN201980025148.1
申请日:2019-03-07
Applicant: 三菱电机株式会社
IPC: G10L21/0272 , G10L25/30
Abstract: 关于用于转换输入音频信号的音频信号处理系统的系统和方法。处理器通过以下来实现模块的步骤:将输入音频信号输入到频谱图估计器中以提取音频特征序列,并对所述音频特征序列进行处理,以输出估计频谱图集合。使用频谱图细化模块处理所述估计频谱图集合和所述音频特征序列,以输出细化频谱图集合。其中所述频谱图细化模块的所述处理基于迭代重构算法。使用信号细化模块处理一个或多个目标音频信号的细化频谱图集合,以获得目标音频信号估计。输出接口输出优化的目标音频信号估计。其中通过使用存储在存储器中的优化器使误差最小化来优化所述模块。
-
公开(公告)号:CN119698658A
公开(公告)日:2025-03-25
申请号:CN202380058927.8
申请日:2023-06-02
Applicant: 三菱电机株式会社
IPC: G10L21/0208 , G10L21/0216
Abstract: 公开了一种用于混响减小的系统和方法。第一深度神经网络(DNN)从包括目标直接路径信号和目标直接路径信号的混响的声学信号的混合产生目标直接路径信号的第一估计。估计对第一估计的房间脉冲响应(RIR)进行建模的滤波器。滤波器在应用于目标直接路径信号的第一估计时根据距离函数生成最接近声学信号的混合与目标直接路径信号的第一估计之间的残差的结果。估计的滤波器被用于对RIR进行建模。
-
公开(公告)号:CN118891675A
公开(公告)日:2024-11-01
申请号:CN202380027180.X
申请日:2023-02-28
Applicant: 三菱电机株式会社
IPC: G10L25/45 , G10L21/0272 , G10L21/0208 , G10L21/0224
Abstract: 提供了一种用于低延迟音频信号增强的系统和方法。使用第一滑动窗口方法将音频信号的输入混合分割成重叠帧序列。第一滑动窗口方法包括具有与对应帧的窗口相关联的第一宽度和与第一滑动窗口方法的窗口的移位相关联的移位长度的第一窗口函数。接着,使用第一DNN、频域因果线性滤波器和第二DNN来处理每个帧,以针对每个经处理的帧生成最终增强重叠帧。然后,使用与第二窗口函数相关联的第二滑动窗口方法来组合最终增强重叠帧,所述第二窗口函数具有比第一宽度小的第二宽度以及与第一滑动窗口方法相同的移位长度。
-
公开(公告)号:CN117940996A
公开(公告)日:2024-04-26
申请号:CN202280062389.5
申请日:2022-05-12
Applicant: 三菱电机株式会社
IPC: G10L25/30
Abstract: 公开了一种用于检测异常声音的系统和方法。该方法包括接收音频信号的谱图,所述谱图所具有的元素由谱图的时频域中的值限定。每个值均对应于谱图的由时频域中的坐标标识的元素。将谱图的时频域划分为上下文区域和目标区域。由神经网络使用注意力神经过程处理上下文区域和目标区域,以针对坐标在目标区域中的元素恢复谱图的值。将目标区域的元素的恢复值与所划分的目标区域的元素的值进行比较。基于所述比较来确定异常分数。使用所述异常分数执行控制动作。
-
公开(公告)号:CN117730369A
公开(公告)日:2024-03-19
申请号:CN202280051814.0
申请日:2022-07-15
Applicant: 三菱电机株式会社
IPC: G10L21/0208
Abstract: 公开了一种用于混响减少的系统和方法。第一深度神经网络(DNN)根据声学信号混合体来生成目标直接路径信号的第一估计,该声学信号混合体包括目标直接路径信号以及该目标直接路径信号的混响。估计对第一估计的房间脉冲响应(RIR)进行建模的滤波器。滤波器在被应用于目标直接路径信号的第一估计时生成根据距离函数最接近于声学信号混合体与目标直接路径信号的第一估计之间的残差。通过从所接收到的混合体中去除将滤波器应用于目标直接路径信号的第一估计的结果,来获得目标直接路径信号的具有减少的混响的混合体。第二DNN根据具有减少的混响的混合体来生成目标直接路径信号的第二估计。
-
公开(公告)号:CN111954904A
公开(公告)日:2020-11-17
申请号:CN201980025148.1
申请日:2019-03-07
Applicant: 三菱电机株式会社
IPC: G10L21/0272 , G10L25/30
Abstract: 关于用于转换输入音频信号的音频信号处理系统的系统和方法。处理器通过以下来实现模块的步骤:将输入音频信号输入到频谱图估计器中以提取音频特征序列,并对所述音频特征序列进行处理,以输出估计频谱图集合。使用频谱图细化模块处理所述估计频谱图集合和所述音频特征序列,以输出细化频谱图集合。其中所述频谱图细化模块的所述处理基于迭代重构算法。使用信号细化模块处理一个或多个目标音频信号的细化频谱图集合,以获得目标音频信号估计。输出接口输出优化的目标音频信号估计。其中通过使用存储在存储器中的优化器使误差最小化来优化所述模块。
-
-
-
-
-