用于多声道语音增强的基于掩码的神经波束成形的系统和方法

    公开(公告)号:CN119072745A

    公开(公告)日:2024-12-03

    申请号:CN202480001753.6

    申请日:2024-03-13

    Abstract: 一种方法包括在第一时间窗口期间从多个音频输入设备接收一组有噪音频信号。该方法还包括基于该组有噪音频信号生成有噪时间‑频率表示。该方法还包括将有噪时间‑频率表示作为输入提供给掩码估计模型,该掩码估计模型被训练以输出用于从有噪时间‑频率表示预测干净语音音频的干净时间‑频率表示的掩码。该方法还包括基于掩码来确定波束成形滤波器权重。该方法还包括将波束成形滤波器权重应用于有噪时间‑频率表示,以将干净语音音频与该组有噪音频信号相隔离。另外,该方法包括输出干净语音音频。

Patent Agency Ranking