-
公开(公告)号:CN112567458A
公开(公告)日:2021-03-26
申请号:CN201980052229.0
申请日:2019-02-13
Applicant: 三菱电机株式会社
IPC: G10L21/0208 , G10L21/0232
Abstract: 用于音频信号处理的系统和方法包括输入接口,其接收包括目标音频信号和噪声的混合体的有噪音频信号。编码器将有噪音频信号的每个时频区间映射到指示目标信号的相位的相位相关值的一个或更多个相位量化码本中的一个或更多个相位相关值。针对有噪音频信号的每个时频区间计算幅度比值,该幅度比值指示目标音频信号的幅度与有噪音频信号的幅度之比。滤波器基于相位相关值和幅度比值从有噪音频信号消除噪声,以产生增强音频信号。输出接口输出增强音频信号。
-
公开(公告)号:CN111989742A
公开(公告)日:2020-11-24
申请号:CN201880091966.7
申请日:2018-10-24
Applicant: 三菱电机株式会社
IPC: G10L25/30
Abstract: 用于语音识别系统的系统和方法,该语音识别系统用于识别包括多个讲话者的交叠语音的语音。该系统包括硬件处理器。计算机储存存储器存储数据并且具有存储于其上的计算机可执行指令,该计算机可执行指令在由处理器执行时将实现所存储的语音识别网络。输入接口接收声学信号,所接收的声学信号包括多个讲话者的语音信号的混合体,其中多个讲话者包括目标讲话者。所存储的语音识别网络的编码器网络和解码器网络被训练为将所接收的声学信号变换为针对每个目标讲话者的文本。使得编码器网络输出一组识别编码,并且解码器网络使用一组识别编码以输出针对每个目标讲话者的文本。输出接口传输针对每个目标讲话者的文本。
-
公开(公告)号:CN111954904A
公开(公告)日:2020-11-17
申请号:CN201980025148.1
申请日:2019-03-07
Applicant: 三菱电机株式会社
IPC: G10L21/0272 , G10L25/30
Abstract: 关于用于转换输入音频信号的音频信号处理系统的系统和方法。处理器通过以下来实现模块的步骤:将输入音频信号输入到频谱图估计器中以提取音频特征序列,并对所述音频特征序列进行处理,以输出估计频谱图集合。使用频谱图细化模块处理所述估计频谱图集合和所述音频特征序列,以输出细化频谱图集合。其中所述频谱图细化模块的所述处理基于迭代重构算法。使用信号细化模块处理一个或多个目标音频信号的细化频谱图集合,以获得目标音频信号估计。输出接口输出优化的目标音频信号估计。其中通过使用存储在存储器中的优化器使误差最小化来优化所述模块。
-
公开(公告)号:CN106537420B
公开(公告)日:2019-06-11
申请号:CN201580038701.7
申请日:2015-07-24
Applicant: 三菱电机株式会社
CPC classification number: G06N3/0445 , G06N3/0436 , G06N3/084 , G06N7/005 , G06N20/00 , G10L15/16
Abstract: 一种用于通过首先定义用于转换输入信号的模型来转换输入信号的方法,其中,模型由约束和一组模型参数来指定。迭代推断过程从模型和一组模型参数导出,并且被展开为一组层,其中,针对所述过程的各次迭代存在一层,并且其中,所有层使用同一组网络参数。通过解放该一组网络参数使得针对各层存在一组网络参数且各组网络参数分别可维持并分别可应用于相应层来形成神经网络。训练神经网络,以获得受训神经网络,并且然后,使用受训神经网络来转换输入信号,以获得输出信号。
-
公开(公告)号:CN105556247B
公开(公告)日:2018-06-19
申请号:CN201480051874.8
申请日:2014-09-09
Applicant: 三菱电机株式会社
Inventor: 丹尼尔·N·尼科夫斯基 , J·R·赫尔歇 , B·哈尔沙姆 , J·勒鲁克斯
IPC: G01C21/36
CPC classification number: G01C21/36 , G01C21/3617 , G06K9/6277
Abstract: 一种方法调节车辆导航系统的用户接口。基于表示与车辆有关的当前状态的输入向量,使用表示先前状态的预测模型来预测实现下一状态的动作的概率。然后,在车辆中显示具有最高概率的动作的子集。
-
公开(公告)号:CN104737229A
公开(公告)日:2015-06-24
申请号:CN201380054925.8
申请日:2013-10-17
Applicant: 三菱电机株式会社
IPC: G10L21/0232 , G10L21/0216
CPC classification number: G10L21/0232 , G10L2021/02163
Abstract: 形式为特征向量的序列的输入信号通过首先将所述输入信号的模型的参数存储到存储器中被变换为输出信号。使用所述向量和所述参数,推断隐变量的向量的序列。对于每个特征向量xn,存在隐变量hi,n的至少一个向量hn,并且每个隐变量非负。使用所述特征向量、隐变量的所述向量和所述参数来生成所述输出信号。每个特征向量xn依赖于相同n的所述隐变量hi,n中的至少一个。所述隐变量根据公式相关,其中j和l是求和索引。所述参数包括非负权重ci,j,l,并且εl,n是独立的非负随机变量。
-
公开(公告)号:CN119631083A
公开(公告)日:2025-03-14
申请号:CN202380057515.2
申请日:2023-06-16
Applicant: 三菱电机株式会社
IPC: G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/096
Abstract: 提供一种人工智能(AI)低延迟处理系统。该低延迟处理系统包括:处理器;以及存储有指令的存储器。该低延迟处理系统被配置为:收集帧序列,所述帧序列联合包括分散在所述帧序列中至少一些帧中的信息;执行定时神经网络,该定时神经网络被训练以识别所述帧序列中的包括指示所述信息的至少部分信息的早期帧子序列;并且执行解码神经网络,该解码神经网络经训练以从帧子序列中的部分信息解码所述信息,其中,所述定时神经网络与所述解码神经网络被联合训练,以迭代地识别从训练帧序列的起始处开始的包含足以解码训练信息的部分训练信息的最小数量的子帧。
-
公开(公告)号:CN111989742B
公开(公告)日:2024-08-30
申请号:CN201880091966.7
申请日:2018-10-24
Applicant: 三菱电机株式会社
IPC: G10L25/30
Abstract: 用于语音识别系统的系统和方法,该语音识别系统用于识别包括多个讲话者的交叠语音的语音。该系统包括硬件处理器。计算机储存存储器存储数据并且具有存储于其上的计算机可执行指令,该计算机可执行指令在由处理器执行时将实现所存储的语音识别网络。输入接口接收声学信号,所接收的声学信号包括多个讲话者的语音信号的混合体,其中多个讲话者包括目标讲话者。所存储的语音识别网络的编码器网络和解码器网络被训练为将所接收的声学信号变换为针对每个目标讲话者的文本。使得编码器网络输出一组识别编码,并且解码器网络使用一组识别编码以输出针对每个目标讲话者的文本。输出接口传输针对每个目标讲话者的文本。
-
公开(公告)号:CN111954904B
公开(公告)日:2024-07-09
申请号:CN201980025148.1
申请日:2019-03-07
Applicant: 三菱电机株式会社
IPC: G10L21/0272 , G10L25/30
Abstract: 关于用于转换输入音频信号的音频信号处理系统的系统和方法。处理器通过以下来实现模块的步骤:将输入音频信号输入到频谱图估计器中以提取音频特征序列,并对所述音频特征序列进行处理,以输出估计频谱图集合。使用频谱图细化模块处理所述估计频谱图集合和所述音频特征序列,以输出细化频谱图集合。其中所述频谱图细化模块的所述处理基于迭代重构算法。使用信号细化模块处理一个或多个目标音频信号的细化频谱图集合,以获得目标音频信号估计。输出接口输出优化的目标音频信号估计。其中通过使用存储在存储器中的优化器使误差最小化来优化所述模块。
-
公开(公告)号:CN117581233A
公开(公告)日:2024-02-20
申请号:CN202280044627.X
申请日:2022-02-04
Applicant: 三菱电机株式会社
IPC: G06N3/0455 , G06N3/044 , G06N3/0442 , G06N3/047 , G06N3/08 , G06N3/063
Abstract: 本公开提供了一种适用于流应用的以注意力进行序列到序列建模的人工智能(AI)系统。该AI系统包括:至少一个处理器;以及存储有指令的存储器,所述指令在由处理器执行时使得AI系统通过深度神经网络(DNN)的层处理输入帧序列中的各个输入帧,以生成输出序列。DNN的至少一些层包括具有关注非因果帧和因果帧的双非因果和因果架构的双自注意力模块。此外,该AI系统渲染输出序列。
-
-
-
-
-
-
-
-
-