-
公开(公告)号:CN104067340B
公开(公告)日:2016-06-08
申请号:CN201280067875.2
申请日:2012-12-11
Applicant: 三菱电机株式会社
IPC: G10L21/0216
CPC classification number: G10L21/0216 , G10L21/0232
Abstract: 从包括噪声和语音的混合信号中产生增强的语音。利用矢量泰勒级数来估计混合信号中的噪声。估计的噪声依据最小均方差。然后,从混合信号中减去噪声以获得增强的语音。
-
公开(公告)号:CN105283914A
公开(公告)日:2016-01-27
申请号:CN201480033420.8
申请日:2014-05-19
Applicant: 三菱电机株式会社
IPC: G10L15/183 , G10L15/22 , G10L15/08
CPC classification number: G10L15/08 , G10L15/183 , G10L15/22 , G10L2015/088 , G10L2015/228
Abstract: 一种系统和方法识别包括词的序列的语音。利用声学模型和语言模型生成语音的一组解释,并且针对每一个解释,确定在表达所述词的序列时表示解释的正确性的分数,以生成一组分数。接下来,基于每一个解释与响应于接收到词序列约束而确定的约束的一致性来更新所述一组分数。
-
公开(公告)号:CN111954904A
公开(公告)日:2020-11-17
申请号:CN201980025148.1
申请日:2019-03-07
Applicant: 三菱电机株式会社
IPC: G10L21/0272 , G10L25/30
Abstract: 关于用于转换输入音频信号的音频信号处理系统的系统和方法。处理器通过以下来实现模块的步骤:将输入音频信号输入到频谱图估计器中以提取音频特征序列,并对所述音频特征序列进行处理,以输出估计频谱图集合。使用频谱图细化模块处理所述估计频谱图集合和所述音频特征序列,以输出细化频谱图集合。其中所述频谱图细化模块的所述处理基于迭代重构算法。使用信号细化模块处理一个或多个目标音频信号的细化频谱图集合,以获得目标音频信号估计。输出接口输出优化的目标音频信号估计。其中通过使用存储在存储器中的优化器使误差最小化来优化所述模块。
-
公开(公告)号:CN105556247B
公开(公告)日:2018-06-19
申请号:CN201480051874.8
申请日:2014-09-09
Applicant: 三菱电机株式会社
Inventor: 丹尼尔·N·尼科夫斯基 , J·R·赫尔歇 , B·哈尔沙姆 , J·勒鲁克斯
IPC: G01C21/36
CPC classification number: G01C21/36 , G01C21/3617 , G06K9/6277
Abstract: 一种方法调节车辆导航系统的用户接口。基于表示与车辆有关的当前状态的输入向量,使用表示先前状态的预测模型来预测实现下一状态的动作的概率。然后,在车辆中显示具有最高概率的动作的子集。
-
公开(公告)号:CN104737229A
公开(公告)日:2015-06-24
申请号:CN201380054925.8
申请日:2013-10-17
Applicant: 三菱电机株式会社
IPC: G10L21/0232 , G10L21/0216
CPC classification number: G10L21/0232 , G10L2021/02163
Abstract: 形式为特征向量的序列的输入信号通过首先将所述输入信号的模型的参数存储到存储器中被变换为输出信号。使用所述向量和所述参数,推断隐变量的向量的序列。对于每个特征向量xn,存在隐变量hi,n的至少一个向量hn,并且每个隐变量非负。使用所述特征向量、隐变量的所述向量和所述参数来生成所述输出信号。每个特征向量xn依赖于相同n的所述隐变量hi,n中的至少一个。所述隐变量根据公式相关,其中j和l是求和索引。所述参数包括非负权重ci,j,l,并且εl,n是独立的非负随机变量。
-
公开(公告)号:CN104285224B
公开(公告)日:2018-11-16
申请号:CN201380024544.5
申请日:2013-05-15
Applicant: 三菱电机株式会社
IPC: G06F17/30
CPC classification number: G06F17/30286
Abstract: 通过根据文本确定文本特征并将文本特征变换为主题特征来对该文本进行分类。使用判别主题模型针对每一个主题特征来确定分数。该模型包括对主题特征进行操作的分类器,其中,通过变换根据文本特征来确定主题特征,并且变换被优化以最大化相对于不正确的类的分数的正确的类的分数。接着,选择针对文本具有最高分数的类标签。在按层次结构组织类的情况下,判别主题模型适用于根据前面的级别调节的每一个级别的类,并且跨级别组合分数以评估最高得分的类标签。
-
公开(公告)号:CN105684079A
公开(公告)日:2016-06-15
申请号:CN201480058216.1
申请日:2014-10-08
Applicant: 三菱电机株式会社
IPC: G10L21/0208
Abstract: 一种从输入的有噪信号确定多个序列的隐变量的方法,多个序列的隐变量包括表示清晰语音信号的激励分量的至少一个序列的隐变量、表示清晰语音信号的滤波器分量的至少一个序列的隐变量和表示噪声信号的至少一个序列的隐变量。所述多个序列的隐变量包括被确定为非负基函数的非负线性组合的隐变量。所述确定使用清晰语音信号的模型,该模型包括将激励分量和滤波器分量的隐变量约束为在时间上统计地具有依存性的非负源-滤波器动力学系统(NSFDS)。所述方法使用表示激励分量和滤波器分量的相应隐变量的乘积生成输出信号。
-
公开(公告)号:CN105393305A
公开(公告)日:2016-03-09
申请号:CN201480040398.X
申请日:2014-07-04
Applicant: 三菱电机株式会社
IPC: G10L21/0208
CPC classification number: G10L21/0232 , G10L15/063 , G10L21/02 , G10L21/0208 , G10L21/0272 , G10L25/78 , G10L2021/02163
Abstract: 一种处理声音信号的方法,该声音信号是目标信号和干扰信号的混合物,该方法首先通过一组增强过程增强声音信号以产生一组初始增强信号。然后,对该声音信号和该组初始增强信号应用集成学习过程以产生该声音信号的特征。
-
公开(公告)号:CN104246763A
公开(公告)日:2014-12-24
申请号:CN201380017595.5
申请日:2013-02-26
Applicant: 三菱电机株式会社
CPC classification number: G06F17/30663 , G06F17/2785
Abstract: 文本被处理以构造文本的模型。文本具有共用词汇。文本被分成文本的集合和子集。共用词汇在两个或更多个集合中的用法不同,并且两个或更多个子集的主题不同。针对文本定义概率模型。该概率模型将文本中的各单词视为具有位置和单词值的标志,并且使用该概率模型中的随机变量的分布来表示在文本中的共用词汇的用法、主题、子主题和针对各标志的单词值,其中该随机变量是离散的。对应于与单词关联的词汇用法、单词值、主题和子主题,针对模型,估计参数。
-
公开(公告)号:CN110383377B
公开(公告)日:2023-10-13
申请号:CN201880015644.4
申请日:2018-02-23
Applicant: 三菱电机株式会社
IPC: G10L21/0216 , G10L15/16 , G10L15/20
Abstract: 一种语音识别系统包括接收包括语音信号的声信号的多个麦克风;从声信号生成多通道输入的输入接口;存储多通道语音识别网络的一个或多个储存器,其中,多通道语音识别网络包括从多通道输入生成时间‑频率掩模的掩模估计网络;被训练为使用时间‑频率掩模从多通道输入中选择基准通道输入并且基于基准通道输入生成增强语音数据集的波束形成器网络;以及被训练为将增强语音数据集变换为文本的编码器‑解码器网络。系统还包括与一个或多个储存器关联地使用多通道语音识别网络以从多通道输入生成文本的一个或多个处理器;和渲染文本的输出接口。
-
-
-
-
-
-
-
-
-