Patent search ap:("三菱电机株式会社") AND inv:"渡部晋司" Page 1

1.

发明授权
语音识别系统有权

公开(公告)号：CN111480197B

公开(公告)日：2023-06-27

申请号：CN201880079228.0

申请日：2018-05-21

Applicant: 三菱电机株式会社

Inventor： 堀贵明 , 渡部晋司 , J·赫尔希

IPC: G10L15/187 , G10L15/19 , G10L15/16

Abstract: 一种语音识别系统包括：接收话语声音的输入装置、一个或更多个处理器以及一个或更多个储存装置，所述一个或多个储存装置存储参数和包括使一个或更多个处理器执行操作的指令的程序模块。操作包括：从由话语声音转换的音频波形数据中提取声学特征序列；使用具有编码器网络参数的编码器网络将声学特征序列编码为隐藏向量序列；通过将隐藏向量序列馈送至具有解码器网络参数的解码器网络来预测第一输出标签序列概率；通过使用字符类语言模型(LM)和单词级LM的混合网络来预测第二输出标签序列概率；以及使用标签序列搜索模块，通过组合从解码器网络和混合网络提供的第一输出标签序列概率和第二输出标签序列概率，来搜索具有最高序列概率的输出标签序列。

2.

发明授权
语音识别系统及使用语音识别系统的方法有权

公开(公告)号：CN111989742B

公开(公告)日：2024-08-30

申请号：CN201880091966.7

申请日：2018-10-24

Applicant: 三菱电机株式会社

Inventor： J·勒鲁克斯 , 堀贵明 , S·赛特尔 , 关博史 , 渡部晋司 , J·赫尔希

IPC: G10L25/30

Abstract: 用于语音识别系统的系统和方法，该语音识别系统用于识别包括多个讲话者的交叠语音的语音。该系统包括硬件处理器。计算机储存存储器存储数据并且具有存储于其上的计算机可执行指令，该计算机可执行指令在由处理器执行时将实现所存储的语音识别网络。输入接口接收声学信号，所接收的声学信号包括多个讲话者的语音信号的混合体，其中多个讲话者包括目标讲话者。所存储的语音识别网络的编码器网络和解码器网络被训练为将所接收的声学信号变换为针对每个目标讲话者的文本。使得编码器网络输出一组识别编码，并且解码器网络使用一组识别编码以输出针对每个目标讲话者的文本。输出接口传输针对每个目标讲话者的文本。

3.

发明公开
用于训练多语言语音识别网络的方法和系统以及用于执行多语言语音识别的语音识别系统有权

公开(公告)号：CN111557029A

公开(公告)日：2020-08-18

申请号：CN201880077778.9

申请日：2018-05-31

Applicant: 三菱电机株式会社

Inventor： 渡部晋司 , 堀贵明 , 关博史 , J·勒鲁克斯 , J·赫尔希

IPC: G10L15/06 , G10L15/16 , G06N3/04 , G06N3/08

Abstract: 一种用于训练多语言语音识别网络的方法包括：提供与预定语言相对应的话语数据集；在话语数据集中插入语言标识(ID)标签，其中，话语数据集中的每一个由语言ID标签中的每一个来加标签；将加标签的话语数据集级联；从话语数据集生成初始网络参数；根据预定序列选择初始网络参数；以及用一系列所选择的初始网络参数和级联的加标签的话语数据集迭代地训练端到端网络，直到训练结果达到阈值。

4.

发明授权
音频信号处理系统、音频信号处理方法及计算机可读存储介质有权

公开(公告)号：CN112567458B

公开(公告)日：2023-07-18

申请号：CN201980052229.0

申请日：2019-02-13

Applicant: 三菱电机株式会社

Inventor： J·勒鲁克斯 , 渡部晋司 , J·赫尔希 , G·维切恩

IPC: G10L21/0208 , G10L21/0232

Abstract: 用于音频信号处理的系统和方法包括输入接口，其接收包括目标音频信号和噪声的混合体的有噪音频信号。编码器将有噪音频信号的每个时频区间映射到指示目标信号的相位的相位相关值的一个或更多个相位量化码本中的一个或更多个相位相关值。针对有噪音频信号的每个时频区间计算幅度比值，该幅度比值指示目标音频信号的幅度与有噪音频信号的幅度之比。滤波器基于相位相关值和幅度比值从有噪音频信号消除噪声，以产生增强音频信号。输出接口输出增强音频信号。

5.

发明公开
语音识别系统有权

公开(公告)号：CN111480197A

公开(公告)日：2020-07-31

申请号：CN201880079228.0

申请日：2018-05-21

Applicant: 三菱电机株式会社

Inventor： 堀贵明 , 渡部晋司 , J·赫尔希

IPC: G10L15/187 , G10L15/19 , G10L15/16

Abstract: 一种语音识别系统包括：接收话语声音的输入装置、一个或更多个处理器以及一个或更多个储存装置，所述一个或多个储存装置存储参数和包括使一个或更多个处理器执行操作的指令的程序模块。操作包括：从由话语声音转换的音频波形数据中提取声学特征序列；使用具有编码器网络参数的编码器网络将声学特征序列编码为隐藏向量序列；通过将隐藏向量序列馈送至具有解码器网络参数的解码器网络来预测第一输出标签序列概率；通过使用字符类语言模型(LM)和单词级LM的混合网络来预测第二输出标签序列概率；以及使用标签序列搜索模块，通过组合从解码器网络和混合网络提供的第一输出标签序列概率和第二输出标签序列概率，来搜索具有最高序列概率的输出标签序列。

6.

发明授权
用于训练多语言语音识别网络的方法和系统以及用于执行多语言语音识别的语音识别系统有权

公开(公告)号：CN111557029B

公开(公告)日：2021-06-04

申请号：CN201880077778.9

申请日：2018-05-31

Applicant: 三菱电机株式会社

Inventor： 渡部晋司 , 堀贵明 , 关博史 , J·勒鲁克斯 , J·赫尔希

IPC: G10L15/06 , G10L15/16 , G06N3/04 , G06N3/08

Abstract: 一种用于训练多语言语音识别网络的方法包括：提供与预定语言相对应的话语数据集；在话语数据集中插入语言标识(ID)标签，其中，话语数据集中的每一个由语言ID标签中的每一个来加标签；将加标签的话语数据集级联；从话语数据集生成初始网络参数；根据预定序列选择初始网络参数；以及用一系列所选择的初始网络参数和级联的加标签的话语数据集迭代地训练端到端网络，直到训练结果达到阈值。

7.

发明公开
音频信号处理系统、音频信号处理方法及计算机可读存储介质有权

公开(公告)号：CN112567458A

公开(公告)日：2021-03-26

申请号：CN201980052229.0

申请日：2019-02-13

Applicant: 三菱电机株式会社

Inventor： J·勒鲁克斯 , 渡部晋司 , J·赫尔希 , G·维切恩

IPC: G10L21/0208 , G10L21/0232

Abstract: 用于音频信号处理的系统和方法包括输入接口，其接收包括目标音频信号和噪声的混合体的有噪音频信号。编码器将有噪音频信号的每个时频区间映射到指示目标信号的相位的相位相关值的一个或更多个相位量化码本中的一个或更多个相位相关值。针对有噪音频信号的每个时频区间计算幅度比值，该幅度比值指示目标音频信号的幅度与有噪音频信号的幅度之比。滤波器基于相位相关值和幅度比值从有噪音频信号消除噪声，以产生增强音频信号。输出接口输出增强音频信号。

8.

发明公开
语音识别系统及使用语音识别系统的方法有权

公开(公告)号：CN111989742A

公开(公告)日：2020-11-24

申请号：CN201880091966.7

申请日：2018-10-24

Applicant: 三菱电机株式会社

Inventor： J·勒鲁克斯 , 堀贵明 , S·赛特尔 , 关博史 , 渡部晋司 , J·赫尔希

IPC: G10L25/30

Abstract: 用于语音识别系统的系统和方法，该语音识别系统用于识别包括多个讲话者的交叠语音的语音。该系统包括硬件处理器。计算机储存存储器存储数据并且具有存储于其上的计算机可执行指令，该计算机可执行指令在由处理器执行时将实现所存储的语音识别网络。输入接口接收声学信号，所接收的声学信号包括多个讲话者的语音信号的混合体，其中多个讲话者包括目标讲话者。所存储的语音识别网络的编码器网络和解码器网络被训练为将所接收的声学信号变换为针对每个目标讲话者的文本。使得编码器网络输出一组识别编码，并且解码器网络使用一组识别编码以输出针对每个目标讲话者的文本。输出接口传输针对每个目标讲话者的文本。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification