一种端到端的神经网络语音识别模型的训练方法

Invention Publication

CN111916064A 一种端到端的神经网络语音识别模型的训练方法无效 - 驳回

Please log in to see more content

Patent Title: 一种端到端的神经网络语音识别模型的训练方法
Application No.: CN202010794361.3

Application Date: 2020-08-10
Publication No.: CN111916064A

Publication Date: 2020-11-10
Inventor: 陈虞君 , 杨植麟 , 张宇韬 , 杜羽伦 , 陈欣梅 , 陈贤鑫
Applicant: 北京睿科伦智能科技有限公司
Applicant Address: 北京市海淀区知春路27号量子芯座6层
Assignee: 北京睿科伦智能科技有限公司
Current Assignee: 北京睿科伦智能科技有限公司
Current Assignee Address: 北京市海淀区知春路27号量子芯座6层
Agency: 西安东灵通专利代理事务所
Agent 韩战涛
Main IPC: G10L15/06
IPC: G10L15/06 ; G10L15/02 ; G10L15/16 ; G10L15/26

Abstract:

本发明涉及计算机信息处理技术领域，具体涉及一种端到端的神经网络语音识别模型的训练方法，包括如下步骤：步骤1、收集语音信息，并保存成音频文件；步骤2、对音频文件进行初筛，使音量大小一致；步骤3、通过人工对音频文件的内容进行标注，并生成数据文件；步骤4、对标注完毕的数据进行预处理，进行特征分布；步骤5、构建音频预处理模块，对所述音频文件进行变速、增加噪音、频域信号的扰动增强；步骤6、使用端到端的深度学习模型构建语音识别模型；步骤7、优化语音识别模型；步骤8、输入的音频信号得到解码出的文本信息。本发明提出的一个端到端的语音识别模型，目的在于显著提升识别效果。

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/06	.创建基准模板；训练语音识别系统，例如对说话者声音特征的适应（G10L15/14优先）