-
公开(公告)号:CN116072105A
公开(公告)日:2023-05-05
申请号:CN202211584850.1
申请日:2022-12-09
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种时序采样方法及装置、语音识别方法及装置,涉及人工智能技术领域。该时序采样方法包括:获取目标语音数据;基于目标语音数据,利用采样模型,确定目标语音数据的时序采样结果,其中,采样模型包括l层下采样网络和l层上采样网络,每层下采样网络包括并联的skip模块和下采样模块,每层上采样网络包括并联的skip模块和上采样模块,采样模型用于基于每层下采样网络的skip模块和下采样模块以及每层上采样网络的skip模块和上采样模块,为目标语音数据匹配采样模型中的最优采样路径,l为大于1的正整数。通过本申请中的时序采样方法,能够提升对语音数据的声学特征的学习能力、以及建模粒度的适配度。