-
公开(公告)号:CN101923857A
公开(公告)日:2010-12-22
申请号:CN200910053200.2
申请日:2009-06-17
Applicant: 复旦大学
Abstract: 本发明属音频处理技术领域,涉及一种基于人机交互的可扩展语音识别系统和方法。该系统包括音频采集设备、语音识别模块、加载样本单元、有限状态机、分类存储特征样本库和指令执行模块。其语音识别方法基于孤立词语音识别对特定人的高识别率,在对用户充分训练的前提下,通过该用户的辅助运用,使得系统能在一段人机交互过程后,将无法识别的语音段以在线学习的方式存储到样本库中;另外通过分模块存储和加载来降低识别的开销。本发明的核心算法基于语音信号,不限定说话人的语种,并支持混合语种(如汉语与英语等)的识别。具有较低的误识别率和较低的不识别率,利用对话交互、在线增量式训练改善了系统的可靠性和适应性。