-
公开(公告)号:CN102034476B
公开(公告)日:2013-09-11
申请号:CN200910174587.7
申请日:2009-09-30
Abstract: 本发明实施例提供一种语音帧错误检测及修复的方法及装置,涉及通信领域,能够利用语音信号的特点及编码参数的先验统计特性进行错误帧的检测和修复。检测方法为:在静音模式下,收到一个参数指示为正确的语音帧,则根据预先设置的检测规则对所述语音帧参数进行检测,当满足所述检测规则规定的条件时,确定所述语音帧是错误语音帧。以及,在语音模式下,收到一个参数指示为错误的语音帧,则根据所述语音帧的参数平均值对所述语音帧的静音插入描述SID进行检测,当满足检测条件时,确定所述语音帧是SID帧。本发明实施例可用于GSM全速率语音编解码。
-
公开(公告)号:CN101833951B
公开(公告)日:2011-11-09
申请号:CN201010118149.1
申请日:2010-03-04
Applicant: 清华大学
Abstract: 用于说话人识别的多背景模型建立方法涉及一种说话人识别中背景模型建模方法,其特征在于所述方法首先根据语音的声道长度弯折系数对训练数据进行划分,每组数据分别训练UBM模型,然后由每个背景模型自适应得到目标说话人GMM模型,得到多组GMM和UBM模型,说话人识别时对测试数据,由每组GMM和UBM模型计算对数似然比分数,最后从中选取最小的一个作为分数输出。本发明可对背景模型进行细致刻画,从而提高说话人识别的准确率。
-
公开(公告)号:CN101996635A
公开(公告)日:2011-03-30
申请号:CN201010266766.6
申请日:2010-08-30
Applicant: 清华大学
Abstract: 基于重音突显度的英语发音质量评价方法,属于语音信号技术领域,其特征包括:计算音节归一化段长,计算音节最高归一化响度,计算音节最高归一化半音程;利用突显度模型,计算音节段长突显度、音节响度突显度和音节半音程突显度;利用Bayes分类器计算音节归一化重音突显度;计算重音突显度分数,并对分数进行映射。本发明的发音质量评价方法稳健性好,能与匹配分数结合使用,以进一步提高其与专家评分的相关性,可以用于交互式的语言学习系统和自动口语评测系统中。
-
公开(公告)号:CN101256768B
公开(公告)日:2011-03-30
申请号:CN200810103328.0
申请日:2008-04-03
Applicant: 清华大学
IPC: G10L15/02
Abstract: 用于语种识别的时频二维倒谱特征提取方法涉及一种用于语种识别的时频二维倒谱特征提取方法,其特征在于所述方法首先分帧计算语音信号子带能量,多帧子带能量拼接后得到时频分布矩阵,然后进行二维DCT变换,去除矩阵时间方向和频率方向的相关性,再对变换后的系数进行重排列并降低维数,可得到最后特征。该特征既利用了语音的短时平稳性,又提取了用于语种识别的长时信息。可以用于语种识别。
-
公开(公告)号:CN101894548A
公开(公告)日:2010-11-24
申请号:CN201010207237.9
申请日:2010-06-23
Applicant: 清华大学
Abstract: 本发明的实施例提出了一种用于语种识别的建模方法,包括输入语音数据,对语音数据预处理得到特征序列,将特征矢量映射为超矢量,对超矢量进行投影补偿,通过支持向量机算法建立训练语种模型;对待测语音采用上述步骤得到待测超矢量,对待测超矢量进行投影补偿,利用语种模型对所述待测超矢量打分,识别待测语音的语言种类。本发明实施例还提出了一种用于语种识别的建模装置包括语音预处理模块、特征提取模块、多坐标系原点选择模块、特征矢量映射模块、子空间提取模块、子空间投影补偿模块、训练模块和识别模块。根据本发明实施例提供的方法及装置,去除高维统计量中对识别无效的信息,提高语种识别的正确率,降低在集成电路上的运算复杂度。
-
公开(公告)号:CN101702314A
公开(公告)日:2010-05-05
申请号:CN200910235393.3
申请日:2009-10-13
Applicant: 清华大学
Abstract: 基于语种对的鉴别式语种识别模型建立方法涉及一种用于语种识别的建模方法,其特征在于所述方法首先对语音数据提取特征得到特征矢量,接着采用Baum-Welch算法进行ML训练得到初始GMM模型参数,然后利用GMM模型对特征矢量计算分子项和分母统计量,并对分子统计量进行平滑,由平滑后的分子统计量和分母统计量计算更新系数,最后按更新公式对GMM模型参数进行更新。该建模方法从语种对的局部入手,更能抓住语种间的鉴别性信息,从而获得更好的识别性能。可以用于语种识别模型的鉴别式建模。
-
-
公开(公告)号:CN1123862C
公开(公告)日:2003-10-08
申请号:CN00105547.X
申请日:2000-03-31
Applicant: 清华大学
Abstract: 本发明属于语音技术领域,涉及基于语音识别专用芯片的特定人语音识别、语音回放方法,包括:语音识别参数提取、特定人语音命令的训练、特定人语音命令的识别、语音回放。本识别方法具有方法简单、识别率高、稳健性好等特点。构成的系统可以用于玩具控制、声控拨号、智能性家用电器、学习机、以及生产环节的控制系统中。
-
-
公开(公告)号:CN2424513Y
公开(公告)日:2001-03-21
申请号:CN00233477.1
申请日:2000-05-22
Applicant: 清华大学 , 北京安可尔通讯技术有限公司
Abstract: 本实用新型发明属于语音技术领域,它包括数字信号处理器、语音采样编解码器、微控制器、闪烁存储器、电源管理器、麦克风、喇叭。其中,数字信号处理器固化有语音处理和管理程序。具有特定人语音识别、语音提示、语音回放、0—8小时高质量数字语音录音、计算器,以及定时叫醒等功能。它可以通过数码键或语音来存储各种商务信息,还可以进行长时的会议、谈话或课堂教学录音。通过语音识别就可以方便的查询存储的各种信息。
-
-
-
-
-
-
-
-
-