英语口语考试系统中的朗读题自动评分方法和设备

    公开(公告)号:CN103065626B

    公开(公告)日:2015-03-11

    申请号:CN201210557363.6

    申请日:2012-12-20

    Abstract: 本发明提供一种英语口语朗读自动评分的方法和设备。该方法包括:对输入语音进行预处理,该预处理中包括分帧处理;从预处理的语音中提取语音特征;利用朗读文本搭建的线性语法网络和声学模型,对语音特征向量序列进行强制对齐,得到各音素分割点信息;按照各音素分割点信息,计算每个音素的后验概率;基于音素的后验概率,提取多维评分特征;根据评分特征和人工评分信息,使用支持向量回归法训练非线性回归模型,以便利用该非线性回归模型对英语口语朗读进行评分。使用专家打分数据训练评分模型,从统计上保证了机器评分的结果不会偏离人工评分,从而达到计算机对专家评分的高度模拟。

    一种用于维吾尔语语音识别的识别单元的选择方法及系统

    公开(公告)号:CN103065632B

    公开(公告)日:2014-10-08

    申请号:CN201210560599.5

    申请日:2012-12-21

    Abstract: 本发明实施例涉及一种用于维吾尔语语音识别的词典单元的选择方法及系统。方法包括:为待识别的语音收集/准备相应的文本语料;从文本语料中抽取不同的词语;将所述不同词语输入形态分析器,分析成功时获得相应的词语的分解结果,分析失败时对所述词语进行基于削尾算法的词语分解,从而获得分解结果,以及根据所述分解结果,得到每个词语对应的词干以及附加成分;将所述文本语料中的词语映射为所述词干和附加成分,抽取高频词干和附加成分作为词典单元。本发明实施例根据维吾尔语形态变化的规则,将维吾尔语词语分解为词干和附加成分,然后选择词干和附件成分作为识别单元,从而缓解了识别系统集外词过多的问题,提高了系统的识别率。

    一种基于歌词的歌曲检索系统及其检索方法

    公开(公告)号:CN103885949A

    公开(公告)日:2014-06-25

    申请号:CN201210555192.3

    申请日:2012-12-19

    CPC classification number: G06F17/30746

    Abstract: 本发明涉及一种基于歌词的歌曲检索系统,包括:语音识别引擎,用于将用户输入的原始语音数据转化为文本识别结果;检索关键词选取模块,用于将文本识别结果中的部分词选出作为检索关键词;歌词定位模块,用于根据关键词在歌词库中定位候选歌曲的位置,得到候选定位点;以及候选歌曲精确匹配模块,用于在所述候选定位点中选出最佳的N个歌曲并将其返回给用户。本发明还提供了一种相应的基于歌词的歌曲检索方法。本发明能够通过用户说出的一两句歌词来检索到他想要的歌曲,拓展了用户检索歌曲的模式,满足用户多样性检索的需求。本发明的歌词输入方式便捷,在一些打字不方便的设备使用优势更加明显。并且,本发明识别正确率高,识别速度快。

    一种基于双麦克风的目标方向语音活动检测方法及系统

    公开(公告)号:CN103248992A

    公开(公告)日:2013-08-14

    申请号:CN201210027677.5

    申请日:2012-02-08

    Abstract: 本发明涉及一种基于双麦克风的目标方向语音活动检测方法及系统,包含:步骤101)获取两通道每个时频点上的相位差信息;步骤102)输入感兴趣的目标方向区域,计算目标方向区域所对应的相位差范围;步骤103)依据确定的各时频点的相位差信息及目标方向相位差范围,确定步骤101)的各时频点上的信号是否来自于目标方向范围内;步骤104)将第k帧开始的L帧语音信号作一个分析窗,每帧信号有Q个频率点,如果分析窗内的每个频率点分量有不少于μ帧信号在该频率分量上判断属于目标方向,则判断该频率分量上存在目标语音,否则判频率分量上不存在目标语音,如果存在目标语音的频率分量的个数超过阈值ξ,则将该分析窗内的连续L帧信号最终判断为存在目标语音。

    用于英语口语考试自动评分的参考语法生成方法和设备

    公开(公告)号:CN103186658A

    公开(公告)日:2013-07-03

    申请号:CN201210568270.3

    申请日:2012-12-24

    Abstract: 本发明提供一种用于英语口语考试自动评分的参考语法生成方法和设备。该方法包括:人工编写少量基于ABNF规则的参考语法;利用单词发音词表,将基于ABNF规则的参考语法转译成音素词图;对音素词图做以元音音素为断点的音素链切分操作,构成基础音素链集中的音素链;计算基础音素链集中的音素链与考生语音数据音素链集中的音素链的编辑距离;以编辑距离为特征,对考生语音数据音素链集进行聚类,计算同类音素链的出现频率占总数的比例;剔除中占比小的音素链,将保留下来的音素链用音素链连接算法连接成完整的语法句式,最后以树结构的音素词图保存为参考答案。本发明的方法在构造参考语法的过程中只需少量的人工干预,大大减少了口语自动评分中的人工工作量,并减少了不相关人工干预对系统的不良影响。

    一种三维声场合成中的距离感合成方法

    公开(公告)号:CN102790931A

    公开(公告)日:2012-11-21

    申请号:CN201110131950.4

    申请日:2011-05-20

    Abstract: 本发明涉及一种三维声场合成中的距离感合成方法,该方法首先设定待合成的房间的混响时间和房间的长宽高;亦或利用声压级测量待重放的房间的混响时间,以及房间长宽高;其次,进行扬声器频率响应测量,并根据公式获得反射系数βi;最后,根据设定的各个扬声器和声源在房间中的位置坐标,得到相应的每个扬声器的激励函数:式中,P(x,ω)为有界区域V中合成的声压;Ssw(ω)为源信号频域表达式;至此,建立了房间声学与传统的WFS技术之间的联系,最终利用该激励函数使得三维合成声场具有方向感而且具有距离感。

    发音质量评估系统中的置信度快速求取方法

    公开(公告)号:CN101645271B

    公开(公告)日:2011-12-07

    申请号:CN200810240811.3

    申请日:2008-12-23

    Abstract: 本发明提供一种发音质量评估系统中的置信度快速求取方法,包括:预处理分帧;提取每帧语音的语音特征;根据全音节循环网络状态图、精细声学模型和语音特征向量进行解码,得到最优路径上的各音素分割点信息;根据精细声学模型和对应帧的PLP特征向量,对目标音素和语音帧做强制对齐处理,获得每一帧语音对应的状态号,并计算各帧语音对应其相应状态的似然概率值;引入粗略的背景模型,计算每帧语音在该模型包含的所有状态下的似然概率和;计算每一帧待评估语音的广义后验概率;计算每个音素的广义后验概率并将其作为置信度得分。本发明的方法,采用粗糙的背景模型作为后验概率分母部分计算的依据,从而极大降低广义后验概率即置信度得分的计算量。

    一种快速可在线应用的声道长度归整方法

    公开(公告)号:CN101447182B

    公开(公告)日:2011-11-09

    申请号:CN200810097981.0

    申请日:2008-05-21

    Abstract: 本发明涉及一种快速可在线应用的声道长度归整方法,包括如下步骤:1)在训练阶段训练一个与声道长度无关的归整后的声学模型;2)根据不同的归整因子对训练数据分类,训练多类GMM;3)测试时分段在多类GMM打分,快速计算声道长度归整因子;4)根据识别系统的实时性需求选择不同的段数,更新声道长度归整因子;5)用声道长度归整后的声学模型对归整后的声学特征解码。本发明的方法可以根据识别系统对实时性的要求,对测试语音可以选择分段的长度,从而让声道长度归整技术应用于在线的系统中。分段是为了消除判断不准确的静音的影响,又不至于把连续语音按帧拆的太分散而影响声学动态特征差分的值,同时还可以根据段的情况加不同的权重。

    一种自同步的音频水印方法

    公开(公告)号:CN1848829B

    公开(公告)日:2010-06-16

    申请号:CN200510064334.6

    申请日:2005-04-14

    Inventor: 雷赟 刘建 颜永红

    Abstract: 本发明涉及一种适应于短波窄带信道的自同步音频水印方法,水印嵌入时,将同步信息和进行了RS编码的水印信息转化为双向码基带信号,然后采用扩频序列嵌入的方法在时间上依次将同步信息和水印信息嵌入音频信号频谱中;水印提取时,使用通信中滑动相关的方法提取同步信息,完成帧同步和数据同步,然后对接收信号的频谱进行相关检测,提取水印信息。本发明利用同步信号定位音频帧的位置和数据起始,应用双向调制技术,RS纠错码技术,冗余嵌入,数据重组,和可信度度量等技术增强水印信号的鲁棒性。另外,本发明把同步信号完全嵌入到频域中,使得同步信号和水印信息一样具有很强的鲁棒性,在强噪声的情况下依然能够完成同步。

    电话语音识别中的自适应方法

    公开(公告)号:CN101123648B

    公开(公告)日:2010-05-12

    申请号:CN200610089253.6

    申请日:2006-08-11

    Abstract: 本发明涉及一种电话语音识别中的自适应方法,包括,预处理过程和自适应更新过程;所述预处理过程是根据采集的多个说话人样本数据的性别、口音、年龄特征形成一个决策树,该决策树的每个叶节点中记录一个语音类的高斯混合模型、隐马尔科夫声学模型以及用于目标语音特征参数与声学模型相互匹配的变换矩阵;所述自适应更新过程包括:1)对输入的目标语音进行分类,将目标语音归入一个叶节点或建立一个新的叶节点;2)更新目标语音所在叶节点上的变换矩阵;3)根据变换矩阵更新目标语音的特征参数或/和更新该目标语音所在叶节点上的隐马尔科夫声学模型。本发明的优点是:大大节省了存储空间,加快了计算速度,特别适用于电话语音识别系统。

Patent Agency Ranking