英语口语机考系统中网络语音识别方法

    公开(公告)号:CN102436809A

    公开(公告)日:2012-05-02

    申请号:CN201110321538.9

    申请日:2011-10-21

    Applicant: 东南大学

    Abstract: 本发明涉及了一种在英语口语机考系统中实现网络语音识别的方案。本方案对传统的谱相减(SS)降噪声技术和倒谱均值规整(CMN)降噪声技术进行改进,同时结合等同于连续状态隐马尔可夫模型(HMM)的概率尺度DP识别方法,提出了一种在英语网考系统中非特定人的网络语音识别方案,并利用其实现了实际环境下网络语音识别装置。本方案采用上述方法,将具有输入幅值谱自适应的SS方法和基于渐进自适应方式MAP算法的CMN方法相结合,大大降低了环境噪声对识别系统的影响。同时,本方案在传统的DP方法基础上,利用概率尺度的DP算法进行识别,使得DSP语音识别装置能够适用于户外不同场合的、非特定人的语音识别,从而使得识别系统范围和识别精度得到了提高。

    一种应用于英语口语网络机考系统的语音识别装置

    公开(公告)号:CN102436815B

    公开(公告)日:2012-12-19

    申请号:CN201110268976.3

    申请日:2011-09-13

    Applicant: 东南大学

    Abstract: 本发明公开了一种用于英语口语网络机考的语音识别装置,属于语音识别的应用领域。该装置由输入I/O、模数转换器、数字信号处理器模块、分别通过程序总线与数据总线与数字信号处理器模块相连的程序存储器和数据存储器、输出I/O组成。其中数字信号处理器模块包括特征提取子模块、训练子模块和识别子模块,完成对输入语音的训练和识别过程。该装置结构简单,具有一定的实时性,并且具有较短的训练时间、较高的识别精度和较小的硬件存储开销,语音识别率高,识别效果好,可以很好地应用于英语口语网络机考中。

    基于自适应算法的非对称语料库条件下的语音转换方法

    公开(公告)号:CN103280224A

    公开(公告)日:2013-09-04

    申请号:CN201310146293.X

    申请日:2013-04-24

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于自适应算法的非对称语料库条件下的语音转换方法,首先运用MAP算法利用少量训练语句从参考说话人模型中分别训练得到源说话人和目标说话人的模型。然后,利用自适应说话人模型中的参数,分别提出了高斯归一化和均值转换的方法。并且为了进一步提高转换效果,进而提出了将高斯归一化方法和均值转换融合的方法。同时,由于训练语句有限,必然影响自适应模型的准确性,本发明提出了KL散度的方法在转换时对说话人模型进行优化,主客观实验结果表明:无论是频谱失真度,还是转换语音的质量以及与目标语音的相似度。本发明提出的方法都获得了和基于对称语料库条件下的经典GMM方法可比拟的效果。

    一种应用于英语口语网络机考系统的语音识别装置

    公开(公告)号:CN102436815A

    公开(公告)日:2012-05-02

    申请号:CN201110268976.3

    申请日:2011-09-13

    Applicant: 东南大学

    Abstract: 本发明公开了一种用于英语口语网络机考的语音识别装置,属于语音识别的应用领域。该装置由输入I/O、模数转换器、数字信号处理器模块、分别通过程序总线与数据总线与数字信号处理器模块相连的程序存储器和数据存储器、输出I/O组成。其中数字信号处理器模块包括特征提取子模块、训练子模块和识别子模块,完成对输入语音的训练和识别过程。该装置结构简单,具有一定的实时性,并且具有较短的训练时间、较高的识别精度和较小的硬件存储开销,语音识别率高,识别效果好,可以很好地应用于英语口语网络机考中。

    基于自适应算法的非对称语料库条件下的语音转换方法

    公开(公告)号:CN103280224B

    公开(公告)日:2015-09-16

    申请号:CN201310146293.X

    申请日:2013-04-24

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于自适应算法的非对称语料库条件下的语音转换方法,首先运用MAP算法利用少量训练语句从参考说话人模型中分别训练得到源说话人和目标说话人的模型。然后,利用自适应说话人模型中的参数,分别提出了高斯归一化和均值转换的方法。并且为了进一步提高转换效果,进而提出了将高斯归一化方法和均值转换融合的方法。同时,由于训练语句有限,必然影响自适应模型的准确性,本发明提出了KL散度的方法在转换时对说话人模型进行优化,主客观实验结果表明:无论是频谱失真度,还是转换语音的质量以及与目标语音的相似度。本发明提出的方法都获得了和基于对称语料库条件下的经典GMM方法可比拟的效果。

    一种研究生英语口语教学语音自动评估平台的实现方法

    公开(公告)号:CN109271482A

    公开(公告)日:2019-01-25

    申请号:CN201811030689.7

    申请日:2018-09-05

    Applicant: 东南大学

    Abstract: 本发明公开了一种研究生英语口语教学语音自动评估平台的实现方法,该平台适用于研究生ESP口语教学,在线国际会议英语口语教学系统平台中进行关键词的网络语音识别和口语表达自动评估。所述方法包括以下步骤:(1)建立ESP专门语料库;(2)建立用户语音识别特征信息库;(3)构建国际会议口语教学语音自动评估和实现的算法模型;(4)特征信息分析处理和实现“关键词”检索与识别的挖掘与途径。本发明改变教学模式,结合人工智能进行评估,以适应兼容国际化的需求,且涵盖了英语的语法、句法和语境三个方面的评估要素,具有实际意义和提高英语口语的教学和评估能力。

    一种基于核半监督判别分析的语音情感识别方法

    公开(公告)号:CN103544963B

    公开(公告)日:2016-09-07

    申请号:CN201310549224.3

    申请日:2013-11-07

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于核半监督判别分析的语音情感识别方法,对经预处理的语音样本中语音情感特征提取后,进行特征筛选、KSDA维数约简和分类。在训练阶段,对全监督训练样本集使用KSDA进行维数约简,将表示训练样本不同关系信息的嵌入图结合起来,并使用核化数据映射,实现对语音情感特征维数约简的优化,再用低维样本训练多类SVM分类器;在测试阶段,依次使用训练阶段特征筛选得到的特征及维数约简得到的数据映射方式,对各测试样本获取其低维特征,再使用训练得到的分类器进行分类判决,得到测试样本的类别。与现有方法相比,本发明的方法在语音情感特征维数约简中增加了降维的有效性,使语音情感识别系统的识别率性能得到了提升。

    一种确认通知消息成功理解并回复信息的发送方法及等待回复方法

    公开(公告)号:CN105791092A

    公开(公告)日:2016-07-20

    申请号:CN201610218797.1

    申请日:2016-04-08

    Applicant: 东南大学

    CPC classification number: H04L51/24

    Abstract: 本发明公开了一种确认通知消息成功理解并回复信息的发送方法及等待回复方法,编辑包含题目的通知消息并发送,通知消息发送后接收人开始独立计时t分钟,判断t分钟内是否回复,若在t分钟之内没有回复则记录本次发送次数n=n+1,将n作为提醒发送次数增添到通知消息中并再次发送通知消息,若在t分钟之内回复则先判断回复是否有效,若回复有效则向接收人发送回复正确的消息,流程结束,若回复无效则记录发送次数n=n+1和无效内容,将n和无效内容作为提醒增添到通知消息并再次发送。本发明的一种确认通知消息成功理解并回复信息的发送方法及等待回复方法,通过强制接收人阅读并有效回复通知消息,避免接收人推脱未收到通知短信或忘记看短信等理由。

    一种网络文本的行内标注式评论的新建方法及其浏览方法

    公开(公告)号:CN104820704A

    公开(公告)日:2015-08-05

    申请号:CN201510240551.X

    申请日:2015-05-12

    Applicant: 东南大学

    CPC classification number: G06F17/30876 G06F17/30899

    Abstract: 本发明公开了一种网络文本的行内标注式评论的新建方法及其浏览方法,对选中文本进行跟帖,使跟帖者在文本正文中对某一字符串进行标注式的跟帖,跟帖评论的内容显示在被评论点附近的位置,而不是文本正文的结尾。通过本发明方法,评论者可以在浏览器中对网页文本正文内进行标注式评论,评论内容与被评论内容的关联一目了然,网页内的互动范围扩大,用户体验增强。

Patent Agency Ranking