一种基于口音识别的鲁棒语音识别方法

    公开(公告)号:CN108877784B

    公开(公告)日:2022-12-06

    申请号:CN201811030962.6

    申请日:2018-09-05

    Applicant: 河海大学

    Inventor: 吕勇

    Abstract: 本发明公开一种基于口音识别的鲁棒语音识别方法,用多类口音的声学模型预测目标说话人的口音特性。在训练阶段,将发音特性相近的口音合并为一类,为每类口音训练生成一个高斯混合模型和一组隐马尔可夫模型;在测试阶段,首先从目标说话人的测试语音中提取共振峰;然后根据共振峰特征,对说话人的口音进行识别,并根据识别结果选取该类口音对应的声学模型,对声学模型的参数进行调整,使之与目标说话人的发音特性相匹配;最后,用自适应后的声学模型对测试语音特征向量进行识别,得到识别结果。本发明可以减小口音对语音识别系统的影响,提高口音改变条件下模型自适应的准确性。

    一种基于通道泰勒级数的噪声估计方法

    公开(公告)号:CN108053835B

    公开(公告)日:2021-07-09

    申请号:CN201711112773.9

    申请日:2017-11-13

    Applicant: 河海大学

    Inventor: 吕勇

    Abstract: 本发明公开一种基于通道泰勒级数(CTS:Channel Taylor Series)的噪声估计方法,首先从纯净训练语音中提取美尔频率对数谱系数(MFLC:Mel Frequency Logarithm Coefficients);然后用所有语音单元的纯净MFLC训练生成一个高斯混合模型;最后,在每个Mel通道上用CTS逼近含噪测试语音与纯净训练语音之间的非线性关系,对纯净高斯混合模型的参数进行变换,得到含噪测试语音的噪声参数。本发明将传统噪声估计的矩阵运算简化为标量运算,可以在保证参数估计精度的前提下,显著减小系统的运算复杂度。

    一种基于价值函数的雾计算网络内容缓存替换方法

    公开(公告)号:CN111124298B

    公开(公告)日:2021-05-11

    申请号:CN201911297784.8

    申请日:2019-12-17

    Applicant: 河海大学

    Abstract: 本发明公开了一种基于价值函数的雾计算网络内容缓存替换方法,该方法中,在用户终端发出内容请求时,依次访问雾节点获取内容,并实时更新访问次数等信息;若遍历雾节点后仍无法获取内容,则根据其价值函数决定是否从云端将内容缓存到雾节点,该函数结合了内容流行度、内容大小和可用缓存存储空间等因素;并且本发明提出新的内容缓存替换方法,若需缓存内容大小大于雾节点剩余容量,则执行该内容缓存替换方法,选择最合适的雾节点删除一部分内容并对新的内容进行存储。本发明可应用于雾计算网络的设计和部署,提出的基于价值函数的内容缓存替换方法提高了用户请求被响应的概率,而且雾节点存储空间利用率较高,缓存性能优势明显。

    一种基于低频音节识别的语音增强方法

    公开(公告)号:CN112233657A

    公开(公告)日:2021-01-15

    申请号:CN202011095086.2

    申请日:2020-10-14

    Applicant: 河海大学

    Inventor: 吕勇

    Abstract: 本发明公开一种基于低频音节识别的语音增强方法,首先将语音的幅度谱划分为若干个子带,统计每个音节在每个子带上语音存在的概率;然后,对含噪测试语音提取低频特征向量,用低频声学模型将其识别为某个音节,得到当前语音每个子带上语音存在的概率;最后,根据子带语音存在概率,用加权谱减法对含噪语音的幅度谱进行增强。本发明可以根据低频语音识别的结果确定待识别语音每个子带上的语音存在概率,并将其用于加权谱减,提高增强后语音的信噪比和可懂度。

    一种车联网中任务卸载计算成本与时延的联合优化方法

    公开(公告)号:CN110650457A

    公开(公告)日:2020-01-03

    申请号:CN201910972145.0

    申请日:2019-10-14

    Applicant: 河海大学

    Abstract: 本发明公开了一种车联网中任务卸载计算成本与时延的联合优化方法,方法包括:首先初始化系统参数,包括路边单元相关参数、车辆相关参数、任务相关参数和算法初始参数;然后生成一个满足约束条件的矩阵,矩阵中每个元素代表对应车辆接收任务的比例,以消耗函数值最小为目标,基于所提出的算法寻找任务卸载的最优解;最后按照最优解对应的分配策略进行任务卸载。本发明能快速有效地进行任务卸载计算的优化,有效减小时延并降低卸载计算的成本。

    一种基于多重自适应的模型补偿语音识别方法

    公开(公告)号:CN105355198B

    公开(公告)日:2019-03-12

    申请号:CN201510685551.0

    申请日:2015-10-20

    Applicant: 河海大学

    Inventor: 吕勇

    Abstract: 本发明公开一种基于多重自适应的模型补偿语音识别方法,首先对训练环境下预先训练的纯净语音声学模型的参数进行变换,得到与实际测试环境较为匹配的含噪语音声学模型;然后将首次自适应得到的含噪语音声学模型作为新的基环境声学模型,构建其对应的含噪语音与实际环境含噪测试语音之间的变换关系,对基环境声学模型再次进行模型自适应,包括正向自适应和负向自适应;最后比较正向自适应和负向自适应的输出似然值,取似然值较大的含噪语音声学模型作为该次模型自适应的结果。本发明可以进一步提高模型自适应的精度,得到与实际测试环境更加匹配的含噪语音声学模型。

    一种密集场景下5G通信系统终端接入数量的优化方法

    公开(公告)号:CN109041016A

    公开(公告)日:2018-12-18

    申请号:CN201810823119.7

    申请日:2018-07-25

    Applicant: 河海大学

    Abstract: 本发明公开了一种密集场景下5G通信系统终端接入数量的优化方法,系统中的终端包括蜂窝网络终端(CUE)和D2D移动终端(DUE),方法包括:(1)初始化基本参数,包括小区的通信半径、路径损耗因子等;(2)根据网络中CUE以及D2D用户对的数目,初始化代表资源分配方案的着色矩阵;(3)将新的DUE接入网络,更新计算新接入用户后DUE的信号干扰噪声比,确定所选择的颜色顺序;(4)判断新的DUE是否满足接入网络的要求,若不满足则选取下一个D2D对,转入步骤(3);(5)对新接入的DUE着色分组;(6)待所有DUE分组完成后,结束方法。本发明能实现5G通信系统的资源优化分配,计算出系统最大可接入D2D终端数量,有效提升系统内D2D用户接入数量。

    一种基于改进蝙蝠算法的5G通信系统容量优化方法

    公开(公告)号:CN108990160A

    公开(公告)日:2018-12-11

    申请号:CN201810823142.6

    申请日:2018-07-25

    Applicant: 河海大学

    Abstract: 本发明公开了一种基于改进蝙蝠算法的5G通信系统容量优化方法,5G通信系统中包括蜂窝网络终端(CUE)和D2D移动终端(DUE),方法包括:(1)初始化基本参数,包括小区半径、迭代次数等;(2)随机初始化并反向初始化蝙蝠种群,每个蝙蝠个体代表一种信道资源分配方案;(3)求解蝙蝠种群的适度值;(4)根据适度值选择优秀蝙蝠个体作为初始解;(5)对蝙蝠种群进行交叉变异操作,使之生成新种群;(6)种群混合择出最优解;(7)判断迭代是否结束,若未结束,则返回步骤(4),若迭代完毕,结束方法,得到系统容量最大的资源分配方案。本发明能够择出最佳D2D用户组合,实现通信网络资源的合理复用,从而提升系统容量。

    一种基于通道泰勒级数的噪声估计方法

    公开(公告)号:CN108053835A

    公开(公告)日:2018-05-18

    申请号:CN201711112773.9

    申请日:2017-11-13

    Applicant: 河海大学

    Inventor: 吕勇

    Abstract: 本发明公开一种基于通道泰勒级数(CTS:Channel Taylor Series)的噪声估计方法,首先从纯净训练语音中提取美尔频率对数谱系数(MFLC:Mel Frequency Logarithm Coefficients);然后用所有语音单元的纯净MFLC训练生成一个高斯混合模型;最后,在每个Mel通道上用CTS逼近含噪测试语音与纯净训练语音之间的非线性关系,对纯净高斯混合模型的参数进行变换,得到含噪测试语音的噪声参数。本发明将传统噪声估计的矩阵运算简化为标量运算,可以在保证参数估计精度的前提下,显著减小系统的运算复杂度。

    一种基于高斯分类的快速模型自适应方法

    公开(公告)号:CN107945795A

    公开(公告)日:2018-04-20

    申请号:CN201711112767.3

    申请日:2017-11-13

    Applicant: 河海大学

    Inventor: 吕勇

    CPC classification number: G10L15/22 G10L15/06 G10L25/03 G10L25/27

    Abstract: 本发明公开一种基于高斯分类的快速模型自适应方法,其特征是将语音识别系统全部声学模型的所有高斯单元划分为若干类,并提取每类高斯单元的均值向量和协方差矩阵作为类的均值向量和协方差矩阵,在环境噪声改变的初期对类的均值和方差进行模型自适应,作为该类内全部高斯单元的均值和方差的近似值,以实现声学模型的快速噪声自适应。本发明可以加快噪声环境下模型参数变换的速度,增强模型自适应算法的实际应用能力。

Patent Agency Ranking