一种双层自回归解码的序列到序列语音合成方法及系统

    公开(公告)号:CN111883102B

    公开(公告)日:2022-12-30

    申请号:CN202010672991.3

    申请日:2020-07-14

    Abstract: 本发明提出一种双层自回归解码的序列到序列语音合成方法及系统,系统包括编码器和解码器,所述解码器包括:音素级表征模块、音素级预测模块、帧级预测模块;所述编码器将音素名、音调和韵律短语边界信息用向量表征,然后使用卷积神经网络和双向长短时记忆网络将这些信息编码融合得到句子中每个音素的上下文单元表征;所述音素级表征模块,通过帧一级的长短时记忆网络(LSTM)和池化处理获得每个音素单元的声学单元表征;所述音素级预测模块,采用音素级自回归结构来预测当前音素的声学单元表征并建立连续音素之间的依赖关系;所述帧级预测模块,通过解码器LSTM来预测帧级的声学特征。

    一种语境集合与回复集合的匹配方法及装置

    公开(公告)号:CN110134790B

    公开(公告)日:2022-09-30

    申请号:CN201910411042.7

    申请日:2019-05-17

    Abstract: 本申请提供了一种语境集合与回复集合的匹配方法及装置,在本申请中,分别对语境集合中的各个句子中的各个语境单词分别进行编码及对回复集合中各个句子中的各个回复单词分别进行编码,在此基础上,得到语境集合中各个句子的匹配向量序列及回复集合中各个句子的匹配向量序列,并基于利用句子上下文信息表达句子的原则,分别基于语境集合中各个句子的匹配向量序列,整合得到第一整合语句向量,及分别基于回复集合中各个句子的匹配向量序列,整合得到第二整合语句向量,保证得到的目标语句匹配向量中包含有语境集合中句子与回复集合中句子之间的关系信息,将其输入分类器,可以提高匹配度的准确性,进而可以提高从回复候选集中选择回复集合的准确性。

    一种数据处理方法及网络管理装置

    公开(公告)号:CN114579273A

    公开(公告)日:2022-06-03

    申请号:CN202210202789.3

    申请日:2022-03-02

    Abstract: 本发明公开了一种数据处理方法及网络管理装置,可以将待输入至目标子网络进行数据处理的一路待处理数据,作为一个待处理任务保存至与目标子网络对应的队列;基于当前的第一队列、第二队列和第三队列各自保存的任务数量,从第一子网络、第二子网络和第三子网络中确定出优先级最高的子网络;在与优先级最高的子网络对应的队列中,将至少一路待处理数据输入至优先级最高的子网络中进行数据处理,并在优先级最高的子网络进行数据处理过程中,禁止其他子网络对相应队列中的待处理数据进行数据处理。本发明可以实现对多路并发的待处理数据的有效处理。

    一种融合单词语义知识的神经网络自然语言推理方法

    公开(公告)号:CN107578106B

    公开(公告)日:2020-03-24

    申请号:CN201710842371.8

    申请日:2017-09-18

    Abstract: 本发明公开了一种融合单词语义知识的神经网络自然语言推理方法,包括:从外部语义知识库中提取词对之间的多种语义关系;构建神经网络模型,利用神经网络模型对输入的前提文本、假设文本以及词对之间的多种语义关系进行局部推理建模,再组合局部推理信息,从而得到句子级别的推理信息,最后对神经网络模型进行训练;将未标注的前提文本和假设文本输入至已经训练好的神经网络模型,计算得到属于三个类别的概率分布,选取最大概率对应的类别作为最终预测的类别。该方法改善了传统神经网络方案对外部语义知识利用不足的问题,提高了自然语言推理的准确性。

    一种语境集合与回复集合的匹配方法及装置

    公开(公告)号:CN110134790A

    公开(公告)日:2019-08-16

    申请号:CN201910411042.7

    申请日:2019-05-17

    Abstract: 本申请提供了一种语境集合与回复集合的匹配方法及装置,在本申请中,分别对语境集合中的各个句子中的各个语境单词分别进行编码及对回复集合中各个句子中的各个回复单词分别进行编码,在此基础上,得到语境集合中各个句子的匹配向量序列及回复集合中各个句子的匹配向量序列,并基于利用句子上下文信息表达句子的原则,分别基于语境集合中各个句子的匹配向量序列,整合得到第一整合语句向量,及分别基于回复集合中各个句子的匹配向量序列,整合得到第二整合语句向量,保证得到的目标语句匹配向量中包含有语境集合中句子与回复集合中句子之间的关系信息,将其输入分类器,可以提高匹配度的准确性,进而可以提高从回复候选集中选择回复集合的准确性。

    一种少样本关系分类方法及系统

    公开(公告)号:CN110019822A

    公开(公告)日:2019-07-16

    申请号:CN201910305007.7

    申请日:2019-04-16

    Abstract: 本发明公开了一种少样本关系分类方法及系统,方法包括:对测试样例和支撑集进行上下文编码,得到K个支撑样例和1个测试样例的上下文编码信息;基于得到的支撑样例和测试样例的上下文编码信息,收集支撑样例和测试样例之间的相互匹配的局部信息,得到支撑样例的表征和测试样例的表征;对每个支撑样例的表征和测试样例的表征进行匹配,将匹配的得分作为权重,对所有同一类的样例表征做加权和,得到每个类别的表征;将每个类别的表征与测试样例的表征进行匹配,得到测试样例与每一类的匹配分数。本发明能够在多个层面对支撑数据和测试数据进行匹配,提高了少样本关系分类的准确率。

    一种合成语音自然度的提升方法

    公开(公告)号:CN104485099A

    公开(公告)日:2015-04-01

    申请号:CN201410828928.9

    申请日:2014-12-26

    Abstract: 本发明公开了一种合成语音自然度的提升方法,该方法包括:构建一个基于隐马尔科夫模型HMM的语音合成系统,并基于该语音合成系统及自然录音获得一合成语音;分别提取该合成语音及自然录音的基频特征,并进行高斯双向联想贮存器GBAM模型训练;利用训练好的GBAM模型,将合成语音的基频特征向自然录音的基频特征进行转换;结合频谱和转换后的基频特征,利用STRAIGHT合成最终的语音。通过采用本发明公开的方法,可以提高合成语音的自然度,使之更为真实、生动。

    一种基于受限玻尔兹曼机的语音合成方法

    公开(公告)号:CN103226946A

    公开(公告)日:2013-07-31

    申请号:CN201310099895.4

    申请日:2013-03-26

    Abstract: 本发明公开了一种基于受限玻尔兹曼机的语音合成方法。使用自适应加权谱内插STRAIGHT合成器提取的频谱包络取代高层频谱特征用于频谱建模;利用训练得到的Gaussian-HMM模型对训练数据库中的声学特征序列进行状态切分;利用切分得到的各状态起止时间,对提取的训练数据库中的原始频谱包络特征进行切分,收集得到上下文相关HMM模型中各状态对应的频谱包络数据;利用Gaussian-HMM模型进行基频特征的预测,并将预测得到的所述频谱包络特征与基频特征送入STRAIGHT合成器,生成最终的合成语音。该方法能够提高基于HMM的参数语音合成方法中的频谱特征建模精度,从而改善合成语音的音质与自然度。

    端到端实体模糊方法和系统、电子设备、计算机存储介质

    公开(公告)号:CN114722792B

    公开(公告)日:2024-11-01

    申请号:CN202210176436.0

    申请日:2022-02-24

    Abstract: 本发明提供一种端到端实体模糊方法和系统、电子设备、计算机存储介质,该方法包括:获取用户的请求信息;将请求信息分别与多个预设候选信息均进行实体模糊处理,得到多个相似度;取多个相似度中相似度最高的作为实体模糊后的最终相似度;不需要人工计算前缀匹配、后缀匹配、NGram、CLS等人工总结、计算的特征方式,采用模型自主学习特征方式,让模型能够自主学习到更多深层次的特征信息,也即,轻模型工程化的复杂度,并且让模型能够自主的学习更多潜在的、隐藏特征。

    一种语音通信系统及方法
    20.
    发明公开

    公开(公告)号:CN117544603A

    公开(公告)日:2024-02-09

    申请号:CN202311498981.2

    申请日:2023-11-08

    Abstract: 本申请公开了一种语音通信系统及方法,涉及语音通信技术领域。该系统包括:第一电子设备和第二电子设备;第一电子设备,用于获取语音信号的波形;通过短时傅里叶变换,从语音信号的波形中提取第一对数幅度谱和第一相位谱;根据第一对数幅度谱和第一相位谱,生成连续码;对连续码进行离散化处理,得到索引向量;将索引向量发送至第二电子设备;第二电子设备,用于根据索引向量,生成量化码;根据量化码,生成第二对数幅度谱和第二相位谱;通过逆短时傅里叶变换,将第二对数幅度谱和第二相位谱恢复为语音信号的波形。由此,即可在低编码比特率存储或传输语音信号的同时,保证解码出的语音信号性能较好,从而提高了语音通信的效率和还原度。

Patent Agency Ranking