-
公开(公告)号:CN111159360B
公开(公告)日:2022-12-02
申请号:CN201911422174.6
申请日:2019-12-31
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F40/289 , G06Q50/26
Abstract: 本申请公开了一种获得讯询问话题分类模型、讯询问话题分类的方法和装置,该方法包括:首先,对样本讯询问笔录中样本问答对进行自然语言预处理,获得各个样本问句分词和各个样本答句分词;然后,根据各个样本问句分词及其对应的各个贡献度得分、各个样本答句分词及其对应的各个贡献度得分和样本问答对的标记话题类别,训练基于注意力机制的卷积神经网络获得讯询问话题分类模型。由此可见,通过贡献度得分增加样本问答对的话题类别信息,加强讯询问话题分类的训练;且利用基于注意力机制的卷积神经网络,能够充分学习“强话题”分词与话题类别之间的关系,使得讯询问话题分类模型的话题分类效果更好,提高后续讯询问话题分类的正确率。
-
公开(公告)号:CN111540363A
公开(公告)日:2020-08-14
申请号:CN202010312979.1
申请日:2020-04-20
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请提供了一种关键词模型及解码网络构建方法、检测方法及相关设备,其中,关键词模型构建方法可以包括:从源域的声学模型中抽取待检测的关键词列表中各关键词分别对应的模型信息;根据关键词列表中各关键词分别对应的模型信息,生成源域的关键词模型;利用关键词列表中各关键词的语音样本,以源域关键词模型为基础模型,训练得到目标域的关键词模型。本申请提供的关键词模型构建方法使用数量较少的关键词语音样本即可构建出性能较佳的关键词模型。
-
公开(公告)号:CN111326168A
公开(公告)日:2020-06-23
申请号:CN202010220472.3
申请日:2020-03-25
Applicant: 合肥讯飞数码科技有限公司
IPC: G10L21/0272 , G10L25/03 , G10L25/30
Abstract: 本发明实施例提供一种语音分离方法、装置、电子设备和存储介质,其中方法包括:确定待分离的语音信号;将语音信号输入语音分离模型,得到语音分离模型输出的语音分离结果;语音分离模型是基于样本语音信号及其对应的样本语音分离结果训练得到的;其中,语音分离模型用于对语音信号的时域语音特征进行多级膨胀卷积,得到对应于不同发音源的掩码矩阵,并基于时域语音特征和掩码矩阵实现语音分离。本发明实施例提供的方法、装置、电子设备和存储介质,时域上进行语音分离,避免了多发音源重叠的频域信号相互抵消导致语音分离结果欠佳的问题;此外,多级膨胀卷积能够实现感受野的扩展,解决梯度消失或梯度爆炸的问题,提升语音分离的准确性。
-
公开(公告)号:CN111326168B
公开(公告)日:2023-08-22
申请号:CN202010220472.3
申请日:2020-03-25
Applicant: 合肥讯飞数码科技有限公司
IPC: G10L21/0272 , G10L25/03 , G10L25/30
Abstract: 本发明实施例提供一种语音分离方法、装置、电子设备和存储介质,其中方法包括:确定待分离的语音信号;将语音信号输入语音分离模型,得到语音分离模型输出的语音分离结果;语音分离模型是基于样本语音信号及其对应的样本语音分离结果训练得到的;其中,语音分离模型用于对语音信号的时域语音特征进行多级膨胀卷积,得到对应于不同发音源的掩码矩阵,并基于时域语音特征和掩码矩阵实现语音分离。本发明实施例提供的方法、装置、电子设备和存储介质,时域上进行语音分离,避免了多发音源重叠的频域信号相互抵消导致语音分离结果欠佳的问题;此外,多级膨胀卷积能够实现感受野的扩展,解决梯度消失或梯度爆炸的问题,提升语音分离的准确性。
-
-
公开(公告)号:CN111540367B
公开(公告)日:2023-03-31
申请号:CN202010307618.8
申请日:2020-04-17
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明实施例提供一种语音特征提取方法、装置、电子设备和存储介质,其中方法包括:确定语音数据;将所述语音数据输入至语音特征提取模型中,得到所述语音特征提取模型输出的语音特征;其中,所述语音特征提取模型是基于样本语音数据无监督训练得到的;所述语音提取模型用于将所述语音数据编码得到隐层特征,并将所述隐层特征进行非线性空间映射,得到所述语音特征。本发明实施例提供的方法、装置、电子设备和存储介质,对语音数据进行编码即可实现针对语音数据的隐层特征的深度挖掘和表达,对隐层特征进行非线性空间映射即可优化语音特征对于语音数据的拟合效果,且节省了大量计算,避免了由于人为降维带来的高维特征损失。
-
公开(公告)号:CN111540367A
公开(公告)日:2020-08-14
申请号:CN202010307618.8
申请日:2020-04-17
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明实施例提供一种语音特征提取方法、装置、电子设备和存储介质,其中方法包括:确定语音数据;将所述语音数据输入至语音特征提取模型中,得到所述语音特征提取模型输出的语音特征;其中,所述语音特征提取模型是基于样本语音数据无监督训练得到的;所述语音提取模型用于将所述语音数据编码得到隐层特征,并将所述隐层特征进行非线性空间映射,得到所述语音特征。本发明实施例提供的方法、装置、电子设备和存储介质,对语音数据进行编码即可实现针对语音数据的隐层特征的深度挖掘和表达,对隐层特征进行非线性空间映射即可优化语音特征对于语音数据的拟合效果,且节省了大量计算,避免了由于人为降维带来的高维特征损失。
-
公开(公告)号:CN111159360A
公开(公告)日:2020-05-15
申请号:CN201911422174.6
申请日:2019-12-31
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F40/289 , G06Q50/26
Abstract: 本申请公开了一种获得讯询问话题分类模型、讯询问话题分类的方法和装置,该方法包括:首先,对样本讯询问笔录中样本问答对进行自然语言预处理,获得各个样本问句分词和各个样本答句分词;然后,根据各个样本问句分词及其对应的各个贡献度得分、各个样本答句分词及其对应的各个贡献度得分和样本问答对的标记话题类别,训练基于注意力机制的卷积神经网络获得讯询问话题分类模型。由此可见,通过贡献度得分增加样本问答对的话题类别信息,加强讯询问话题分类的训练;且利用基于注意力机制的卷积神经网络,能够充分学习“强话题”分词与话题类别之间的关系,使得讯询问话题分类模型的话题分类效果更好,提高后续讯询问话题分类的正确率。
-
公开(公告)号:CN111540363B
公开(公告)日:2023-10-24
申请号:CN202010312979.1
申请日:2020-04-20
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请提供了一种关键词模型及解码网络构建方法、检测方法及相关设备,其中,关键词模型构建方法可以包括:从源域的声学模型中抽取待检测的关键词列表中各关键词分别对应的模型信息;根据关键词列表中各关键词分别对应的模型信息,生成源域的关键词模型;利用关键词列表中各关键词的语音样本,以源域关键词模型为基础模型,训练得到目标域的关键词模型。本申请提供的关键词模型构建方法使用数量较少的关键词语音样本即可构建出性能较佳的关键词模型。
-
公开(公告)号:CN111429887A
公开(公告)日:2020-07-17
申请号:CN202010314113.4
申请日:2020-04-20
Applicant: 合肥讯飞数码科技有限公司
IPC: G10L15/02 , G10L15/06 , G10L15/08 , G10L15/183 , G10L15/26
Abstract: 本发明公开了一种基于端到端的语音关键词识别方法、装置以及设备。本发明的构思在于与端到端思想相结合,由预建的关键词识别网络从特征向目标进行直接拟合,使得识别过程更加简洁、高效且可以避免不良影响的叠加效应,同时关键词识别网络更易达到全局最优,且能够有效降低开发成本,因此在实际业务场景中具有较高的实用价值。本发明还对识别特征的获取策略进行改进,从而可以充分表征出适应业务场景的发音特性,以便捕获到更多的潜在关键信息,降低漏警虚警,此外,本发明提供的关键词识别网络架构可以从声学角度利用到上下文信息,从根本上解决了现有方案仅通过孤立发音样本进行识别的弊端,进而明显改善了从音频中锁定关键词的处理效果。
-
-
-
-
-
-
-
-
-