-
公开(公告)号:CN120071938A
公开(公告)日:2025-05-30
申请号:CN202510151394.9
申请日:2025-02-11
Applicant: 合肥讯飞数码科技有限公司
IPC: G10L15/26 , G10L15/16 , G10L21/0208 , H04M3/22
Abstract: 本发明公开了一种基于自然语言处理技术的电话语音不良内容检测系统,涉及语音检测技术领域,包括:将去噪语音数据转化为第一文字数据;将去噪语音数据、语音音调、语音音量输入预设的语音数据分析模型中,生成第二文字数据;将第二文字数据与第一文字数据进行转化率比对,生成转化率数据;获取电话的识别数据,将识别数据和转化率数据输入至预设的最佳音频编码器比特率回归模型中,获得最佳音频编码器比特率;本发明有利于在通话检测的过程中,通过对语音转文字时的预处理优化,从而提高对后续电话的转化率数据的精准分析,进而来判断电话的语音内容检测是否准确,在检测出语音内容检测不准确时,进行实时的语音检测策略调整。
-
公开(公告)号:CN111159360B
公开(公告)日:2022-12-02
申请号:CN201911422174.6
申请日:2019-12-31
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F40/289 , G06Q50/26
Abstract: 本申请公开了一种获得讯询问话题分类模型、讯询问话题分类的方法和装置,该方法包括:首先,对样本讯询问笔录中样本问答对进行自然语言预处理,获得各个样本问句分词和各个样本答句分词;然后,根据各个样本问句分词及其对应的各个贡献度得分、各个样本答句分词及其对应的各个贡献度得分和样本问答对的标记话题类别,训练基于注意力机制的卷积神经网络获得讯询问话题分类模型。由此可见,通过贡献度得分增加样本问答对的话题类别信息,加强讯询问话题分类的训练;且利用基于注意力机制的卷积神经网络,能够充分学习“强话题”分词与话题类别之间的关系,使得讯询问话题分类模型的话题分类效果更好,提高后续讯询问话题分类的正确率。
-
公开(公告)号:CN111540363A
公开(公告)日:2020-08-14
申请号:CN202010312979.1
申请日:2020-04-20
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请提供了一种关键词模型及解码网络构建方法、检测方法及相关设备,其中,关键词模型构建方法可以包括:从源域的声学模型中抽取待检测的关键词列表中各关键词分别对应的模型信息;根据关键词列表中各关键词分别对应的模型信息,生成源域的关键词模型;利用关键词列表中各关键词的语音样本,以源域关键词模型为基础模型,训练得到目标域的关键词模型。本申请提供的关键词模型构建方法使用数量较少的关键词语音样本即可构建出性能较佳的关键词模型。
-
公开(公告)号:CN111326168A
公开(公告)日:2020-06-23
申请号:CN202010220472.3
申请日:2020-03-25
Applicant: 合肥讯飞数码科技有限公司
IPC: G10L21/0272 , G10L25/03 , G10L25/30
Abstract: 本发明实施例提供一种语音分离方法、装置、电子设备和存储介质,其中方法包括:确定待分离的语音信号;将语音信号输入语音分离模型,得到语音分离模型输出的语音分离结果;语音分离模型是基于样本语音信号及其对应的样本语音分离结果训练得到的;其中,语音分离模型用于对语音信号的时域语音特征进行多级膨胀卷积,得到对应于不同发音源的掩码矩阵,并基于时域语音特征和掩码矩阵实现语音分离。本发明实施例提供的方法、装置、电子设备和存储介质,时域上进行语音分离,避免了多发音源重叠的频域信号相互抵消导致语音分离结果欠佳的问题;此外,多级膨胀卷积能够实现感受野的扩展,解决梯度消失或梯度爆炸的问题,提升语音分离的准确性。
-
公开(公告)号:CN111326168B
公开(公告)日:2023-08-22
申请号:CN202010220472.3
申请日:2020-03-25
Applicant: 合肥讯飞数码科技有限公司
IPC: G10L21/0272 , G10L25/03 , G10L25/30
Abstract: 本发明实施例提供一种语音分离方法、装置、电子设备和存储介质,其中方法包括:确定待分离的语音信号;将语音信号输入语音分离模型,得到语音分离模型输出的语音分离结果;语音分离模型是基于样本语音信号及其对应的样本语音分离结果训练得到的;其中,语音分离模型用于对语音信号的时域语音特征进行多级膨胀卷积,得到对应于不同发音源的掩码矩阵,并基于时域语音特征和掩码矩阵实现语音分离。本发明实施例提供的方法、装置、电子设备和存储介质,时域上进行语音分离,避免了多发音源重叠的频域信号相互抵消导致语音分离结果欠佳的问题;此外,多级膨胀卷积能够实现感受野的扩展,解决梯度消失或梯度爆炸的问题,提升语音分离的准确性。
-
-
公开(公告)号:CN111540367B
公开(公告)日:2023-03-31
申请号:CN202010307618.8
申请日:2020-04-17
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明实施例提供一种语音特征提取方法、装置、电子设备和存储介质,其中方法包括:确定语音数据;将所述语音数据输入至语音特征提取模型中,得到所述语音特征提取模型输出的语音特征;其中,所述语音特征提取模型是基于样本语音数据无监督训练得到的;所述语音提取模型用于将所述语音数据编码得到隐层特征,并将所述隐层特征进行非线性空间映射,得到所述语音特征。本发明实施例提供的方法、装置、电子设备和存储介质,对语音数据进行编码即可实现针对语音数据的隐层特征的深度挖掘和表达,对隐层特征进行非线性空间映射即可优化语音特征对于语音数据的拟合效果,且节省了大量计算,避免了由于人为降维带来的高维特征损失。
-
公开(公告)号:CN111540367A
公开(公告)日:2020-08-14
申请号:CN202010307618.8
申请日:2020-04-17
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明实施例提供一种语音特征提取方法、装置、电子设备和存储介质,其中方法包括:确定语音数据;将所述语音数据输入至语音特征提取模型中,得到所述语音特征提取模型输出的语音特征;其中,所述语音特征提取模型是基于样本语音数据无监督训练得到的;所述语音提取模型用于将所述语音数据编码得到隐层特征,并将所述隐层特征进行非线性空间映射,得到所述语音特征。本发明实施例提供的方法、装置、电子设备和存储介质,对语音数据进行编码即可实现针对语音数据的隐层特征的深度挖掘和表达,对隐层特征进行非线性空间映射即可优化语音特征对于语音数据的拟合效果,且节省了大量计算,避免了由于人为降维带来的高维特征损失。
-
公开(公告)号:CN111159360A
公开(公告)日:2020-05-15
申请号:CN201911422174.6
申请日:2019-12-31
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F40/289 , G06Q50/26
Abstract: 本申请公开了一种获得讯询问话题分类模型、讯询问话题分类的方法和装置,该方法包括:首先,对样本讯询问笔录中样本问答对进行自然语言预处理,获得各个样本问句分词和各个样本答句分词;然后,根据各个样本问句分词及其对应的各个贡献度得分、各个样本答句分词及其对应的各个贡献度得分和样本问答对的标记话题类别,训练基于注意力机制的卷积神经网络获得讯询问话题分类模型。由此可见,通过贡献度得分增加样本问答对的话题类别信息,加强讯询问话题分类的训练;且利用基于注意力机制的卷积神经网络,能够充分学习“强话题”分词与话题类别之间的关系,使得讯询问话题分类模型的话题分类效果更好,提高后续讯询问话题分类的正确率。
-
公开(公告)号:CN111540363B
公开(公告)日:2023-10-24
申请号:CN202010312979.1
申请日:2020-04-20
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请提供了一种关键词模型及解码网络构建方法、检测方法及相关设备,其中,关键词模型构建方法可以包括:从源域的声学模型中抽取待检测的关键词列表中各关键词分别对应的模型信息;根据关键词列表中各关键词分别对应的模型信息,生成源域的关键词模型;利用关键词列表中各关键词的语音样本,以源域关键词模型为基础模型,训练得到目标域的关键词模型。本申请提供的关键词模型构建方法使用数量较少的关键词语音样本即可构建出性能较佳的关键词模型。
-
-
-
-
-
-
-
-
-