一种语音质检方法、装置、电子设备和存储介质

    公开(公告)号:CN110634471A

    公开(公告)日:2019-12-31

    申请号:CN201910895428.X

    申请日:2019-09-21

    Inventor: 聂镭 邹茂泰 聂颖

    Abstract: 本发明公开了语音质检方法,通过本发明,通过获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档;从所述待质检音频对应的话术脚本中提取与特定质检规则对应的若干文字作为第一匹配模版;对所述第一匹配模版的文字进行随机模糊,得到若干第二匹配模板,根据所述第二匹配模板得到第三匹配模板;使用所述第三匹配模板对所述待质检文档进行正则匹配,得到质检结果。可以改善现有技术中对语音识别准确率低的音频进行质检效果差的问题。

    音频识别方法及装置、计算机可读存储介质

    公开(公告)号:CN109686377B

    公开(公告)日:2019-11-05

    申请号:CN201811579098.5

    申请日:2018-12-24

    Abstract: 本发明公开了一种音频识别方法及装置、计算机可读存储介质,该方法包括:获取声纹矢量化模型;获取同一目标说话人的多个不同第一音频文件;利用声纹矢量化模型对每一个第一音频文件进行矢量化;采用至少一种方式确定多个不同第一音频文件的声纹向量的中心向量,以及利用每一种中心向量分别确定一相似度接受范围;利用声纹矢量化模型得到待识别音频文件的声纹向量,以及计算待识别音频文件的声纹向量与每一种中心向量的相似度;对于每一种中心向量,判断待识别音频文件的声纹向量与其相似度是否位于利用其确定的相似度接受范围内,以及根据判断的结果确定待识别音频文件是否属于目标说话人。本发明可以实现利用声纹对说话人进行有效识别。

    句子级双语对齐方法及装置、计算机可读存储介质

    公开(公告)号:CN109670178B

    公开(公告)日:2019-10-08

    申请号:CN201811562126.2

    申请日:2018-12-20

    Abstract: 本发明公开了一种句子级双语对齐方法及装置、计算机可读存储介质,该方法包括:步骤S1:获取Z个训练好的卷积核,其中,Z为大于等于1的整数;步骤S2:分别对两个待对齐文本进行断句处理,并建立所述两个待对齐文本的文本相似度矩阵U:步骤S3:采用所述Z个训练好的卷积核中的每一个卷积核对所述文本相似度矩阵U进行卷积,得到Z个优化文本相似度矩阵;步骤S4:利用所述Z个优化文本相似度矩阵得到所述两个待对齐文本的语句对齐结果。本发明有利于提高文本间语句对齐的效率。

    信息确定方法及装置
    45.
    发明公开

    公开(公告)号:CN109800912A

    公开(公告)日:2019-05-24

    申请号:CN201910029108.6

    申请日:2019-01-12

    Inventor: 聂镭 沙露露 张峰

    Abstract: 本发明公开了一种信息确定方法及装置。所述训练方法包括:确定目标企业的所属领域;在所属领域内,获取发展阶段超过预测期的企业,组成参考企业群;获取参考企业群中各企业在预测期的人才需求数据;根据参考企业群中各企业与目标企业之间的相似度以及参考企业群中各企业在预测期的人才需求数据,确定目标企业在预测期的人才需求信息。采用本发明,可以解决现有技术中存在的根据企业自身发展的历史数据对企业当前阶段或者未来某发展阶段的用人需求进行预测则无法进行有效的预测或者预测结果很难符合企业实际需求的问题,不依赖于目标企业自身发展的历史数据的充足程度,使企业人才需求预测结果更加科学、更加符合企业实际发展需求。

    双语对齐方法、装置及系统

    公开(公告)号:CN109710950A

    公开(公告)日:2019-05-03

    申请号:CN201811567535.1

    申请日:2018-12-20

    Abstract: 本发明公开了一种双语对齐方法、装置及系统,该方法包括:步骤S1:将待对齐的两文本按照相同语言单位级别进行分割;步骤S2:计算所述两文本中一个文本分割得到的每一部分与另一个文本分割得到的每一部分的文本相似度;步骤S3:建立文本相似度矩阵B;步骤S4:依次利用所述文本相似度矩阵B中当前最大值元素实现所述两文本分割得到的部分之间的配对,其中,在确定每一配对后,将所述确定的配对在所述文本相似度矩阵B中对应的列和对应的行中的元素的值置为结束标识符。本发明有利于提高双语对齐的准确率。

    句子级双语对齐方法及系统

    公开(公告)号:CN109697287A

    公开(公告)日:2019-04-30

    申请号:CN201811561745.X

    申请日:2018-12-20

    Abstract: 本发明公开了一种句子级双语对齐方法及系统,该方法包括:步骤S1:对待对齐的两文本进行处理,得到第一语句列表和第二语句列表;步骤S2:计算该第一语句列表中的每一个语句与该第二语句列表中的每一个语句的文本相似度;步骤S3:根据该第一语句列表中的语句在该一个文本中的对应语句的位置与该第二语句列表中的语句在该另一个文本中的对应语句的位置对该文本相似度进行修正,得到该第一语句列表中的每一个语句与该第二语句列表中的每一个语句的语句匹配度;步骤S4:根据该第一语句列表中的每一个语句与该第二语句列表中的每一个语句的语句匹配度得到该两文本的语句对齐结果。本发明有利于提高语句对齐效率。

    音频识别方法及装置、计算机可读存储介质

    公开(公告)号:CN109686377A

    公开(公告)日:2019-04-26

    申请号:CN201811579098.5

    申请日:2018-12-24

    Abstract: 本发明公开了一种音频识别方法及装置、计算机可读存储介质,该方法包括:获取声纹矢量化模型;获取同一目标说话人的多个不同第一音频文件;利用声纹矢量化模型对每一个第一音频文件进行矢量化;采用至少一种方式确定多个不同第一音频文件的声纹向量的中心向量,以及利用每一种中心向量分别确定一相似度接受范围;利用声纹矢量化模型得到待识别音频文件的声纹向量,以及计算待识别音频文件的声纹向量与每一种中心向量的相似度;对于每一种中心向量,判断待识别音频文件的声纹向量与其相似度是否位于利用其确定的相似度接受范围内,以及根据判断的结果确定待识别音频文件是否属于目标说话人。本发明可以实现利用声纹对说话人进行有效识别。

Patent Agency Ranking