一种针对粤语音频的拓展方法及语音识别方法

    公开(公告)号:CN114694655A

    公开(公告)日:2022-07-01

    申请号:CN202210314205.1

    申请日:2022-03-28

    Abstract: 本申请公开了一种针对粤语音频的拓展方法,包括:获取样本音频集中各样本音频对应的音素文本;根据样本音频集中各样本音频对应的音素文本,统计各音素的音素词频;对于各样本音频,将样本音频所对应音素文本中音素对应的音素词频进行均值计算,得到样本音频对应的第一平均词频;根据样本音频对应的第一平均词频,确定样本音频对应的拓展权重;根据各样本音频对应的拓展权重,在样本音频集中确定待拓展的目标样本音频;将目标样本音频进行音频拓展,得到拓展音频;拓展音频和样本音频集中的样本音频用于对语音识别模型进行训练。通过本申请的方法能够解决用于训练语音识别模型的音频发音分布不均衡的问题,保证语音识别模型的识别准确度。

    一种基于高维声学特征的语音识别方法及模型训练方法

    公开(公告)号:CN114283791A

    公开(公告)日:2022-04-05

    申请号:CN202111443194.9

    申请日:2021-11-30

    Abstract: 本申请公开了一种基于高维声学特征的语音识别方法及模型训练方法,涉及语音识别技术领域。该方法包括:获取待识别音频;基于预先训练的声学特征提取模型,获取待识别音频对应的高维特征,作为待识别音频的高维声学特征;获取待识别音频对应的识别场景,作为目标识别场景;将高维声学特征输入至与目标识别场景对应的预先训练的语音识别模型,得到待识别音频对应的文本识别结果。如此,通过提取包含了更多有助于语音识别的特征信息,使得基于高维声学特征识别到的文本识别结果更准确,提高了语音识别的准确性;并且,调用与待识别音频的识别场景对应的语音识别模型,实现更具有针对性的语音识别,也提高了文本识别结果的准确性。

    一种基于声纹模型的声纹数据的标注方法

    公开(公告)号:CN114242077A

    公开(公告)日:2022-03-25

    申请号:CN202111357126.0

    申请日:2021-11-16

    Abstract: 本申请公开了一种基于声纹模型的声纹数据的标注方法,该方法可以通过已标注有身份信息的多个第一声纹数据对初始模型进行训练得到声纹识别模型,基于声纹识别模型对多个未标注有身份信息的第二声纹数据进行声纹识别得到声纹特征,基于每个第二声纹数据对应的声纹特征,获取多个第二声纹数据中存在的多组声纹数据,以及多个第二声纹数据中除多组声纹数据以外的第二声纹数据作为其他声纹数据,将多组声纹数据中每组声纹数据对应的身份信息标注为不同的身份信息,以及将其他声纹数据中每个声纹数据标注为不同的身份信息。该方法通过半监督的方式既可以准确高效地对声纹数据标注身份信息,还可以提高声纹数据的标注的准确性。

    自适应切换方言语音的电话催缴方法、装置及语音机器人

    公开(公告)号:CN115376489A

    公开(公告)日:2022-11-22

    申请号:CN202210947087.8

    申请日:2022-08-08

    Abstract: 本发明公开了一种自适应切换方言语音的电话催缴方法、装置及语音机器人。该方法包括:在与用户终端建立语音通信通道时,通过预先构建的新方言语音合成模型合成探测语句,向用户终端发送探测语句;接收用户终端发送的回复语句,通过预先构建的旧方言分类模型识别回复语句对应的旧方言作为目标方言;通过新方言语音合成模型合成第一过渡语句,通过目标方言对应的旧方言语音合成模型合成第二过渡语句,并根据第一过渡语句和第二过渡语句得到过渡语句,向用户终端发送过渡语句;通过旧方言语音合成模型合成催缴语句,向用户终端发送催缴语句。本发明能够有效保证用户知晓催缴内容,提高电话催缴成功率,实现进一步提高电话催缴效率。

    一种基于语音识别的催费方法和装置

    公开(公告)号:CN115271230A

    公开(公告)日:2022-11-01

    申请号:CN202210942204.1

    申请日:2022-08-08

    Abstract: 本发明提供了一种基于语音识别的催费方法和装置,所述方法包括:获取催费对象终端的回答信息,并根据所述回答信息,识别所述催费对象的用户意图;当用户意图为进一步咨询时,调用用电统计信息,发送用电量信息;并向催费对象终端发送异常用电提示;当所述用户意图为承诺缴费时,基于第二预设时间范围内的用电统计信息的分析结果,预估未来用电量,生成预存电费建议;当用户意图为身份阻却事由时或时间阻却事由,发送结束语并结束通话。相比于现有技术,避免了催费效果的不稳定性以及催费过程可能发生的冲突,提高了催费效率并降低了消耗的人力物力;根据意图使用对应的催费方法,响应快速并具有针对性,提高用户的体验以及服务的质量。

Patent Agency Ranking