-
公开(公告)号:CN114694655A
公开(公告)日:2022-07-01
申请号:CN202210314205.1
申请日:2022-03-28
Applicant: 广东电力信息科技有限公司
Abstract: 本申请公开了一种针对粤语音频的拓展方法,包括:获取样本音频集中各样本音频对应的音素文本;根据样本音频集中各样本音频对应的音素文本,统计各音素的音素词频;对于各样本音频,将样本音频所对应音素文本中音素对应的音素词频进行均值计算,得到样本音频对应的第一平均词频;根据样本音频对应的第一平均词频,确定样本音频对应的拓展权重;根据各样本音频对应的拓展权重,在样本音频集中确定待拓展的目标样本音频;将目标样本音频进行音频拓展,得到拓展音频;拓展音频和样本音频集中的样本音频用于对语音识别模型进行训练。通过本申请的方法能够解决用于训练语音识别模型的音频发音分布不均衡的问题,保证语音识别模型的识别准确度。
-
公开(公告)号:CN114254103A
公开(公告)日:2022-03-29
申请号:CN202111423932.3
申请日:2021-11-26
Applicant: 广东电力信息科技有限公司
IPC: G06F16/34 , G06F40/289 , G06F40/216
Abstract: 本申请公开了一种基于主题生成模型的会议纪要生成方法。所述方法包括:获取待处理的发言文本;将所述发言文本划分为多个字节片段;获取每个所述字节片段在所述发言文本内的出现频率;基于多个所述字节片段序列的出现频率得到多个关键字节片段;基于多个所述关键字节片段获取所述发言文本对应的会议纪要。通过上述方式使得,可以基于多个所述字节片段序列的出现频率得到多个关键字节片段;基于多个所述关键字节片段获取所述发言文本对应的会议纪要,避免了事先频繁设定关键词,从而提高了用户体验。
-
公开(公告)号:CN114171031A
公开(公告)日:2022-03-11
申请号:CN202111423927.2
申请日:2021-11-26
Applicant: 广东电力信息科技有限公司
Abstract: 本申请公开了一种基于多任务学习和对抗训练的声纹识别模型训练方法,涉及声纹技术领域。该方法包括:获取待训练的音频样本集,音频样本集中的每个音频样本标注有用户标签以及领域标签;获取每个音频样本的人声声纹特征以及领域特征;从人声声纹特征中过滤掉领域特征,得到过滤后的人声声纹特征作为人声通用特征;基于每个音频样本的人声通用特征、用户标签以及领域标签,对对抗网络进行训练,直至对抗网络满足预设条件,得到训练后的声纹识别模型。如此,采用了领域对抗训练的方式,增强了训练得到的声纹识别模型在不同环境下的鲁棒性和泛化能力,进而提高了声纹识别模型在面对环境噪声时的识别准确率,提高了用户体验。
-
公开(公告)号:CN114171010A
公开(公告)日:2022-03-11
申请号:CN202111300500.3
申请日:2021-11-04
Applicant: 广东电力信息科技有限公司
Abstract: 本申请公开了一种基于共振峰的语音指令清晰度确定方法,该方法包括:对语音指令信号进行活动语音检测,确定语音指令信号中的活动语音片段;确定活动语音片段中的共振峰所在的频率;根据活动语音片段中的共振峰所在的频率,确定活动语音片段中的指定活动语音子片段;指定活动语音子片段是指活动语音片段中在频率低于频率阈值的频段内存在共振峰的语音子片段;计算第一时长与第二时长的比值,得到目标时长比例,第一时长是指指定活动语音子片段的时长,第二时长是指活动语音片段的时长;根据目标时长比例,确定语音指令信号的清晰度等级。本方案实现了自动确定语音指令信号的清晰度等级。
-
公开(公告)号:CN114283791A
公开(公告)日:2022-04-05
申请号:CN202111443194.9
申请日:2021-11-30
Applicant: 广东电力信息科技有限公司
Abstract: 本申请公开了一种基于高维声学特征的语音识别方法及模型训练方法,涉及语音识别技术领域。该方法包括:获取待识别音频;基于预先训练的声学特征提取模型,获取待识别音频对应的高维特征,作为待识别音频的高维声学特征;获取待识别音频对应的识别场景,作为目标识别场景;将高维声学特征输入至与目标识别场景对应的预先训练的语音识别模型,得到待识别音频对应的文本识别结果。如此,通过提取包含了更多有助于语音识别的特征信息,使得基于高维声学特征识别到的文本识别结果更准确,提高了语音识别的准确性;并且,调用与待识别音频的识别场景对应的语音识别模型,实现更具有针对性的语音识别,也提高了文本识别结果的准确性。
-
公开(公告)号:CN114242077A
公开(公告)日:2022-03-25
申请号:CN202111357126.0
申请日:2021-11-16
Applicant: 广东电力信息科技有限公司
Abstract: 本申请公开了一种基于声纹模型的声纹数据的标注方法,该方法可以通过已标注有身份信息的多个第一声纹数据对初始模型进行训练得到声纹识别模型,基于声纹识别模型对多个未标注有身份信息的第二声纹数据进行声纹识别得到声纹特征,基于每个第二声纹数据对应的声纹特征,获取多个第二声纹数据中存在的多组声纹数据,以及多个第二声纹数据中除多组声纹数据以外的第二声纹数据作为其他声纹数据,将多组声纹数据中每组声纹数据对应的身份信息标注为不同的身份信息,以及将其他声纹数据中每个声纹数据标注为不同的身份信息。该方法通过半监督的方式既可以准确高效地对声纹数据标注身份信息,还可以提高声纹数据的标注的准确性。
-
公开(公告)号:CN114242120B
公开(公告)日:2023-11-10
申请号:CN202111413158.8
申请日:2021-11-25
Applicant: 广东电力信息科技有限公司
IPC: G11B27/031
Abstract: 本申请实施例公开了一种基于DTMF技术的音频剪辑方法及音频标记方法,涉及音频处理技术领域。该基于DTMF技术的音频剪辑方法通过获取录制音频;识别录制音频中的标记片段,标记片段为进行语音录制的过程中,响应于标记操作生成,标记片段为携带标记信息的DTMF音频;基于标记片段对录制音频进行剪辑处理。以此,可以根据录制音频中的标记片段主动进行剪辑处理,使得剪辑时不需要再识别录制音频中语音的特征,从而使得剪辑过程更便捷,同时极大提高了剪辑结果地准确度。
-
公开(公告)号:CN115376489A
公开(公告)日:2022-11-22
申请号:CN202210947087.8
申请日:2022-08-08
Applicant: 广东电力信息科技有限公司
IPC: G10L15/00 , G10L13/027 , H04M3/493
Abstract: 本发明公开了一种自适应切换方言语音的电话催缴方法、装置及语音机器人。该方法包括:在与用户终端建立语音通信通道时,通过预先构建的新方言语音合成模型合成探测语句,向用户终端发送探测语句;接收用户终端发送的回复语句,通过预先构建的旧方言分类模型识别回复语句对应的旧方言作为目标方言;通过新方言语音合成模型合成第一过渡语句,通过目标方言对应的旧方言语音合成模型合成第二过渡语句,并根据第一过渡语句和第二过渡语句得到过渡语句,向用户终端发送过渡语句;通过旧方言语音合成模型合成催缴语句,向用户终端发送催缴语句。本发明能够有效保证用户知晓催缴内容,提高电话催缴成功率,实现进一步提高电话催缴效率。
-
公开(公告)号:CN115271230A
公开(公告)日:2022-11-01
申请号:CN202210942204.1
申请日:2022-08-08
Applicant: 广东电力信息科技有限公司
IPC: G06Q10/04 , G06Q50/06 , G06K9/62 , G06F16/215 , G10L15/22
Abstract: 本发明提供了一种基于语音识别的催费方法和装置,所述方法包括:获取催费对象终端的回答信息,并根据所述回答信息,识别所述催费对象的用户意图;当用户意图为进一步咨询时,调用用电统计信息,发送用电量信息;并向催费对象终端发送异常用电提示;当所述用户意图为承诺缴费时,基于第二预设时间范围内的用电统计信息的分析结果,预估未来用电量,生成预存电费建议;当用户意图为身份阻却事由时或时间阻却事由,发送结束语并结束通话。相比于现有技术,避免了催费效果的不稳定性以及催费过程可能发生的冲突,提高了催费效率并降低了消耗的人力物力;根据意图使用对应的催费方法,响应快速并具有针对性,提高用户的体验以及服务的质量。
-
公开(公告)号:CN114360561A
公开(公告)日:2022-04-15
申请号:CN202111484420.8
申请日:2021-12-07
Applicant: 广东电力信息科技有限公司
IPC: G10L21/0208 , G10L25/30 , G10L15/06 , G10L15/16 , G10L19/26
Abstract: 本申请公开了一种基于深度神经网络技术的语音增强方法,通过获取待处理语音数据;将待处理语音数据输入至预先训练的神经网络模型,获得神经网络模型输出的增强语音数据;增强语音数据为待处理语音数据滤除噪音数据后得到;其中,预先训练的神经网络模型包括编码结构和解码结构,通过对训练语音数据进行编码并传递给解码结构,并将相邻解码层之间的解码输出信息进行去除冗余和传递处理训练得到。以此,通过预先训练的神经网络模型对待处理语音数据进行处理,可以快速、有效抑制噪声数据,且预先训练的神经网络模型通过对解码输出信息进行去除冗余处理,更专注于有效信息,明显提升降噪效果。
-
-
-
-
-
-
-
-
-