-
公开(公告)号:CN114944144A
公开(公告)日:2022-08-26
申请号:CN202210322437.1
申请日:2022-03-29
Applicant: 广东电力信息科技有限公司
Abstract: 本申请公开了一种针对粤语的语音合成模型的训练方法及语音合成方法,涉及语音处理技术领域。该方法包括:获取目标语言类型对应的第一训练样本集;获取与目标语言类型相关联的第一初始网络,作为初始模型,第一初始网络是基于多种语言类型对应的第二训练样本集训练得到,多种语言类型与所述目标语言类型相关联;将第一文本样本输入至初始模型,得到第一文本样本对应的合成语音;基于第一文本样本对应的合成语音和第一文本样本对应的目标语言类型的第一语音样本,对初始模型进行迭代训练,直至满足第一预设条件,得到训练后的语音合成模型。如此,减小了模型训练需要的训练样本,同时提高了模型训练的效率。
-
公开(公告)号:CN114090819B
公开(公告)日:2024-10-29
申请号:CN202111256069.7
申请日:2021-10-27
Applicant: 广东电力信息科技有限公司
Abstract: 本申请实施例公开了一种基于神经网络的声纹数据清洗方法。所述方法包括:获取音频数据集,所述音频数据集中每个音频数据具有对应的初始标签;将所述音频数据集输入到标签预测模型中,获取所述标签预测模型输出的所述音频数据集中的音频数据各自对应的预测标签;基于所述初始标签和所述预测标签,确定所述音频数据集中每个音频数据对应的目标标签。通过上述方法,通过根据每个音频数据的初始标签和预测标签,对每一个音频数据的标签进行修正,进而可以得到带有更准确的标签的音频数据集。
-
公开(公告)号:CN114254103A
公开(公告)日:2022-03-29
申请号:CN202111423932.3
申请日:2021-11-26
Applicant: 广东电力信息科技有限公司
IPC: G06F16/34 , G06F40/289 , G06F40/216
Abstract: 本申请公开了一种基于主题生成模型的会议纪要生成方法。所述方法包括:获取待处理的发言文本;将所述发言文本划分为多个字节片段;获取每个所述字节片段在所述发言文本内的出现频率;基于多个所述字节片段序列的出现频率得到多个关键字节片段;基于多个所述关键字节片段获取所述发言文本对应的会议纪要。通过上述方式使得,可以基于多个所述字节片段序列的出现频率得到多个关键字节片段;基于多个所述关键字节片段获取所述发言文本对应的会议纪要,避免了事先频繁设定关键词,从而提高了用户体验。
-
公开(公告)号:CN113704426A
公开(公告)日:2021-11-26
申请号:CN202110997388.7
申请日:2021-08-27
Applicant: 广东电力信息科技有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06N3/04 , G06N3/08
Abstract: 本发明提供的一种基于记忆网络的对话策略状态跟踪方法及系统,跟踪方法包括:网络模型包括多个记忆数组;获取原始对话语言文本;将原始对话语言文本预处理,获得神经网络里内在的词向量;将词向量存储在所述记忆数组的下一个位置;根据词向量在所有记忆数组中选择出最相关的k个记忆单元;获取原始对话语言文本和最相关的k个记忆单元,获得相关记忆参数;使用评分函数计算候选词与相关记忆参数的相关性,获得计算得分;获取计算得分中最相关的语言文本。强化模型的记忆存储能力,使得整个对话系统保留更多的语义信息,提升了对话机器人对意图的理解和对关键信息的把握。提升了对话机器人对任务的理解。
-
公开(公告)号:CN114121021A
公开(公告)日:2022-03-01
申请号:CN202111264822.7
申请日:2021-10-28
Applicant: 广东电力信息科技有限公司
Abstract: 本申请公开了一种自动场景扩展的声纹采集方法,涉及声纹技术领域。该方法包括:获取第一注册音频;提取所述第一注册音频中的人声音频,作为目标音频;将所述目标音频与预设噪声集中至少一种环境噪声音频进行叠加,得到第二注册音频;基于预先训练的人声声纹模型,对所述第二注册音频进行特征提取,得到注册声纹特征,所述注册声纹特征用于声纹验证。如此,在声纹注册环节进行了场景拓展,提高了用于注册声纹的普适性,进而提高了声纹识别的鲁棒性和准确性。
-
公开(公告)号:CN114090819A
公开(公告)日:2022-02-25
申请号:CN202111256069.7
申请日:2021-10-27
Applicant: 广东电力信息科技有限公司
Abstract: 本申请实施例公开了一种基于神经网络的声纹数据清洗方法。所述方法包括:获取音频数据集,所述音频数据集中每个音频数据具有对应的初始标签;将所述音频数据集输入到标签预测模型中,获取所述标签预测模型输出的所述音频数据集中的音频数据各自对应的预测标签;基于所述初始标签和所述预测标签,确定所述音频数据集中每个音频数据对应的目标标签。通过上述方法,通过根据每个音频数据的初始标签和预测标签,对每一个音频数据的标签进行修正,进而可以得到带有更准确的标签的音频数据集。
-
公开(公告)号:CN113095847A
公开(公告)日:2021-07-09
申请号:CN202110248952.5
申请日:2021-03-05
Applicant: 广东电力信息科技有限公司
Abstract: 本发明涉及一种基于客户画像智能IVR路径优化方法,所述一种基于客户画像智能IVR路径优化方法包括如下步骤:S1:客户拨打电话进入IVR服务中心系统,或者IVR服务中心系统通过客户信息给客户拨打电话;S2:电话接通后,IVR服务中心系统自动询问客户信息,同时对客户的画像进行分析;S3:客户应答后,对客户的语音应答做出分析,并对客户的应答系统自动做出应答;S4:根据客户的语音分析;S5:对客户的问题或者办理需求处理系统进行处理;S6:告知处理问题或办理需求的详细处理信息。该基于客户画像智能IVR路径优化方法,能够根据客户的数据进行分析,对客户画像进行绘制总结;提高营销的业绩;提高信息处理效率。
-
公开(公告)号:CN113076351A
公开(公告)日:2021-07-06
申请号:CN202110248953.X
申请日:2021-03-05
Applicant: 广东电力信息科技有限公司
IPC: G06F16/2458 , G06F16/25 , G06Q50/06
Abstract: 本发明涉及一种大数据标签分析追溯业务洞察方法,包括如下步骤:S1:基于大数据技术,获取电力客服客户标签列表;获取历史电力客服客户信息;将所述历史电力客服客户信息与所述电力客服客户标签列表中的电力客服客户标签进行匹配,生成电力客服客户配置库;S2:根据不同的电力客户类型根据电力用户标准分类号进行分类,同时根据分类号生成专属于该客户的序列号标签;S3:将上述信息上传至互联网终端数据库中,以备追踪匹配数据;S4:客户进行业务推送时,均可以将客户实施情况传输进行数据库中;S5:使用或者业务推送时需登记该业务的标签以便实时追踪,当电力客服客户出现紧急情况时示警;S6:业务使用完成之后销毁数据库数据。该大数据标签分析追溯业务洞察方法能够对单个客户的所有实时数据进行记录。
-
-
-
-
-
-
-