一种模型训练方法、装置、电子设备及存储介质

    公开(公告)号:CN110782883A

    公开(公告)日:2020-02-11

    申请号:CN201911100649.X

    申请日:2019-11-12

    Abstract: 本申请公开了一种模型训练方法、装置、电子设备及存储介质,涉及模型训练领域。具体实现方案为:在第一阶段的微调训练中,将各个第一样本类型的训练样本输入至待训练模型的共享层模块中;基于各个第一样本类型的训练样本对共享层模块中的模型参数进行调整;通过共享层模块将各个第一样本类型的训练样本输入至待训练模型的各个任务类型对应的任务层模块中;通过各个任务层模块提取出自身匹配的训练数据;并基于各个任务层模块匹配的训练数据对各个任务层模块中的模型参数进行调整。本申请实施例不仅可以统一对共享层模块进行训练,而且还可以单独对各个任务层模块进行训练,在提升单任务性能的同时保留多任务训练的效果。

    语言模型预训练方法和装置

    公开(公告)号:CN110941945B

    公开(公告)日:2021-03-23

    申请号:CN201911214094.1

    申请日:2019-12-02

    Abstract: 本申请公开了语言模型预训练方法和装置。该方法的一具体实施方式包括:获取初始语言模型,初始语言模型用于确定输入到初始语言模型的文本数据中包含的字之间的关联关系;获取训练初始语言模型的训练样本集,训练样本集中的训练样本包括样本数据、第一标注信息和第二标注信息;将样本数据作为输入,将第一标注信息作为与初始语言模型的第一输出端连接的初始去噪自编码模型的期望输出,并将第二标注信息作为与初始语言模型的第二输出端连接的初始序列到序列模型的期望输出,对初始语言模型、初始去噪自编码模型和初始序列到序列模型进行预训练,得到训练后的语言模型。该实施方式可以显示捕获文本的音韵信息,有效提升了语言模型输出文本的语义表示效果。

    一种模型训练方法、装置、电子设备及存储介质

    公开(公告)号:CN110782883B

    公开(公告)日:2020-10-20

    申请号:CN201911100649.X

    申请日:2019-11-12

    Abstract: 本申请公开了一种模型训练方法、装置、电子设备及存储介质,涉及模型训练领域。具体实现方案为:在第一阶段的微调训练中,将各个第一样本类型的训练样本输入至待训练模型的共享层模块中;基于各个第一样本类型的训练样本对共享层模块中的模型参数进行调整;通过共享层模块将各个第一样本类型的训练样本输入至待训练模型的各个任务类型对应的任务层模块中;通过各个任务层模块提取出自身匹配的训练数据;并基于各个任务层模块匹配的训练数据对各个任务层模块中的模型参数进行调整。本申请实施例不仅可以统一对共享层模块进行训练,而且还可以单独对各个任务层模块进行训练,在提升单任务性能的同时保留多任务训练的效果。

    语言模型预训练方法和装置

    公开(公告)号:CN110941945A

    公开(公告)日:2020-03-31

    申请号:CN201911214094.1

    申请日:2019-12-02

    Abstract: 本申请公开了语言模型预训练方法和装置。该方法的一具体实施方式包括:获取初始语言模型,初始语言模型用于确定输入到初始语言模型的文本数据中包含的字之间的关联关系;获取训练初始语言模型的训练样本集,训练样本集中的训练样本包括样本数据、第一标注信息和第二标注信息;将样本数据作为输入,将第一标注信息作为与初始语言模型的第一输出端连接的初始去噪自编码模型的期望输出,并将第二标注信息作为与初始语言模型的第二输出端连接的初始序列到序列模型的期望输出,对初始语言模型、初始去噪自编码模型和初始序列到序列模型进行预训练,得到训练后的语言模型。该实施方式可以显示捕获文本的音韵信息,有效提升了语言模型输出文本的语义表示效果。

    一种语音处理方法、装置和电子设备

    公开(公告)号:CN110767212A

    公开(公告)日:2020-02-07

    申请号:CN201911018354.8

    申请日:2019-10-24

    Abstract: 本申请公开了一种语音处理方法、装置和电子设备,涉及语音技术领域。具体实现方案为:通过自注意力模型对输入文本进行语义解析,以得到所述输入文本的文本语义信息;基于所述文本语义信息执行所述输入文本的N个语音任务,其中,执行每个语音任务的输入均包括所述文本语义信息,所述N为大于或者等于1的整数。本申请可以达到提高语音合成前端的可靠性的技术效果。

    一种语音处理方法、装置和电子设备

    公开(公告)号:CN110767212B

    公开(公告)日:2022-04-26

    申请号:CN201911018354.8

    申请日:2019-10-24

    Abstract: 本申请公开了一种语音处理方法、装置和电子设备,涉及语音技术领域。具体实现方案为:通过自注意力模型对输入文本进行语义解析,以得到所述输入文本的文本语义信息;基于所述文本语义信息执行所述输入文本的N个语音任务,其中,执行每个语音任务的输入均包括所述文本语义信息,所述N为大于或者等于1的整数。本申请可以达到提高语音合成前端的可靠性的技术效果。

Patent Agency Ranking