-
公开(公告)号:CN112100387B
公开(公告)日:2021-02-19
申请号:CN202011269071.3
申请日:2020-11-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种用于文本分类的神经网络系统的训练方法,该神经网络系统包括文本表征网络、特征提取层和分类网络。该训练方法包括:首先,获取训练文本集,该训练文本集对应K个类别;接着,针对该训练文本集中任一的第一训练文本,利用上述文本表征网络对其进行处理,得到第一文本向量;然后,利用上述特征提取层,将该第一文本向量分别与对应所述K个类别的K个类别特征向量进行组合操作,得到K个特征提取向量;再接着,基于该K个特征提取向量和上述分类网络,确定分类预测结果;再然后,基于该分类预测结果和上述第一训练文本的类别标签,训练上述神经网络系统。
-
公开(公告)号:CN113010653B
公开(公告)日:2022-09-02
申请号:CN202110279376.0
申请日:2021-03-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F40/30 , G06F40/211 , G06K9/62 , G06N3/08 , G06N20/00
Abstract: 本说明书实施例公开了一种对话策略模型训练、对话的方法和系统。其中,对话策略模型训练方法包括:基于多轮历史对话,确定第一训练数据以及第二训练数据;使用第一训练数据对对话策略模型进行第一阶段训练,使得对话策略模型能够基于对话上文输出与之对应的对话策略,进而获得对话策略模型的第一模型参数;使用第二训练数据对经过第一阶段训练后的对话策略模型进行第二阶段训练,调整第一模型参数,使得对话策略模型基于对话上文输出的对话策略能够与预设对话目标适配,进而获得对话策略模型的第二模型参数。
-
公开(公告)号:CN113010653A
公开(公告)日:2021-06-22
申请号:CN202110279376.0
申请日:2021-03-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F40/30 , G06F40/211 , G06K9/62 , G06N3/08 , G06N20/00
Abstract: 本说明书实施例公开了一种对话策略模型训练、对话的方法和系统。其中,对话策略模型训练方法包括:基于多轮历史对话,确定第一训练数据以及第二训练数据;使用第一训练数据对对话策略模型进行第一阶段训练,使得对话策略模型能够基于对话上文输出与之对应的对话策略,进而获得对话策略模型的第一模型参数;使用第二训练数据对经过第一阶段训练后的对话策略模型进行第二阶段训练,调整第一模型参数,使得对话策略模型基于对话上文输出的对话策略能够与预设对话目标适配,进而获得对话策略模型的第二模型参数。
-
公开(公告)号:CN112100387A
公开(公告)日:2020-12-18
申请号:CN202011269071.3
申请日:2020-11-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种用于文本分类的神经网络系统的训练方法,该神经网络系统包括文本表征网络、特征提取层和分类网络。该训练方法包括:首先,获取训练文本集,该训练文本集对应K个类别;接着,针对该训练文本集中任一的第一训练文本,利用上述文本表征网络对其进行处理,得到第一文本向量;然后,利用上述特征提取层,将该第一文本向量分别与对应所述K个类别的K个类别特征向量进行组合操作,得到K个特征提取向量;再接着,基于该K个特征提取向量和上述分类网络,确定分类预测结果;再然后,基于该分类预测结果和上述第一训练文本的类别标签,训练上述神经网络系统。
-
-
-