-
公开(公告)号:CN110704627A
公开(公告)日:2020-01-17
申请号:CN201910978508.1
申请日:2019-10-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F16/332
Abstract: 本说明书实施例公开了一种训练分类模型的方法及系统。所述方法包括:获取至少一个问题对,将所述至少一个问题对输入初始分类模型,确定所述至少一个问题对中每一个的初始分类结果;基于所述初始分类结果,确定所述至少一个问题对中每一个的匹配模型,将所述至少一个问题对输入对应的所述匹配模型,确定所述至少一个问题对的第一匹配结果;基于所述第一匹配结果以及所述至少一个问题对标定的第二匹配结果,得到反馈值;根据所述反馈值调整所述初始分类模型,得到目标分类模型。
-
公开(公告)号:CN111274808B
公开(公告)日:2023-07-04
申请号:CN202010086368.X
申请日:2020-02-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/216 , G06F40/30 , G06F16/35
Abstract: 本说明书涉及一种文本检索方法包括:对接收的第一文本进行分词,得到至少一个词语;根据所述至少一个词语从知识库中召回至少一个第二文本;将所述至少一个词语输入经过训练的文本向量模型,得到所述第一文本的文本向量;根据所述第一文本的向量从所述知识库中召回至少一个第三文本;以及将所述至少一个第二文本和所述至少一个第三文本进行融合,得到文本检索结果。本说明书还提供了词权重模型和文本向量模型的训练方法、文本检索装置、电子设备以及计算机可读存储介质。
-
公开(公告)号:CN111274787B
公开(公告)日:2023-04-18
申请号:CN202010108943.1
申请日:2020-02-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F40/279
Abstract: 本说明书的实施例公开了一种用户意图预测方法和系统。该方法包括:获取与用户相关的一个或多个因子信息;所述因子信息至少反映用户在某服务平台内的操作行为;基于所述因子信息确定多个候选意图文本;基于语言模型处理所述多个候选意图文本以及所述因子信息,得到多个相关度;多个相关度分别反映所述多个候选意图文本与所述因子信息的相关性;以及,至少基于所述多个相关度从所述多个候选意图文本中确定目标意图文本。
-
公开(公告)号:CN110909885B
公开(公告)日:2022-09-23
申请号:CN201911139061.5
申请日:2019-11-19
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例公开了一种平衡多个任务的方法。所述方法包括:获取第一任务的第一损失函数和至少一个第二任务的第二损失函数,所述第一损失函数对应主任务,所述至少一个第二损失函数对应至少一个辅任务;根据所述第一损失函数得到第一损失函数对应的第一损失函数值;根据所述第二损失函数得到第二损失函数对应的第二损失函数值;根据所述第一损失函数值和所述至少一个第二损失函数值之间的大小关系,确定至少一个平衡参数;所述至少一个平衡参数用于将所述至少一个第二损失函数和所述第一损失函数调整至同一量级;使用所述至少一个平衡参数,确定第一损失函数和至少一个第二损失函数对应的联合损失函数。
-
公开(公告)号:CN111461753B
公开(公告)日:2022-05-17
申请号:CN202010302538.3
申请日:2020-04-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/00 , G06F16/35 , G06F16/332
Abstract: 本说明书实施例提供一种智能客服场景中的知识点召回方法及装置,在召回方法中,获取分层可导航小世界图HNSW,该HNSW包括上下排列的多层NSW。获取待召回知识点的用户问句,并确定用户问句的句子向量。从最上层NSW开始,按照从上到下的顺序对各层NSW进行层搜索。该层搜索包括:根据当前层NSW所包含的节点的连接关系,从其所包含的节点中,搜索距离句子向量最近的第一节点,经由该第一节点进入下一层NSW,直至到达最下层NSW。在最下层NSW中,根据N个节点的连接关系,从中搜索距离句子向量最近的目标节点。将目标节点所代表的类簇中心对应的知识点类簇作为目标类簇,并从归属于目标类簇的各知识点标题对应的知识点中,召回与用户问句相匹配的知识点。
-
公开(公告)号:CN111340218B
公开(公告)日:2022-04-15
申请号:CN202010113810.3
申请日:2020-02-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种训练问题识别模型的方法和系统,所述方法包括:获取多个第一文本和多个第二文本,所述第一文本和所述第二文本分别为问题类文本和非问题类文本;生成模型基于所述第一文本与所述第二文本之间的相似度,为所述第一文本选择满足第一预设条件的至少一个所述第二文本,生成至少一个文本对;将所述文本对输入初始问题识别模型进行训练,训练得到目标问题识别模型。
-
公开(公告)号:CN112100387B
公开(公告)日:2021-02-19
申请号:CN202011269071.3
申请日:2020-11-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种用于文本分类的神经网络系统的训练方法,该神经网络系统包括文本表征网络、特征提取层和分类网络。该训练方法包括:首先,获取训练文本集,该训练文本集对应K个类别;接着,针对该训练文本集中任一的第一训练文本,利用上述文本表征网络对其进行处理,得到第一文本向量;然后,利用上述特征提取层,将该第一文本向量分别与对应所述K个类别的K个类别特征向量进行组合操作,得到K个特征提取向量;再接着,基于该K个特征提取向量和上述分类网络,确定分类预测结果;再然后,基于该分类预测结果和上述第一训练文本的类别标签,训练上述神经网络系统。
-
公开(公告)号:CN112115248A
公开(公告)日:2020-12-22
申请号:CN202011034369.6
申请日:2020-09-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/279 , G06F40/30
Abstract: 本说明书一个或多个实施例涉及一种从对话语料中抽取对话策略结构的方法及系统,所述方法包括:获取所述对话语料的多个客服语料;其中,所述客服语料中包括多个按序排列的问题信息;基于特征提取算法对所述客服语料中的问题信息进行特征化处理,得到问题信息对应的特征向量;基于聚类算法将所述问题信息对应的特征向量聚类为多个问题聚类簇;基于所述多个按序排列的问题信息获取各问题聚类簇在所述多个客服语料中的顺序标识;基于关联规则算法对各问题聚类簇及其顺序标识进行处理,获取目标问题序列;基于所述目标问题序列确定所述对话策略结构。
-
公开(公告)号:CN112015898A
公开(公告)日:2020-12-01
申请号:CN202010884803.3
申请日:2020-08-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于标签树的模型训练、文本标签确定方法及装置。在模型训练中,对标签集中的实标签进行分层聚类,基于聚类结果生成第一标签树,其中的叶节点对应于实标签,干节点被对应于定义的虚标签;获取基于训练集和虚标签构建的异构关系网络,其中包括文本节点、标签节点和分词节点以及它们之间的连接边;从异构关系网络中查找符合预设格式的多组元路径;将多组元路径输入预先训练的图嵌入模型,得到多个实标签和多个虚标签分别对应的更新特征;将更新特征对应地确定为第一标签树中若干个节点的特征,得到第二标签树;基于训练集对第二标签树对应的文本分类模型进行训练。
-
公开(公告)号:CN111475637B
公开(公告)日:2020-10-09
申请号:CN202010588724.8
申请日:2020-06-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06N5/02
Abstract: 本说明书实施例提供一种用于推送知识点的数据处理、训练方法及装置,基于异构图提取符合预设格式的多组元路径,获取异构图中各个节点的对应的第一特征,然后将多组元路径输入预先训练得到的图神经网络模型,通过图神经网络模型对元路径上节点的第一特征进行聚合,至少输出作为路径端点的用户节点和/或知识点节点对应的第二特征,第二特征用于对用户节点和知识点节点进行匹配,以向用户推送相应知识点。该方案能够更精确地匹配用户需求。
-
-
-
-
-
-
-
-
-