-
公开(公告)号:CN111400484A
公开(公告)日:2020-07-10
申请号:CN202010200961.2
申请日:2020-03-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/335 , G06F40/289 , G06F40/284 , G06F40/205 , G06K9/62
Abstract: 本说明书实施例公开了一种关键词提取方法和系统,所述方法包括:获取目标文本;从所述目标文本中选择目标词语;将所述目标文本的信息以及当前选择的目标词语的位置信息输入关键词提取模型,得到该目标词语的去除或保留操作;执行该目标词语的去除或保留操作,得到操作后的目标文本;判断所述操作后的目标文本中是否存在未被执行所述操作的词语;若是,则以所述操作后的目标文本替换所述目标文本,从所述操作后的目标文本中选择其中一个所述未被执行所述操作的词语,以该词语作为所述当前选择的目标词语,重复执行上述输入关键词提取模型至判断的步骤;若否,则将所述操作后的目标文本中的词语确定为所述目标文本的关键词。
-
公开(公告)号:CN111552787B
公开(公告)日:2023-06-30
申请号:CN202010328553.5
申请日:2020-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/289 , G06F40/35 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例公开了一种问答处理方法、装置、设备及存储介质,获取用户问题匹配的候选对话记录集,针对候选对话记录集中每段对话记录,以用户问题替换对话记录的代表问题,得到待分类的文本对象,并通过文本分类模型对文本对象进行分类,得到表征用户问题与对话记录之间的匹配程度文本对象的文本分类结果,根据每个文本对象的文本分类结果,从候选对话记录集选出目标对话记录,并将目标对话记录提供给当前提问用户。
-
公开(公告)号:CN111538906B
公开(公告)日:2023-06-20
申请号:CN202010477510.3
申请日:2020-05-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F21/62 , G06F40/30 , G06N3/0464
Abstract: 本说明书实施例提供一种基于隐私保护的信息推送方法和装置,可以用于在保护用户隐私数据的前提下,基于历史会话中的对象选择序列建立异构图,并根据异构图体现出的推送对象之间的深层关联关系,从多个候选推送对象中确定若干个目标对象进行信息推送。根据一个实施方式,可以获取当前会话中的对象选择序列,并添加目标项构成预测序列,接着,将预测序列中的各项基于异构图确定描述向量,再根据各个描述向量推测目标项的预测向量,之后根据预测向量和各个候选推送对象的描述向量的对比,为目标项确定多个目标对象。该实施方式可以提高信息推送的准确度。
-
公开(公告)号:CN112989785B
公开(公告)日:2021-09-07
申请号:CN202110457512.0
申请日:2021-04-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/194 , G06F40/211 , G06K9/62
Abstract: 本说明书实施例提供了文本向量的获取方法和装置及文本相似度的计算方法和装置。该向量获取方法包括:得到待处理的文本;针对预先设置的至少两种要素中的每一种要素,识别出待处理的文本中属于该要素的字符;利用识别出的属于每一种要素的字符,得到对应于该种要素的向量;将得到的对应于各个要素的各个向量作为所述文本的向量。
-
公开(公告)号:CN113221533A
公开(公告)日:2021-08-06
申请号:CN202110475145.7
申请日:2021-04-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F40/30 , G06F16/35 , G06N20/00 , G06F16/683
Abstract: 本说明书实施例公开了一种针对体验声音的标签提取方法、装置以及设备。方案包括:获取体验声音对应的待处理文本;获取根据训练语句及其重点内容标注训练过的识别模型,其中,识别模型包含用于将训练语句切分字符后并行输入的多个单字符输入节点,以及对应的多个输出节点,在训练的过程中,输入同一训练语句的多个单字符输入节点对应的一部分输出节点被屏蔽;将待处理文本切分字符并对应地输入识别模型,以识别得到待处理文本中的重点语句;根据重点语句,提取标签。
-
公开(公告)号:CN111444319B
公开(公告)日:2020-10-20
申请号:CN202010533381.5
申请日:2020-06-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/216 , G06F40/194 , G06F40/126 , G06F40/284 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本说明书提出了一种文本匹配方法、装置和电子设备,其中,上述方法包括:获取待匹配文本,根据所述待匹配文本得到知识点集合;根据所述知识点集合中的每个知识点进行查询,得到与每个所述知识点对应的一个或多个扩展信息;依次将每个所述知识点对应的扩展信息与所述待匹配文本进行计算,得到相似度集合;根据所述相似度集合与所述知识点集合确定与所述待匹配文本匹配的知识点。通过上述方法可以提高输入文本与知识点之间的匹配的准确度。
-
公开(公告)号:CN111522957A
公开(公告)日:2020-08-11
申请号:CN202010384233.1
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F40/126 , G06F40/205 , G06F40/237 , G06F40/289
Abstract: 本说明书的实施例公开了一种短语分割模型的训练方法和系统,所述方法包括:基于公共知识库获取至少一个目标短语,目标短语包含至少两个词;基于目标短语从公共知识库中获取至少一个第一文本,第一文本包含目标短语;基于第一文本获取非目标短语,非目标短语为第一文本的一部分,且不同于目标短语;将目标短语和第一文本构成的文本对作为正样本,非目标样本和第一文本构成的文本对作为负样本;基于多组正样本和负样本训练得到短语分割模型。
-
公开(公告)号:CN111241412B
公开(公告)日:2020-08-07
申请号:CN202010329694.9
申请日:2020-04-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/36
Abstract: 本说明书实施例公开了一种确定用于信息推荐的图谱的方法、系统、及装置。所述方法包括:获取构建目标图谱的多个节点;所述节点至少包括词语节点,以及知识点节点;若所述节点为词语节点,将该节点对应的词语的向量表示作为该节点的向量表示;若所述节点为知识点节点,基于与所述知识点节点相关的词语的向量表示,确定对应于所述知识点节点的向量表示;对于任意两个节点:基于所述两个节点的类型,确定所述两个节点之间的边权,并将所述边权作为所述两个节点之间的关联关系;基于节点的向量表示,以及节点与节点之间的关联关系,进行至少一轮图聚合迭代,以更新所述图谱中节点的向量表示。
-
公开(公告)号:CN111340218A
公开(公告)日:2020-06-26
申请号:CN202010113810.3
申请日:2020-02-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种训练问题识别模型的方法和系统,所述方法包括:获取多个第一文本和多个第二文本,所述第一文本和所述第二文本分别为问题类文本和非问题类文本;生成模型基于所述第一文本与所述第二文本之间的相似度,为所述第一文本选择满足第一预设条件的至少一个所述第二文本,生成至少一个文本对;将所述文本对输入初始问题识别模型进行训练,训练得到目标问题识别模型。
-
公开(公告)号:CN111309887A
公开(公告)日:2020-06-19
申请号:CN202010114332.8
申请日:2020-02-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06Q30/00
Abstract: 本说明书实施例公开了一种训练文本关键内容提取模型的方法及系统,所述方法包括:获取多个问题答案对,所述问题答案对包括问题和所述问题对应的答案;从所述多个问题答案对中选取目标问题答案对,并选取其他与所述目标问题答案对不同的问题答案对中的答案作为干扰答案;拼接所述目标问题答案对中的目标答案与所述干扰答案得到拼接答案,将所述拼接答案与所述目标问题答案对中的目标问题作为一组训练样本;所述目标答案为与所述目标问题对应的文本关键内容;所述训练样本的标识为所述目标答案在所述拼接答案中的起点和终点位置;基于多组所述训练样本训练得到文本关键内容提取模型。
-
-
-
-
-
-
-
-
-