-
公开(公告)号:CN118427366A
公开(公告)日:2024-08-02
申请号:CN202410572352.8
申请日:2024-05-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/383 , G06F18/214
Abstract: 本说明书提供一种检索方法、检索模型的训练方法、系统,包括:获得目标搜索词,根据目标搜索词生成目标提示信息,其中,目标提示信息指示与目标搜索词对应的目标对象检索任务,根据预先训练的检索模型对目标提示信息进行预测,得到并输出与目标搜索词对应的目标检索对象,其中,检索模型是基于第一样本数据对目标大语言模型进行训练得到的,相对而言,本说明书提供的技术方案充分利用了大语言模型的强大能力,因此,可以既快速又深入地学习用户的输入和上下文,以快速且准确的理解搜索用户的需求和意图的能力,从而确定更加符合用户期望的检索结果,提升了用户的体验和满意度。
-
公开(公告)号:CN117407587A
公开(公告)日:2024-01-16
申请号:CN202311370218.1
申请日:2023-10-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F18/22 , G06F18/25
Abstract: 本说明书实施例提供相关性预测方法、相关性预测模型训练方法及装置和搜索系统。在进行相关性预测时,经由表征生成层生成目标查询、目标项目、项目行为邻居集和查询行为邻居集的局部嵌入表示和全局嵌入表示;并经由表征融合层,将目标查询、目标项目、项目行为邻居集和查询行为邻居集的局部嵌入表示分别和对应的全局嵌入表示进行表征融合。经由相似度预测层,根据目标查询和目标项目的全局嵌入表示和各自的表征融合结果预测语义相似度,以及根据项目行为邻居集和查询行为邻居集的全局嵌入表示和各自的表征融合结果预测行为邻居相似度。然后,经由相关性预测层,根据语义相似度和行为邻居相似度预测目标查询和目标项目之间的相关性。
-
公开(公告)号:CN111737595B
公开(公告)日:2024-02-06
申请号:CN202010594333.7
申请日:2020-06-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9536 , G06F40/242 , G06F40/247
Abstract: 本说明书实施例提供一种候选词推荐方法、词库排序模型训练方法及装置。所述方法包括:接收用户发送的搜索请求,所述搜索请求中包含搜索词;根据所述搜索词从第一词库中选取与所述搜索词相关的第一待推荐候选词集合;根据所述搜索词从至少一个第二词库中选取与所述搜索词相关的第二待推荐候选词集合;采用第一词库排序模型,对所述第一待推荐候选词集合进行排序,得到第一排序结果;采用第二词库排序模型,对所述第二待推荐候选词集合进行排序,得到第二排序结果;根据所述第一排序结果与所述第二排序结果,进行合并排序;基于合并排序后的结果,进行候选词推荐。
-
公开(公告)号:CN116401453A
公开(公告)日:2023-07-07
申请号:CN202310355474.7
申请日:2023-03-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/9536 , G06F16/9537 , G06F16/332 , G06F16/33 , G06F16/35 , G06F18/2415 , G06F40/30 , G06N3/09
Abstract: 本说明书的实施例提供了一种用于训练长尾数据表征模型的方法和装置。在该用于训练长尾数据表征模型的方法中,循环执行下述模型训练过程:将当前训练样本集的头部子图数据和尾部子图数据分别提供给当前长尾数据表征模型的第一图神经网络和第二图神经网络,得到当前训练样本集的头部历史查询数据节点和尾部历史查询数据节点分别对应的特征表征;针对各个尾部历史查询数据节点,在当前训练样本集中确定该尾部历史查询数据节点的匹配头部历史查询数据节点;根据由尾部历史查询数据节点和对应的匹配头部历史查询数据节点组成的正样本对,确定知识迁移对比损失值;响应于不满足训练结束条件,基于知识迁移对比损失值调整当前长尾数据表征模型的参数。
-
公开(公告)号:CN111737595A
公开(公告)日:2020-10-02
申请号:CN202010594333.7
申请日:2020-06-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9536 , G06F40/242 , G06F40/247
Abstract: 本说明书实施例提供一种候选词推荐方法、词库排序模型训练方法及装置。所述方法包括:接收用户发送的搜索请求,所述搜索请求中包含搜索词;根据所述搜索词从第一词库中选取与所述搜索词相关的第一待推荐候选词集合;根据所述搜索词从至少一个第二词库中选取与所述搜索词相关的第二待推荐候选词集合;采用第一词库排序模型,对所述第一待推荐候选词集合进行排序,得到第一排序结果;采用第二词库排序模型,对所述第二待推荐候选词集合进行排序,得到第二排序结果;根据所述第一排序结果与所述第二排序结果,进行合并排序;基于合并排序后的结果,进行候选词推荐。
-
公开(公告)号:CN111553145A
公开(公告)日:2020-08-18
申请号:CN202010661067.5
申请日:2020-07-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/258 , G06Q30/02 , G06N3/08
Abstract: 本说明书提出了一种主题生成方法、装置和电子设备。其中,所述方法包括:确定标签集合,所述标签集合中包含多个标签;确定所述多个标签分别对应的人群分布特征;将所述多个标签分别对应的人群分布特征输入到深度网络模型中,以基于所述深度网络模型中的监督信息对所述多个标签对应的人群分布特征进行更新;根据不同标签之间人群分布特征的相似度,从所述多个标签中选取标签并基于所选取标签生成主题。通过本发明实施例方案能够能够确保所生成的主题符合人群分布逻辑,且可解释性较强。
-
公开(公告)号:CN111222052B
公开(公告)日:2020-08-11
申请号:CN202010329527.4
申请日:2020-04-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535
Abstract: 公开一种搜索方法及装置、电子设备,该方法可以包括:获取用户输入的搜索数据样本,在用户的每次字符输入时为用户推荐的搜索模式,以及与所述搜索数据样本对应的搜索时长;将所述搜索数据样本中的输入字符作为状态,在用户输入该输入字符时为用户推荐的搜索模式作为动作,生成状态动作对,并将所述搜索时长作为与所述状态动作对对应的回报,对预设的强化学习模型进行强化学习训练,得到搜索决策模型;响应于用户输入的搜索数据,将用户每次输入的输入字符输入训练完成的所述搜索模式决策模型进行推荐计算,并将当前的搜索模式切换为所述搜索模式决策模型输出的搜索模式,以使用户基于所述搜索模式决策模型输出的搜索模式执行搜索。
-
公开(公告)号:CN118245579A
公开(公告)日:2024-06-25
申请号:CN202410231534.9
申请日:2024-02-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/335 , G06N20/00
Abstract: 本说明书实施例提供了用于对会话模型进行训练的方法及装置。在该方法中,获取历史会话数据;按照以下方式进行模型训练,直至满足训练结束条件:从历史会话数据中筛选出目标回答语句中的目标被选回答语句所属的会话序列,历史会话序列由目标回答语句以及在目标回答语句生成之前按照时间顺序生成的用于推导出目标回答语句的各个查询语句和回答语句构成,未来会话序列由在目标回答语句生成之后按照时间顺序生成的由目标被选回答语句推导出的各个查询语句和回答语句构成;将历史会话序列和会话序列分别输入给第一会话模型和第二会话模型,以针对目标回答语句进行预测;以及结合第一会话模型和第二会话模型的预测结果进行模型调整。
-
公开(公告)号:CN114896983A
公开(公告)日:2022-08-12
申请号:CN202210513283.4
申请日:2022-05-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/30 , G06F40/295 , G06N20/00 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例公开了一种模型训练方法、文本处理方法、装置和计算机设备。所述模型训练方法包括:获取原始文本、正样本和负样本,正样本和负样本为原始文本的改写文本;通过编码器,确定原始文本对应的第一分布参数、正样本对应的第二分布参数和负样本对应的第三分布参数,第一分布参数用于限定第一语义分布,第二分布参数用于限定第二语义分布,第三分布参数用于限定第三语义分布;根据第一分布参数、第二分布参数和第三分布参数,通过损失函数优化编码器的模型参数,所述损失函数包括第一项,所述第一项用于约束第一语义分布与第二语义分布之间的相似程度大于第一语义分布与第三语义分布之间的相似程度。本说明书实施例可以提高模型训练效果。
-
公开(公告)号:CN111553145B
公开(公告)日:2020-10-16
申请号:CN202010661067.5
申请日:2020-07-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/258 , G06Q30/02 , G06N3/08
Abstract: 本说明书提出了一种主题生成方法、装置和电子设备。其中,所述方法包括:确定标签集合,所述标签集合中包含多个标签;确定所述多个标签分别对应的人群分布特征;将所述多个标签分别对应的人群分布特征输入到深度网络模型中,以基于所述深度网络模型中的监督信息对所述多个标签对应的人群分布特征进行更新;根据不同标签之间人群分布特征的相似度,从所述多个标签中选取标签并基于所选取标签生成主题。通过本发明实施例方案能够能够确保所生成的主题符合人群分布逻辑,且可解释性较强。
-
-
-
-
-
-
-
-
-