-
公开(公告)号:CN120029673A
公开(公告)日:2025-05-23
申请号:CN202510389327.0
申请日:2025-03-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F9/318 , G06N5/04 , G06N3/045 , G06N3/08 , G06F18/241
Abstract: 本说明书实施例提供一种目标领域下的大模型微调方法和装置。方法包括:获取多个样本构成的训练数据集;任一样本包括输入文本和期望响应,所述输入文本包括所述目标领域的请求任务和执行所述请求任务的指令;所述期望响应包括标签思考路径、基于所述标签思考路径和检索到的若干文档得到的标签回答;所述标签思考路径包括所述请求任务的概念分类、基于所述概念分类确定的关联信息;利用所述训练数据集对大模型进行指令微调,以得到目标领域下的大模型。能够进一步提高大模型在垂直领域上的表现。
-
公开(公告)号:CN118114785A
公开(公告)日:2024-05-31
申请号:CN202311867081.0
申请日:2023-12-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06N5/04 , G06N5/022 , G06F16/2452 , G06F16/242 , G06F18/22
Abstract: 本说明书实施例提供一种训练目标模型、生成结构化语句的方法及装置,在训练目标模型的方法中,先基于预设的推理库,利用参数量较大的大语言模型,构建训练样本集。该训练样本集可以包括,第一训练样本和第二训练样本,其中,第一训练样本包括第一提示文本和作为其输出标签的第一回答文本,第一提示文本包括自然语言的第一查询语句和类比推理示例,第一回答文本包括第一结构化语句。第二训练样本包括,第二提示文本和作为其输出标签的第二回答文本,第二提示文本包括第一查询语句和类比推理示例,第二回答文本包括第一推理语句。接着,利用该训练样本集来训练参数量较少的目标模型。
-
公开(公告)号:CN113590936B
公开(公告)日:2023-11-14
申请号:CN202110753151.4
申请日:2021-07-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/909 , G06Q30/0207 , G06Q30/0251 , G06Q30/0601
Abstract: 本说明书实施例提供一种信息推送的方法,通过获取基于第一用户的当前状态信息,然后基于当前状态信息提取第一用户的多个业务特征,接着,检测预先构建的意图网格中,与第一用户的多个业务特征相匹配的特征组合,其中,意图网格用于描述预定特征组合与意图类别之间的对应关系,意图网格基于对各个特征组合与意图类别进行关联分析确定,单个特征组合对应与其关联性最强的一个或多个意图类别,进一步根据检测结果,向所述第一用户进行信息推送。该实施方式使得信息推送更加精准有效。
-
公开(公告)号:CN116401455A
公开(公告)日:2023-07-07
申请号:CN202310362259.X
申请日:2023-03-31
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 杨丹
IPC: G06F16/9535 , G06F16/9537 , G06F16/36 , G06F16/33 , G06F40/295 , G06N3/08 , G06N3/0499
Abstract: 本说明书实施例提供链接关系预测方法、实体知识图谱生成方法及装置。在针对实体知识图谱进行链接关系预测时,获取实体知识图谱中的实体节点的实体表征。随后,使用链接关系预测模型来根据实体节点的实体表征,在实体节点之间进行链接关系预测。所使用的链接关系预测模型通过使用实体节点的实体表征来执行基于多任务的模型预测过程训练出,所执行的多任务包括链接关系预测任务和预测阈值学习任务。
-
公开(公告)号:CN118674055A
公开(公告)日:2024-09-20
申请号:CN202410942631.9
申请日:2024-04-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/045 , G06N5/046 , G06N5/02 , G06F40/295 , G06F16/36
Abstract: 本说明书提供了一种基于医疗知识图谱的LLM模型推理方法及相关设备。知识图谱包含多个节点和连接节点的边,所述节点代表实体,所述边代表实体之间的关系。该方法包括:获取用户输入的目标文本,并确定所述目标文本中是否包含与所述知识图谱中的节点对应的实体;如果是,则在所述知识图谱中查找出与所述实体相关的子图;其中,所述子图中包含与所述实体对应的节点,以及经由若干条边与该节点连接的多个邻居节点;对所述子图进行特征提取,得到与所述目标文本相关的辅助信息;根据所述辅助信息和所述目标文本构建提示词,并将所述提示词输入至所述LLM模型中,由所述LLM模型基于所述提示词执行逻辑推理,输出与所述目标文本对应的推理结果。
-
公开(公告)号:CN118378099A
公开(公告)日:2024-07-23
申请号:CN202410612144.6
申请日:2024-05-16
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种针对自然语言处理模型的数据召回方法及装置,针对待通过自然语言模型处理的第一信息,可以对其进行数据召回的预处理,以将召回的文本与第一信息一起经由自然语言处理模型进行处理,得到相应业务处理结果。在数据召回过程中,可以先从数据库中检索与第一信息相匹配的若干文本作为候选文本,然后利用预先训练的效用模型对各个候选文本进行有效性评估,以得到各个候选文本分别对应的各个效用分数,再针对各个候选文本,分别基于相应相似度和效用分数的融合得到相应的融合分数,并根据各个融合分数从候选文本中筛选出目标文本作为召回数据。如此,可以有效节约计算成本。
-
公开(公告)号:CN118133957A
公开(公告)日:2024-06-04
申请号:CN202410545062.4
申请日:2024-04-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/022 , G06F16/36 , G06F40/194 , G06F40/30 , G16H50/70
Abstract: 本说明书实施例提供一种医疗知识图谱的数据扩展方法及装置,在针对知识图谱进行数据扩展时,可以针对当前实体词,获取其在候选语料库中对应的语料数据集,并利用不同丰富程度的提示信息和相应的连接关系,经由大模型从语料数据集中召回多个候选实体词加入候选词集,然后,对候选词集中各个候选实体词进行打分,基于打分结果确定候选实体词作为目标实体词,目标实体词可与当前实体词、相应连接关系构成扩展三元组,用于知识图谱扩展。如此,可以提高知识图谱扩展数据召回的准确性和效率。
-
公开(公告)号:CN118095449A
公开(公告)日:2024-05-28
申请号:CN202410518459.4
申请日:2024-04-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/045 , G06N5/046 , G06N5/02 , G06F40/295 , G06F16/36
Abstract: 本说明书提供了一种基于医疗知识图谱的LLM模型推理方法及相关设备。知识图谱包含多个节点和连接节点的边,所述节点代表实体,所述边代表实体之间的关系。该方法包括:获取用户输入的目标文本,并确定所述目标文本中是否包含与所述知识图谱中的节点对应的实体;如果是,则在所述知识图谱中查找出与所述实体相关的子图;其中,所述子图中包含与所述实体对应的节点,以及经由若干条边与该节点连接的多个邻居节点;对所述子图进行特征提取,得到与所述目标文本相关的辅助信息;根据所述辅助信息和所述目标文本构建提示词,并将所述提示词输入至所述LLM模型中,由所述LLM模型基于所述提示词执行逻辑推理,输出与所述目标文本对应的推理结果。
-
公开(公告)号:CN120068851A
公开(公告)日:2025-05-30
申请号:CN202510126462.6
申请日:2025-01-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/279 , G06N5/04
Abstract: 本说明书实施例提供了一种对大语言模型进行微调的方法,包括:确定第一问题,和针对所述第一问题的第一答案,其中,第一答案根据文档集合的内容经第一推理得到,第一推理包括,文档过滤、文档组合以及递推推理;将第一微调指令输入大语言模型,第一微调指令包括第一问题,文档集合,并指示大语言模型进行逐步推理,输出以第一标记标注的推理过程和以第二标记标注的推理答案;根据大语言模型输出的推理过程和推理答案,以及监督文本,对大语言模型进行微调,监督文本包括,以第一标记标注的第一推理文本,和以第二标记标注的第一答案。
-
公开(公告)号:CN119851895A
公开(公告)日:2025-04-18
申请号:CN202411934855.1
申请日:2024-12-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G16H40/20 , G06F40/295 , G06F16/3329 , G06F16/334 , G06N5/04 , G06N3/0455 , G06N3/045 , G06N3/0464 , G06N3/09 , G06N3/084 , G06N3/088 , G06N3/0895
Abstract: 本申请一个或多个实施例提供一种智能导诊方法和装置,该方法包括:获取用于导诊咨询的查询文本,并针对查询文本进行命名实体识别,以从查询文本中识别出命名实体及其类型;如果识别出的命名实体包括疾病特征,则将疾病特征输入训练完成的预测模型,由预测模型基于疾病特征预测对应的疾病,并基于图,确定与疾病对应的科室;图中的节点包括代表就诊特征的节点和代表科室的节点;图中的各条边连接的节点代表的就诊特征对应于这条边连接的节点代表的科室;就诊特征至少包括疾病;如果识别出的命名实体包括就诊特征,则基于图,确定与就诊特征对应的科室;将科室输入导诊大模型,由导诊大模型基于科室进行推理以生成答案文本。
-
-
-
-
-
-
-
-
-