-
公开(公告)号:CN119294486A
公开(公告)日:2025-01-10
申请号:CN202411297642.2
申请日:2024-09-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/022 , G06N5/04 , G06F16/3329 , G06F16/36
Abstract: 本说明书提供了一种基于医疗知识图谱的LLM模型微调方法及相关设备。该方法包括:获取与目标应用场景相关的知识图谱的结构信息;结构信息包含知识图谱中预定义的多个实体类型和多个实体类型之间的关系;基于结构信息生成与目标应用场景相关的推理任务对应的问题模版和回答路径模版;问题模版包含与问题对象对应的第一实体类型;回答路径模版包含:由与问题对象对应的第一实体类型、与问题答案对应的第二实体类型,以及第一实体类型和第二实体类型之间的关系构成的图谱路径;基于问题模版和回答路径模版生成问答样本对,并基于问答样本对,对预训练完成的LLM基础模型进一步执行微调训练,得到用于执行推理任务的LLM服务模型。
-
公开(公告)号:CN119089042A
公开(公告)日:2024-12-06
申请号:CN202411140267.0
申请日:2024-08-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/906 , G06F18/24 , G06N3/096 , G06N3/094 , G06N3/0455
Abstract: 本说明书实施例提出一种模型训练方法、推荐数据点击率的预测方法和电子设备,上述模型训练方法中,获取目标域样本数据和所述目标样本数据对应的点击率的标签值之后,首先分别通过学生模型中的第一表征解耦模型和第二表征解耦模型,以及已完成参数调整的老师模型中的域分类器,获得域共享表征向量和域独有表征向量,然后根据域共享表征向量和域独有表征向量,通过学生模型中的点击率预测模型获得目标域样本数据对应的点击率的第一预测值,最后,以最小化学生模型的损失函数为目的,调整点击率预测模型、第一表征解耦模型和第二表征解耦模型的参数,其中,学生模型的损失函数包括目标域样本数据对应的点击率的标签值和第一预测值之间的交叉熵。
-
公开(公告)号:CN114971742B
公开(公告)日:2024-10-22
申请号:CN202210756065.3
申请日:2022-06-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/0203 , G06Q30/0207 , G06Q30/0601
Abstract: 本说明书实施例提供一种用户分类模型的训练、用户分类处理的方法及装置,用户分类模型包括图神经网络、第一分类网络和第二分类网络,该用户分类模型的训练方法包括:获取样本用户,其具有标签数据;在用户关系网络图中,以样本用户为目标节点,利用图神经网络对目标节点进行聚合;将所得的用户表征输入第一分类网络和第二分类网络,得到第一预测值和第二预测值,第一预测值表征样本用户属于由第一类用户和第二类用户构成的第一用户群的概率,第二预测值表征样本用户属于由第二类用户和第三类用户构成的第二用户群的概率;基于第一预测值和/或第二预测值,及标签数据,确定当前损失值;以最小化当前损失值为目标,调整用户分类模型的参数。
-
公开(公告)号:CN115034327B
公开(公告)日:2024-08-13
申请号:CN202210710860.9
申请日:2022-06-22
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/241 , G06F18/25 , G06N3/0464 , G06N3/084 , G06Q40/04 , G06Q10/0635
Abstract: 本说明书实施例公开了一种外部数据应用、用户识别的方法、装置和设备,外部数据应用方法可以将目标对象的来自内部数据源的特征输入内部模型得到内部预测结果;将目标对象的来自不同外部数据源的特征分别输入对应的外部模型得到目标对象的至少一个外部预测结果;对所述内部预测结果和所述至少一个外部预测结果进行融合得到所述目标对象的最终预测结果,且融合时将断流外部数据源对应的外部预测结果替换为所述内部预测结果。
-
公开(公告)号:CN118114675B
公开(公告)日:2024-07-26
申请号:CN202410533245.4
申请日:2024-04-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/295 , G06F16/35 , G06N3/0455 , G06N5/04 , G06F16/36 , G06N5/022
Abstract: 本申请一个或多个实施例提供一种基于大语言模型的医疗命名实体识别方法和装置,该方法包括:由大语言模型在多个不同的第一类提示文本中的各个第一类提示文本的引导下,基于候选实体类别集合对原始文本进行命名实体识别,得到命名实体识别结果;基于命名实体识别结果,确定原始文本中的各个目标命名实体及其对应的至少一个候选实体类别,并将其转化为与目标命名实体对应的至少一个用于指示与命名实体对应的实体类别的观点;获取与目标命名实体的定义相关的知识文本;由大语言模型从知识文本中抽取与各个观点对应的论据,并进一步基于论据,评估各个观点的正确度;将正确度最高的目标观点指示的候选实体类别确定为与目标命名实体对应的实体类别。
-
公开(公告)号:CN118211729A
公开(公告)日:2024-06-18
申请号:CN202410417783.7
申请日:2024-04-08
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种时间序列预测方法及装置,在进行时序预测过程中,考虑到所利用的历史时序数据可能存在缺失从而导致偏差,可以对粗粒度历史时间序列和细粒度历史时间序列分别进行处理,并基于对预测的细粒度时间序列的统计确定具有可比性的粗粒度时序数值。其中,利用粗粒度历史时间序列可以预测粗粒度时序。而粗粒度时序中,单个时间区间(如对应单个时间节点)可以对应多个细粒度时间段,因此,还可以利用细粒度历史时间序列预测粗粒度时序下的细粒度时序分布,并通过分配比例进行描述。从而,可以按照所确定的分配比例,以及粗粒度预测结果,进行细粒度时间序列的预测。如此,可以提高时序预测结果的准确性。
-
公开(公告)号:CN118195011A
公开(公告)日:2024-06-14
申请号:CN202410524696.1
申请日:2024-04-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例提供一种基于知识图谱的医疗LLM模型推理方法及装置。该方法包括:对由用户提供的用户数据进行内容识别,并基于内容识别结果从用户数据中提取关键词;识别提取出的关键词中包含的实体以及实体之间的关系,并基于识别出的实体以及所述实体之间的关系生成用于构建与用户对应的个性化的用户知识图谱的个性化的图谱元数据;基于所述个性化的图谱元数据构建与用户对应的个性化的用户知识图谱;响应于获取到的由用户输入的目标文本,将所述目标文本进一步输入至医疗LLM模型,以由医疗LLM模型至少将所述用户知识图谱作为知识库对所述目标文本进行逻辑推理,并输出与目标文本对应的推理结果。
-
公开(公告)号:CN118132681A
公开(公告)日:2024-06-04
申请号:CN202410547438.5
申请日:2024-04-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种医疗知识图谱查询中对多个查询结果的排序方法和装置。方法包括:根据查询请求从医疗知识图谱中提取目标子图;其中,目标子图包括多个类别的输入节点和多个结果节点,输入节点对应于查询请求中携带的输入医疗实体,结果节点对应于医疗相关查询结果;确定各个类别的反映其通用贡献的第一指标分数,第一指标分数与对应类别中各输入节点在医疗知识图谱中关联的结果节点数目负相关;针对任意的目标结果节点,根据各个类别的输入节点中与该目标结果节点的关联节点数目,确定各个类别的反映其对该目标结果节点贡献度的第二指标分数;根据各个类别的第一指标分数和第二指标分数,确定目标结果节点的排序分数。
-
公开(公告)号:CN118095450A
公开(公告)日:2024-05-28
申请号:CN202410521286.1
申请日:2024-04-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/045 , G06N5/046 , G06N5/02 , G06F40/295 , G06F16/36
Abstract: 本说明书提供了一种基于知识图谱的医疗LLM模型推理方法及相关设备。知识图谱包含多个节点和连接节点的边,节点代表实体,边代表实体之间的关系。该方法包括:获取用户输入的目标文本,确定目标文本中是否包含与知识图谱中的节点对应的实体;如果是,则在知识图谱中查找出与所述实体相关的子图;获取保存的用户在所述目标文本之前输入的历史文本,并基于历史文本中包含的用户信息,对子图中包含的属性与所述用户信息不匹配的边进行裁剪,得到目标子图;根据目标子图和目标文本构建提示词,并将所述提示词输入至第一LLM模型中,由所述第一LLM模型基于所述提示词执行逻辑推理,并输出与所述目标文本对应的推理结果。
-
公开(公告)号:CN117909592A
公开(公告)日:2024-04-19
申请号:CN202410124852.5
申请日:2024-01-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F18/22 , G06F18/25 , G06N5/04
Abstract: 本说明书实施例提供一种序列推荐方法和装置。方法包括:获取目标用户的历史交互的各个对象按照时间先后顺序构成的历史对象序列;根据历史对象序列,构建目标提示信息;用于提示向所述目标用户推荐目标对象及其理由;将目标提示信息输入第一语言模型,通过第一语言模型输出目标推荐理由;基于目标推荐理由的文本编码向量,确定目标用户的用户表征;基于对象集合中的任一待推荐对象的文本编码向量,确定该待推荐对象的对象表征;将用户表征和对象集合中的任一待推荐对象的对象表征输入匹配模型,得到二者的匹配分数,并根据匹配分数,从对象集合中选择一个待推荐对象作为向目标用户推荐的目标对象。能够提升推荐的准确性。
-
-
-
-
-
-
-
-
-