-
公开(公告)号:CN119294486A
公开(公告)日:2025-01-10
申请号:CN202411297642.2
申请日:2024-09-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/022 , G06N5/04 , G06F16/3329 , G06F16/36
Abstract: 本说明书提供了一种基于医疗知识图谱的LLM模型微调方法及相关设备。该方法包括:获取与目标应用场景相关的知识图谱的结构信息;结构信息包含知识图谱中预定义的多个实体类型和多个实体类型之间的关系;基于结构信息生成与目标应用场景相关的推理任务对应的问题模版和回答路径模版;问题模版包含与问题对象对应的第一实体类型;回答路径模版包含:由与问题对象对应的第一实体类型、与问题答案对应的第二实体类型,以及第一实体类型和第二实体类型之间的关系构成的图谱路径;基于问题模版和回答路径模版生成问答样本对,并基于问答样本对,对预训练完成的LLM基础模型进一步执行微调训练,得到用于执行推理任务的LLM服务模型。
-
公开(公告)号:CN119089042A
公开(公告)日:2024-12-06
申请号:CN202411140267.0
申请日:2024-08-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/906 , G06F18/24 , G06N3/096 , G06N3/094 , G06N3/0455
Abstract: 本说明书实施例提出一种模型训练方法、推荐数据点击率的预测方法和电子设备,上述模型训练方法中,获取目标域样本数据和所述目标样本数据对应的点击率的标签值之后,首先分别通过学生模型中的第一表征解耦模型和第二表征解耦模型,以及已完成参数调整的老师模型中的域分类器,获得域共享表征向量和域独有表征向量,然后根据域共享表征向量和域独有表征向量,通过学生模型中的点击率预测模型获得目标域样本数据对应的点击率的第一预测值,最后,以最小化学生模型的损失函数为目的,调整点击率预测模型、第一表征解耦模型和第二表征解耦模型的参数,其中,学生模型的损失函数包括目标域样本数据对应的点击率的标签值和第一预测值之间的交叉熵。
-
公开(公告)号:CN118567626A
公开(公告)日:2024-08-30
申请号:CN202411045830.6
申请日:2024-07-31
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种任务自主处理方法、装置、存储介质及电子设备,其中,方法包括:获取用户向智能体服务对象所输入的针对目标事务的目标任务,基于目标任务采用任务处理大语言模型进行任务执行代码生成处理得到目标RPA代码,控制智能体服务对象对目标事务执行目标RPA代码,以对目标任务进行任务自主处理。
-
公开(公告)号:CN118095449B
公开(公告)日:2024-08-06
申请号:CN202410518459.4
申请日:2024-04-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/045 , G06N5/046 , G06N5/02 , G06F40/295 , G06F16/36
Abstract: 本说明书提供了一种基于医疗知识图谱的LLM模型推理方法及相关设备。知识图谱包含多个节点和连接节点的边,所述节点代表实体,所述边代表实体之间的关系。该方法包括:获取用户输入的目标文本,并确定所述目标文本中是否包含与所述知识图谱中的节点对应的实体;如果是,则在所述知识图谱中查找出与所述实体相关的子图;其中,所述子图中包含与所述实体对应的节点,以及经由若干条边与该节点连接的多个邻居节点;对所述子图进行特征提取,得到与所述目标文本相关的辅助信息;根据所述辅助信息和所述目标文本构建提示词,并将所述提示词输入至所述LLM模型中,由所述LLM模型基于所述提示词执行逻辑推理,输出与所述目标文本对应的推理结果。
-
公开(公告)号:CN118114675B
公开(公告)日:2024-07-26
申请号:CN202410533245.4
申请日:2024-04-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/295 , G06F16/35 , G06N3/0455 , G06N5/04 , G06F16/36 , G06N5/022
Abstract: 本申请一个或多个实施例提供一种基于大语言模型的医疗命名实体识别方法和装置,该方法包括:由大语言模型在多个不同的第一类提示文本中的各个第一类提示文本的引导下,基于候选实体类别集合对原始文本进行命名实体识别,得到命名实体识别结果;基于命名实体识别结果,确定原始文本中的各个目标命名实体及其对应的至少一个候选实体类别,并将其转化为与目标命名实体对应的至少一个用于指示与命名实体对应的实体类别的观点;获取与目标命名实体的定义相关的知识文本;由大语言模型从知识文本中抽取与各个观点对应的论据,并进一步基于论据,评估各个观点的正确度;将正确度最高的目标观点指示的候选实体类别确定为与目标命名实体对应的实体类别。
-
公开(公告)号:CN118195011A
公开(公告)日:2024-06-14
申请号:CN202410524696.1
申请日:2024-04-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例提供一种基于知识图谱的医疗LLM模型推理方法及装置。该方法包括:对由用户提供的用户数据进行内容识别,并基于内容识别结果从用户数据中提取关键词;识别提取出的关键词中包含的实体以及实体之间的关系,并基于识别出的实体以及所述实体之间的关系生成用于构建与用户对应的个性化的用户知识图谱的个性化的图谱元数据;基于所述个性化的图谱元数据构建与用户对应的个性化的用户知识图谱;响应于获取到的由用户输入的目标文本,将所述目标文本进一步输入至医疗LLM模型,以由医疗LLM模型至少将所述用户知识图谱作为知识库对所述目标文本进行逻辑推理,并输出与目标文本对应的推理结果。
-
公开(公告)号:CN118132729A
公开(公告)日:2024-06-04
申请号:CN202410519666.1
申请日:2024-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06N5/022 , G16H10/00 , G06F40/30
Abstract: 本说明书实施例提供一种基于医疗知识图谱的答案生成方法及装置,可以结合知识图谱为用户问题生成答案。具体地,从用户问题中识别出候选实体,然后根据候选实体从知识图谱中获取相应的候选三元组集。进一步地,利用预先训练的判别模型判断召回的三元组集是否可以用于用户问题对应的信息,并根据判别结果为用户问题生成相应答案。如此,可以灵活利用知识图谱数据,提高所生成的答案的准确性。
-
公开(公告)号:CN118132681A
公开(公告)日:2024-06-04
申请号:CN202410547438.5
申请日:2024-04-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种医疗知识图谱查询中对多个查询结果的排序方法和装置。方法包括:根据查询请求从医疗知识图谱中提取目标子图;其中,目标子图包括多个类别的输入节点和多个结果节点,输入节点对应于查询请求中携带的输入医疗实体,结果节点对应于医疗相关查询结果;确定各个类别的反映其通用贡献的第一指标分数,第一指标分数与对应类别中各输入节点在医疗知识图谱中关联的结果节点数目负相关;针对任意的目标结果节点,根据各个类别的输入节点中与该目标结果节点的关联节点数目,确定各个类别的反映其对该目标结果节点贡献度的第二指标分数;根据各个类别的第一指标分数和第二指标分数,确定目标结果节点的排序分数。
-
公开(公告)号:CN118095450A
公开(公告)日:2024-05-28
申请号:CN202410521286.1
申请日:2024-04-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/045 , G06N5/046 , G06N5/02 , G06F40/295 , G06F16/36
Abstract: 本说明书提供了一种基于知识图谱的医疗LLM模型推理方法及相关设备。知识图谱包含多个节点和连接节点的边,节点代表实体,边代表实体之间的关系。该方法包括:获取用户输入的目标文本,确定目标文本中是否包含与知识图谱中的节点对应的实体;如果是,则在知识图谱中查找出与所述实体相关的子图;获取保存的用户在所述目标文本之前输入的历史文本,并基于历史文本中包含的用户信息,对子图中包含的属性与所述用户信息不匹配的边进行裁剪,得到目标子图;根据目标子图和目标文本构建提示词,并将所述提示词输入至第一LLM模型中,由所述第一LLM模型基于所述提示词执行逻辑推理,并输出与所述目标文本对应的推理结果。
-
公开(公告)号:CN117744631A
公开(公告)日:2024-03-22
申请号:CN202311688510.8
申请日:2023-12-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/211 , G06F40/253 , G06F18/214
Abstract: 本说明书实施例提供一种文本预测的方法及装置,在基于大模型进行文本预测过程中,为当前词预测下文时,根据当前业务请求及历史生成文本,确定将当前词作为起始词的若干个预取词组,然后对各个预取词组并行执行前向预测,从而确定基于若干个预取词组匹配到的最长词序列,根据最长词序列确定相应的若干输出词作为当前词的下文。如此,可以通过预取和并行计算提高词预测速率。
-
-
-
-
-
-
-
-
-