基于持续预训练的语言模型训练方法和装置

    公开(公告)号:CN117875449A

    公开(公告)日:2024-04-12

    申请号:CN202410048420.0

    申请日:2024-01-11

    Abstract: 本说明书的实施例提供了一种基于持续预训练的语言模型训练方法和装置。在该基于持续预训练的语言模型训练方法中,利用当前软提示生成模型得到与当前领域的各个当前训练样本对应的软提示特征;进而利用当前语言模型根据各个文本数据和对应的软提示特征得到各个文本数据对应于当前领域的隐特征;再基于所得到的各个文本数据对应于当前领域的隐特征与相应基于所述初始当前语言模型而得到的对应于上一领域的隐特征之间的差异,确定跨域损失值;在不满足当前领域的训练结束条件时根据跨域损失值调整当模型参数;在满足当前领域的训练结束条件时继续利用下一领域的训练样本集重复执行上述模型训练过程,直至满足持续预训练的训练结束条件。

    资源预测方法和装置
    102.
    发明授权

    公开(公告)号:CN113485833B

    公开(公告)日:2024-02-06

    申请号:CN202110780138.8

    申请日:2021-07-09

    Inventor: 李龙飞 周俊

    Abstract: 本公开披露了一种资源预测方法和装置。所述方法包括:接收集群的待处理任务;从预设的多种资源预测方式中选择与所述待处理任务对应的资源预测方式;根据所述待处理任务对应的资源预测方式,对所述待处理任务所需的目标资源进行预测;其中,所述多种资源预测方式包括第一资源预测方式和第二资源预测方式,所述第一资源预测方式基于预先训练的机器学习模型对所述目标资源进行预测,所述第二资源预测方式基于所述集群在滑动窗口期内的任务的资源使用数据对所述目标资源进行预测。

    模型训练、信息推荐方法和装置
    103.
    发明公开

    公开(公告)号:CN117370652A

    公开(公告)日:2024-01-09

    申请号:CN202311303448.6

    申请日:2023-10-08

    Abstract: 本说明书的实施例提供了一种模型训练、信息推荐方法和装置。在该模型训练方法中,通过在训练过程中引入样本分组模型和权重计算模型,根据当前训练样本经过待优化模型的输出和对应的标签确定各个当前训练样本的状态。再分别利用样本分组模型和权重计算模型确定各个当前训练样本所属的分布类别和对应的权重。进而,基于当前训练样本经过待优化模型的输出和对应的标签以及对应的权重确定损失值,以调整待优化模型的模型参数;基于各个当前训练样本所属的分布类别和对应的权重确定相应的奖励值,以调整样本分组模型和权重计算模型的模型参数。

    基于Motif保持的用户表征学习方法、用户信用风险预测方法及装置

    公开(公告)号:CN117196819A

    公开(公告)日:2023-12-08

    申请号:CN202310983611.1

    申请日:2023-08-04

    Abstract: 本说明书实施例提供基于Motif保持的用户表征学习方法、用户信用风险预测方法及装置。在进行用户表征学习时,根据用户社交关系图构建至少一个Motif图;对目标用户的用户初始表征分别执行用户社交关系图和各个Motif图下的图表征学习来学习出目标用户在各个图下的用户表征。随后,使用用户社交关系图下的用户表征来对各个Motif图下的用户表征进行表征增强,以得到各个Motif图下的经过表征增强后的用户表征;并且对各个Motif图下的经过表征增强后的用户表征进行表征融合,得到目标用户的最终用户表征。

    一种基于样本模式增广的机器学习模型训练方法及系统

    公开(公告)号:CN116842462A

    公开(公告)日:2023-10-03

    申请号:CN202310798061.6

    申请日:2023-06-30

    Abstract: 本说明书实施例公开了一种基于样本模式增广的机器学习模型训练方法及系统,涉及人工智能技术领域,技术要点包括:利用真实样本以及增广样本对目标模型进行一轮以上迭代训练;其中的一轮迭代训练包括:通过目标模型分别处理真实样本和增广样本的特征值,得到对应的第一输出;通过滑动平均模型至少处理增广样本的特征值,得到对应的第二输出;其中,滑动平均模型的模型参数基于两轮以上历史迭代训练中的目标模型的模型参数获得;调整目标模型的模型参数,以减小真实样本对应的第一输出与对应标签之间的差异,同时减小增广样本对应的第一输出与第二输出之间的差异。

    一种基于表征泛化的模型训练方法及系统

    公开(公告)号:CN116842461A

    公开(公告)日:2023-10-03

    申请号:CN202310797569.4

    申请日:2023-06-30

    Abstract: 本说明书实施例公开了一种基于表征泛化的模型训练方法及系统,其技术要点包括:获取测试组中的第一样本,以及对照组中的第二样本;其中,样本包括特征值及标签;通过因果效应预估模型分别处理第一样本的特征值以及第二样本的特征值,得到对应的中间结果以及效应输出;通过协同分类模型分别处理第一样本以及第二样本对应的中间结果,得到对应的分类输出;所述分类输出反映对应的中间结果属于测试组的概率和/或属于对照组的概率;调整因果效应预估模型的模型参数,以减小效应输出与对应标签之间的差异,同时均衡中间结果属于测试组的概率和属于对照组的概率。

    因果效应评估方法和系统
    108.
    发明公开

    公开(公告)号:CN116720543A

    公开(公告)日:2023-09-08

    申请号:CN202310444964.4

    申请日:2023-04-23

    Abstract: 本说明书提供的因果效应评估方法和系统,在获取目标对象的对象数据后,将对象数据输入评估模型,获得目标对象在预设干预措施下的目标因果效应值,该评估模型对对象数据与训练数据之间的分布偏移不敏感,以及输出目标因果效应值;该方案可以针对因果效应直接建模,而且建模后得到的评估模型对对象数据与训练数据之间的分布偏移不敏感,从而就可以将该分布偏移造成的评估结果误差控制在预设范围内,因此,可以提升因果效应评估的准确率。

    对象推荐模型训练方法、推荐对象确定方法及装置

    公开(公告)号:CN116304337A

    公开(公告)日:2023-06-23

    申请号:CN202310274863.7

    申请日:2023-03-15

    Abstract: 本说明书实施例提供对象推荐模型训练方法、推荐对象确定方法及装置。在每轮模型训练时,确定用户特征的用户特征嵌入表征、目标对象和用户交互对象的对象特征嵌入表征。从用户交互对象的对象特征嵌入表征中解耦出用户兴趣嵌入表征和用户从众嵌入表征;分别根据目标对象的对象特征嵌入表征以及用户特征嵌入表征与用户兴趣嵌入表征和用户从众嵌入表征之间的耦合结果确定目标对象表征、用户兴趣表征和用户从众表征;根据基于用户兴趣表征、用户从众表征与目标对象表征确定出的用户兴趣预测结果和用户从众预测结果调整对象推荐模型的模型参数。

Patent Agency Ranking