基于持续预训练的语言模型训练方法和装置

    公开(公告)号:CN117875449A

    公开(公告)日:2024-04-12

    申请号:CN202410048420.0

    申请日:2024-01-11

    Abstract: 本说明书的实施例提供了一种基于持续预训练的语言模型训练方法和装置。在该基于持续预训练的语言模型训练方法中,利用当前软提示生成模型得到与当前领域的各个当前训练样本对应的软提示特征;进而利用当前语言模型根据各个文本数据和对应的软提示特征得到各个文本数据对应于当前领域的隐特征;再基于所得到的各个文本数据对应于当前领域的隐特征与相应基于所述初始当前语言模型而得到的对应于上一领域的隐特征之间的差异,确定跨域损失值;在不满足当前领域的训练结束条件时根据跨域损失值调整当模型参数;在满足当前领域的训练结束条件时继续利用下一领域的训练样本集重复执行上述模型训练过程,直至满足持续预训练的训练结束条件。

    训练时序预测模型、预测行为序列的方法和装置

    公开(公告)号:CN116011609A

    公开(公告)日:2023-04-25

    申请号:CN202211336706.6

    申请日:2022-10-28

    Abstract: 本说明书实施例提供一种训练时序预测模型,以及利用该模型进行预测的方法和装置,其中时序预测模型包括,自回归预测模型和能量计算模型。训练方法包括:获取标签行为序列,其中包括,用户在第一时段中的第一行为序列,以及在后续的第二时段中的行为序列。将第一行为序列输入自回归预测模型,得到对于第二时段中依次发生行为的概率分布信息。基于概率分布信息进行采样,得到N个采样行为序列,与第一行为序列拼接得到N个采样全序列。利用能量计算模型,确定标签行为序列的标签能量值,以及N个采样全序列各自的采样能量值。以目标函数的函数值趋于增大为目标,训练能量计算模型;其中目标函数与标签能量值负相关,与采样能量值正相关。

    一种训练推荐模型的方法和系统

    公开(公告)号:CN111311384A

    公开(公告)日:2020-06-19

    申请号:CN202010409777.9

    申请日:2020-05-15

    Abstract: 本说明书实施例公开了一种训练推荐模型方法和系统,方法包括:对于多个训练样本的每一个执行以下步骤,以迭代更新推荐模型的参数,得到训练好的推荐模型:利用推荐模型处理样本对象的当前时点状态,得到样本对象对应的推荐标的分布,并确定服从推荐标的分布的预测推荐标的;利用状态转移模型处理样本对象的当前时点状态以及预测推荐标的,得到样本对象的下一时点状态;计算样本对象的下一时点状态相关的收益;利用奖励模型处理样本对象的当前时点状态及预测推荐标的,得到预测奖励;确定所述推荐模型的目标函数,其中,推荐模型的目标函数至少与预测奖励以及样本对象的下一时点状态相关的收益正相关;调整推荐模型的参数,以使其目标函数最大化。

Patent Agency Ranking