-
公开(公告)号:CN117931196A
公开(公告)日:2024-04-26
申请号:CN202311771630.4
申请日:2023-12-20
Applicant: 之江实验室
IPC: G06F8/41 , G06F18/214 , G06N3/08
Abstract: 本说明书公开了一种预测模型训练方法、代码生成模型训练方法、装置,专用设备根据各候选代码的标签运行效果表征值构建出训练样本集,而后将训练样本集中每两个代码以及这两个代码对应的同一样本需求文本输入到预测模型中,得到这两个代码各自的预测运行效果表征值,进而确定出这两个代码对应的预测排序,而后以最小化预测排序与这两个代码在标签运行效果表征值下的排序之间的偏差,以及最大化这两个代码中标签运行效果表征值较高的代码的预测运行效果表征值为优化目标,对预测模型进行训练。在代码生成模型输出代码后,以最大化通过预测模型得到的代码的预测运行效果表征值,对代码生成模型进行训练,可提高代码生成模型生成出的代码的质量。
-
公开(公告)号:CN117828360A
公开(公告)日:2024-04-05
申请号:CN202311714139.8
申请日:2023-12-13
Applicant: 之江实验室
Abstract: 本说明书公开了一种模型训练、代码生成方法、装置、存储介质及设备。所述模型训练方法包括:获取样本序列,将各样本序列输入到预设的代码生成模型中,以通过代码生成模型,针对样本序列中变量序列包含的变量对应的语义单元,根据在样本代码中在作为该语义单元之前的各语义单元中,确定出除与作为该语义单元的变量之间不存在依赖关系的其他变量对应的语义单元之外的其他语义单元各该语义单元之间的相关度,确定该语义单元的注意力特征表示,并以最小化基于该语义单元的注意力特征得到的预测语义单元和预测语义单元在样本代码中实际对应的语义单元之间的偏差为优化目标,对代码生成模型进行训练,得到训练后代码生成模型。
-