显示设备及语言模型的迭代优化方法

    公开(公告)号:CN118916452A

    公开(公告)日:2024-11-08

    申请号:CN202410914148.X

    申请日:2024-07-09

    Inventor: 王立新 李家欢

    Abstract: 本申请一些实施例提供一种显示设备及语言模型的迭代优化方法,所述方法可以获取问答数据集,并生成训练数据集和测试数据集,以及利用训练数据集对目标语言模型执行训练;并利用质量评估模型对第三回复语料评估,以更新训练数据集中样本数据的学习状态标记;以及将测试数据集的提问语料输入至目标语言模型中,并基于输出的第四回复语料标记目标语言模型的训练状态;若训练状态为迭代优化状态,则删除学习成功状态的样本数据,保留学习失败状态的样本数据,以更新训练数据集。所述方法通过删除已学习的样本数据来更新训练数据集,并通过对比学习方式对目标语言模型执行迭代训练,以提高目标语言模型输出回复语的准确率。

Patent Agency Ranking