-
公开(公告)号:CN118916452A
公开(公告)日:2024-11-08
申请号:CN202410914148.X
申请日:2024-07-09
Applicant: 海信视像科技股份有限公司
IPC: G06F16/332 , G06F9/451 , G06N3/08 , G06N20/00
Abstract: 本申请一些实施例提供一种显示设备及语言模型的迭代优化方法,所述方法可以获取问答数据集,并生成训练数据集和测试数据集,以及利用训练数据集对目标语言模型执行训练;并利用质量评估模型对第三回复语料评估,以更新训练数据集中样本数据的学习状态标记;以及将测试数据集的提问语料输入至目标语言模型中,并基于输出的第四回复语料标记目标语言模型的训练状态;若训练状态为迭代优化状态,则删除学习成功状态的样本数据,保留学习失败状态的样本数据,以更新训练数据集。所述方法通过删除已学习的样本数据来更新训练数据集,并通过对比学习方式对目标语言模型执行迭代训练,以提高目标语言模型输出回复语的准确率。