-
公开(公告)号:CN119476479A
公开(公告)日:2025-02-18
申请号:CN202411481668.2
申请日:2024-10-23
Applicant: 苏州大学
IPC: G06N5/04 , G06N5/045 , G06N3/0455 , G06N3/0475 , G06N3/096 , G06F16/3329
Abstract: 本发明涉及一种推理数据合成方法和系统,其中,方法包括:获取数学大语言模型,在模型训练过程中,通过问题微调方法在数学大语言模型利用预设数据集进行问题微调,得到经过问题微调方法处理后的数学大语言模型;通过经过问题微调方法处理后的数学大语言模型生成样本问题;通过问题偏好优化方法对样本问题进行优化,再将优化后的样本问题再对经过问题微调方法处理后的数学大语言模型进行训练;将经过问题微调方法和问题偏好优化方法处理后的数学大语言模型作为问题生成器,并对所述问题生成器生成的问题进行过滤;对每个过滤后的问题生成相应的回答以合成推理数据。本发明的推理数据合成方法不仅能保证数据质量,还能降低生成成本、提高生成效率。