-
公开(公告)号:CN119830987A
公开(公告)日:2025-04-15
申请号:CN202411882981.7
申请日:2024-12-19
Applicant: 科大讯飞股份有限公司
IPC: G06N3/09 , G06F40/186 , G06F9/30 , G06F40/16
Abstract: 本发明提供一种有监督数据构建方法、装置、电子设备和存储介质,其中方法包括:获取有监督任务的任务描述文本、种子指令和输入数据;基于任务描述文本,对种子指令进行指令扩写,得到扩写指令;基于输入数据,对扩写指令进行指令泛化,得到任务指令;将任务指令输入到问答模型中,得到问答模型输出的任务指令的输出数据;基于任务指令和输出数据,构建有监督数据。本发明提供的方法、装置、电子设备和存储介质,通过自动化的指令优化,大大降低了模型合成方式的使用门槛,且仅需输入任务描述文本,即可保证有监督数据和有监督任务的贴合度,有效保证了有监督数据构建的通用性,实现了有监督数据的构建效率和数据质量的均衡优化。