-
公开(公告)号:CN119004101A
公开(公告)日:2024-11-22
申请号:CN202411030568.8
申请日:2024-07-30
Applicant: 北京信息科技大学
IPC: G06F18/214 , G06N3/045 , G06N3/09 , G06N5/022 , G06N5/04 , G06F16/332
Abstract: 本发明涉及一种提出的对话数据集生成方法和装置,包括采集预设领域的参考文本信息;构建所述预设领域的提示,所述提示包括示范示例、思考链和逻辑链;将所述预设领域的参考文本信息和提示输入大型语言模型LLM中,生成所述预设领域的对话数据集。本发明利用大型语言模型自动化地生成高质量、多样化且具有广泛应用场景的对话数据集,以支持对话系统的快速发展和应用。本发明还涉及一种设备和存储介质。