-
公开(公告)号:CN119918585A
公开(公告)日:2025-05-02
申请号:CN202510383331.6
申请日:2025-03-28
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N3/0455 , G06N3/0475 , G06N5/04 , G06F18/214 , G06F18/21
Abstract: 本发明提供一种多维度大语言模型能力框架搭建的方法及装置,涉及大语言模型技术领域。该方法包括:基于CHC理论模型的认知能力,定义大语言模型的认知维度能力;基于FLASK领域分类体系定义大语言模型的领域维度能力;定义大语言模型的任务维度能力;根据大语言模型的认知维度能力、领域维度能力以及任务维度能力,构建多维度大语言模型能力框架;获取能力标注训练集,采用GPT‑4o模型对训练集进行标注,获得标注后的数据集;根据标注后的数据集,对能力框架进行训练,获得训练好的多维度能力标注模型;获取待筛选的大语言模型的微调数据;将微调数据输入训练好的多维度能力标注模型中,获得高质量微调数据。采用本发明可获得高质量微调数据。