-
公开(公告)号:CN117033603A
公开(公告)日:2023-11-10
申请号:CN202311088641.2
申请日:2023-08-28
Applicant: 北京易华录信息技术股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F16/35 , G06F40/295 , G06F40/30 , G06F40/194 , G06F18/214
Abstract: 本发明涉及垂直领域模型构建技术领域,公开了一种垂直领域大模型的构建方法、装置、设备及存储介质,方法包括:根据垂直领域的各行业场景需求确定指令数据集的结构和形式;根据各行业具有专业表述的文献生成初始指令数据集并对其进行逻辑性审核及数据增强形成高质量指令数据集;基于高质量指令数据集训练精调大模型;构建分级行业知识库及行业知识图谱融入精调大模型;基于各个行业主题或类别训练多个行业小模型,构建精调大模型结合行业小模型的应用框架作为垂直领域大模型用于语义理解和专业内容生成。本发明通过构建高质量行业数据集及精调大模型+多个专业小模型的应用框架,实现了专业知识的准确引入,提高了垂直领域大模型的综合能力。
-
公开(公告)号:CN115878592A
公开(公告)日:2023-03-31
申请号:CN202211625628.1
申请日:2022-12-16
Applicant: 北京易华录信息技术股份有限公司
Abstract: 本发明公开了一种政务数据治理方法、装置、存储介质及电子设备,获取政务数据治理需求,以及根据政务数据治理需求获取政务数据集;基于所述政务数据集中政务数据的主题,经过大规模并行处理架构,建立数据仓库,以及基于数据仓库建立数据接入模型;基于所述数据接入模型,经过预设数据接入方法,接入所述政务数据集;对所述政务数据集进行处理,得到目标政务数据集;基于所述目标政务数据集,经过数据共享方法,输出所述目标政务数据集;基于所述目标政务数据集完成政务数据治理操作。对获取到的政务数据集进行处理提高数据质量;提供完整的政务数据规范治理体系,高效地从接入数据到共享数据全过程生命周期的管理,达到了政务数据治理的效果。
-