- 专利标题: 大模型的微调方法、装置、电子设备和存储介质
-
申请号: CN202311228447.X申请日: 2023-09-21
-
公开(公告)号: CN117350360B公开(公告)日: 2024-07-09
- 发明人: 请求不公布姓名
- 申请人: 摩尔线程智能科技(北京)有限责任公司
- 申请人地址: 北京市海淀区翠微中里14号楼四层B655
- 专利权人: 摩尔线程智能科技(北京)有限责任公司
- 当前专利权人: 摩尔线程智能科技(北京)有限责任公司
- 当前专利权人地址: 北京市海淀区翠微中里14号楼四层B655
- 代理机构: 北京林达刘知识产权代理事务所
- 代理商 李茂家; 周蕾
- 主分类号: G06N3/092
- IPC分类号: G06N3/092 ; G06N3/084 ; G06N3/098 ; G06F18/214
摘要:
本公开涉及一种大模型的微调方法、装置、电子设备和存储介质。所述方法包括:将训练样本集划分为至少两个训练样本子集,并确定与所述至少两个训练样本子集一一对应的至少两项分解参数值,其中,所述至少两项分解参数值互不相同;将目标数据处理模型的网络层划分为第一网络层组和第二网络层组;对于所述至少两个训练样本子集中的任一训练样本子集,根据所述第一网络层组对应的原参数矩阵的行数和列数,以及所述训练样本子集对应的分解参数值,初始化所述训练样本子集对应的第一参数矩阵和第二参数矩阵;基于所述训练样本子集训练所述目标数据处理模型,并更新所述目标数据处理模型的参数。
公开/授权文献
- CN117350360A 大模型的微调方法、装置、电子设备和存储介质 公开/授权日:2024-01-05