Invention Grant
- Patent Title: 大模型的微调方法、装置、电子设备和存储介质
-
Application No.: CN202311228447.XApplication Date: 2023-09-21
-
Publication No.: CN117350360BPublication Date: 2024-07-09
- Inventor: 请求不公布姓名
- Applicant: 摩尔线程智能科技(北京)有限责任公司
- Applicant Address: 北京市海淀区翠微中里14号楼四层B655
- Assignee: 摩尔线程智能科技(北京)有限责任公司
- Current Assignee: 摩尔线程智能科技(北京)股份有限公司
- Current Assignee Address: 100036 北京市海淀区翠微中里14号楼四层B655
- Agency: 北京林达刘知识产权代理事务所
- Agent 李茂家; 周蕾
- Main IPC: G06N3/092
- IPC: G06N3/092 ; G06N3/084 ; G06N3/098 ; G06F18/214

Abstract:
本公开涉及一种大模型的微调方法、装置、电子设备和存储介质。所述方法包括:将训练样本集划分为至少两个训练样本子集,并确定与所述至少两个训练样本子集一一对应的至少两项分解参数值,其中,所述至少两项分解参数值互不相同;将目标数据处理模型的网络层划分为第一网络层组和第二网络层组;对于所述至少两个训练样本子集中的任一训练样本子集,根据所述第一网络层组对应的原参数矩阵的行数和列数,以及所述训练样本子集对应的分解参数值,初始化所述训练样本子集对应的第一参数矩阵和第二参数矩阵;基于所述训练样本子集训练所述目标数据处理模型,并更新所述目标数据处理模型的参数。
Public/Granted literature
- CN117350360A 大模型的微调方法、装置、电子设备和存储介质 Public/Granted day:2024-01-05
Information query