-
公开(公告)号:CN116610607A
公开(公告)日:2023-08-18
申请号:CN202310573574.7
申请日:2023-05-19
Applicant: 广东浪潮智慧计算技术有限公司
Abstract: 本申请公开了一种人工智能模型的训练方法、装置、设备及介质,属于人工智能技术领域,该方法包括:当要对人工智能模型进行训练时,则基于计算快速链路通信协议将中央处理器的内存中人工智能模型的模型参数发送至图形处理器的显存;利用计算快速链路高速缓存协议将内存中的待训练参数发送至图形处理器的高速缓冲存储器,以使图形处理器对待训练参数进行更新,并将更新后的待训练参数发送至内存;重复执行将内存中的待训练参数发送至图形处理器的高速缓冲存储器,以使图形处理器对待训练参数进行更新的步骤,直至人工智能模型收敛。通过该方法不仅可以极大的提高在对人工智能模型进行训练时的效率,而且,也可以提高人工智能模型的数据训练规模。