神经网络模型部署方法、装置、设备及可读存储介质

    公开(公告)号:CN116976410A

    公开(公告)日:2023-10-31

    申请号:CN202210383329.5

    申请日:2022-04-13

    Abstract: 本申请公开了一种神经网络模型部署方法、装置、设备及可读存储介质,该方法包括步骤:获取第一神经网络模型,其中,所述第一神经网络模型中的第一算子用于矩阵乘法操作,所述第一算子无法通过目标NPU进行推理;将所述第一算子替换为第二算子,得到第二神经网络模型,其中,所述第二算子的运算结果与所述第一算子的运算结果一致,且所述第二算子能够通过所述目标NPU进行推理;将所述第二神经网络模型部署至所述目标NPU。本申请扩大了目标NPU所能推理的网络的网络类型范围。

Patent Agency Ranking