降低神经网络推理所需内存占用量的重计算方法和系统

    公开(公告)号:CN117009093B

    公开(公告)日:2024-03-12

    申请号:CN202311278523.8

    申请日:2023-10-07

    Abstract: 降低神经网络推理所需内存占用量的重计算方法和系统,包括:通过神经网络模型的计算图构建有向无环图#imgabs0#;基于有向无环图#imgabs1#,获得重计算对集合#imgabs2#;对重计算对集合#imgabs3#进行幂集操作。根据幂集中的每一个元素#imgabs4#,对图#imgabs5#进行附加属性得到对应的图#imgabs6#;基于图#imgabs7#,进行涉及重计算策略的调度算法;在全部#imgabs8#的调度结果中,选择内存占用量最低的调度。在边缘设备智能性的需求逐渐加重的背景下,边缘设备的运行内存十分宝贵的场景下,本发明以增加额外计算代价的方式获得神经网络推理时更小的内存占用量,对边缘智能的普适性有着贡献。

    降低神经网络推理所需内存占用量的重计算方法和系统

    公开(公告)号:CN117009093A

    公开(公告)日:2023-11-07

    申请号:CN202311278523.8

    申请日:2023-10-07

    Abstract: 降低神经网络推理所需内存占用量的重计算方法和系统,包括:通过神经网络模型的计算图构建有向无环图#imgabs0#;基于有向无环图#imgabs1#,获得重计算对集合#imgabs2#;对重计算对集合#imgabs3#进行幂集操作。根据幂集中的每一个元素#imgabs4#,对图#imgabs5#进行附加属性得到对应的图#imgabs6#;基于图#imgabs7#,进行涉及重计算策略的调度算法;在全部#imgabs8#的调度结果中,选择内存占用量最低的调度。在边缘设备智能性的需求逐渐加重的背景下,边缘设备的运行内存十分宝贵的场景下,本发明以增加额外计算代价的方式获得神经网络推理时更小的内存占用量,对边缘智能的普适性有着贡献。

Patent Agency Ranking