构建神经网络模型的方法、装置、计算机设备和存储介质

    公开(公告)号:CN112990461B

    公开(公告)日:2023-09-19

    申请号:CN201911292945.4

    申请日:2019-12-16

    Inventor: 刘伟良

    Abstract: 本公开是关于一种构建神经网络模型的方法、装置、计算机设备和存储介质,属于机器学习模块技术领域。所述方法包括:建立神经网络模型对应的当前待确定的网络架构;基于当前待确定的网络架构,生成神经网络模型对应的中间表示信息;基于中间表示信息和预设的代码优化算法,生成优化运行代码;控制执行优化运行代码,获取优化运行代码的整体运行时长,作为当前待确定的网络架构对应的整体运行时长;如果当前待确定的网络架构对应的整体运行时长能够满足预设的网络架构搜索条件,则将当前待确定的网络架构确定为输出结果。采用本公开,可以提高构建网络架构的效率。

    算子的可执行代码的生成方法及装置

    公开(公告)号:CN113687816B

    公开(公告)日:2023-09-01

    申请号:CN202010427353.5

    申请日:2020-05-19

    Abstract: 本申请公开了一种算子的可执行代码的生成方法及装置,属于数据处理领域。在本申请中,计算机设备获取算子的第一中间表示信息,通过一个或者多个计算功能单元将第一中间表示信息进行表达映射,以生成第二中间表示信息。之后,生成算子在目标硬件平台上的可执行代码。由于计算功能单元为在不同类型的多个硬件平台中具有共性计算功能的最小计算单元,且计算功能单元的颗粒度比算子小,因此,第二中间表示信息可以在不同类型的多个硬件平台中共用,也即是,第一中间表示信息和第二中间表示信息都可以在多个硬件平台中共用,从而在同一个算子应用于不同的硬件平台时,可以直接按照具有硬件平台的类型生成可执行代码,提高了算子的开发效率。

    算子的可执行代码的生成方法及装置

    公开(公告)号:CN113687816A

    公开(公告)日:2021-11-23

    申请号:CN202010427353.5

    申请日:2020-05-19

    Abstract: 本申请公开了一种算子的可执行代码的生成方法及装置,属于数据处理领域。在本申请中,计算机设备获取算子的第一中间表示信息,通过一个或者多个计算功能单元将第一中间表示信息进行表达映射,以生成第二中间表示信息。之后,生成算子在目标硬件平台上的可执行代码。由于计算功能单元为在不同类型的多个硬件平台中具有共性计算功能的最小计算单元,且计算功能单元的颗粒度比算子小,因此,第二中间表示信息可以在不同类型的多个硬件平台中共用,也即是,第一中间表示信息和第二中间表示信息都可以在多个硬件平台中共用,从而在同一个算子应用于不同的硬件平台时,可以直接按照具有硬件平台的类型生成可执行代码,提高了算子的开发效率。

    确定模型的可执行程序的方法、装置、设备及存储介质

    公开(公告)号:CN113469322A

    公开(公告)日:2021-10-01

    申请号:CN202010247043.5

    申请日:2020-03-31

    Inventor: 刘伟良

    Abstract: 本申请公开了一种确定模型的可执行程序的方法、装置、设备及存储介质,属于计算机技术领域。所述方法包括:获取用于指示模型的多个算子之间的依赖关系的模型架构信息;基于搜索空间包括的多个算子的代码优化方式、模型架构信息和算子逻辑库,确定模型的可执行程序,每个算子对应至少一种代码优化方式;每确定出模型的一个可执行程序,基于当前确定出的可执行程序进行一次模型训练迭代,并确定该可执行程序对应的训练迭代时长;当当前的模型训练迭代满足停止寻优条件时,从已确定出的所有可执行程序中选择训练迭代时长最短的可执行程序作为模型的目标可执行程序。如此,将确定可执行程序和模型训练迭代结合在一起,加快了模型的训练速度。

    构建神经网络模型的方法、装置、计算机设备和存储介质

    公开(公告)号:CN112990461A

    公开(公告)日:2021-06-18

    申请号:CN201911292945.4

    申请日:2019-12-16

    Inventor: 刘伟良

    Abstract: 本公开是关于一种构建神经网络模型的方法、装置、计算机设备和存储介质,属于机器学习模块技术领域。所述方法包括:建立神经网络模型对应的当前待确定的网络架构;基于当前待确定的网络架构,生成神经网络模型对应的中间表示信息;基于中间表示信息和预设的代码优化算法,生成优化运行代码;控制执行优化运行代码,获取优化运行代码的整体运行时长,作为当前待确定的网络架构对应的整体运行时长;如果当前待确定的网络架构对应的整体运行时长能够满足预设的网络架构搜索条件,则将当前待确定的网络架构确定为输出结果。采用本公开,可以提高构建网络架构的效率。

    神经网络模型部署方法、装置、设备及可读存储介质

    公开(公告)号:CN116976410A

    公开(公告)日:2023-10-31

    申请号:CN202210383329.5

    申请日:2022-04-13

    Abstract: 本申请公开了一种神经网络模型部署方法、装置、设备及可读存储介质,该方法包括步骤:获取第一神经网络模型,其中,所述第一神经网络模型中的第一算子用于矩阵乘法操作,所述第一算子无法通过目标NPU进行推理;将所述第一算子替换为第二算子,得到第二神经网络模型,其中,所述第二算子的运算结果与所述第一算子的运算结果一致,且所述第二算子能够通过所述目标NPU进行推理;将所述第二神经网络模型部署至所述目标NPU。本申请扩大了目标NPU所能推理的网络的网络类型范围。

    确定模型的可执行程序的方法、装置、设备及存储介质

    公开(公告)号:CN113469322B

    公开(公告)日:2023-07-18

    申请号:CN202010247043.5

    申请日:2020-03-31

    Inventor: 刘伟良

    Abstract: 本申请公开了一种确定模型的可执行程序的方法、装置、设备及存储介质,属于计算机技术领域。所述方法包括:获取用于指示模型的多个算子之间的依赖关系的模型架构信息;基于搜索空间包括的多个算子的代码优化方式、模型架构信息和算子逻辑库,确定模型的可执行程序,每个算子对应至少一种代码优化方式;每确定出模型的一个可执行程序,基于当前确定出的可执行程序进行一次模型训练迭代,并确定该可执行程序对应的训练迭代时长;当当前的模型训练迭代满足停止寻优条件时,从已确定出的所有可执行程序中选择训练迭代时长最短的可执行程序作为模型的目标可执行程序。如此,将确定可执行程序和模型训练迭代结合在一起,加快了模型的训练速度。

Patent Agency Ranking