图像处理的方法和装置
    1.
    发明公开

    公开(公告)号:CN111832585A

    公开(公告)日:2020-10-27

    申请号:CN201910305876.X

    申请日:2019-04-16

    Inventor: 韩新承

    Abstract: 本公开是关于一种图像处理的方法和装置,属于机器学习模型技术领域。所述方法包括:确定当前层的输入图像特征数据和权重系数数据分别对应的数据量限制条件;确定当前层的输入图像特征数据和权重系数数据中是否存在数据量不满足对应的数据量限制条件的目标数据,根据确定结果,选择对目标数据进行切分的切分维度,基于切分维度,将目标数据切分为满足对应的数据量限制条件的数据;基于当前层的输入图像特征数据和权重系数数据中除目标数据之外的数据以及切分后的目标数据,确定当前层的输出图像特征数据。采用本公开,即使计算机设备中的缓存较小、可使用存储空间较小,计算机设备都可以正常对图像进行处理。

    网络模型的运行代码的确定方法、装置、设备及存储介质

    公开(公告)号:CN113760380B

    公开(公告)日:2024-06-14

    申请号:CN202010460979.6

    申请日:2020-05-27

    Inventor: 韩新承

    Abstract: 本申请公开了一种网络模型的运行代码的确定方法、装置、设备及存储介质,属于数据处理技术领域。该方法包括:确定网络模型的第一网络拓扑图,网络模型包括至少一个网络子模型,第一网络拓扑图用于表示至少一个网络子模型之间的拓扑关系,以及每个网络子模型包括的多个算子节点之间的结构关系;根据第一网络拓扑图中的算子节点的节点配置信息,对第一网络拓扑图进行调整,得到第二网络拓扑图;根据第二网络拓扑图和搜索空间包括的备选配置序列,确定网络模型的目标运行代码。如此,解决了采用人工方式确定网络模型的目标运行代码较为单一的问题,进而提高了网络模型的目标运行代码的运行效率。

    算子的可执行代码的生成方法及装置

    公开(公告)号:CN113553039B

    公开(公告)日:2024-05-31

    申请号:CN202010327958.7

    申请日:2020-04-23

    Inventor: 韩新承

    Abstract: 本申请公开了一种算子的可执行代码的生成方法及装置,属于数据处理领域。在本申请中,计算机设备可以获取算子的第一中间表示信息,之后,从已存储的平台硬件资源配置文件中,获取目标硬件平台的硬件配置信息,进一步确定目标硬件平台支持的优化策略,并根据优化策略,对第一中间表示信息进行优化,得到第二中间表示信息。之后,根据第二中间表示信息和已存储的多个计算核,生成算子在目标硬件平台上的可执行代码。由于计算机设备是根据硬件平台的硬件配置信息确定优化策略,并通过优化策略对第一中间表示信息进行优化,因此,不再需要用户手动的对第一中间表示信息进行优化,降低了算子开发的门槛,也使得开发算子的工作量减小。

    算子的可执行代码的生成方法及装置

    公开(公告)号:CN113687816B

    公开(公告)日:2023-09-01

    申请号:CN202010427353.5

    申请日:2020-05-19

    Abstract: 本申请公开了一种算子的可执行代码的生成方法及装置,属于数据处理领域。在本申请中,计算机设备获取算子的第一中间表示信息,通过一个或者多个计算功能单元将第一中间表示信息进行表达映射,以生成第二中间表示信息。之后,生成算子在目标硬件平台上的可执行代码。由于计算功能单元为在不同类型的多个硬件平台中具有共性计算功能的最小计算单元,且计算功能单元的颗粒度比算子小,因此,第二中间表示信息可以在不同类型的多个硬件平台中共用,也即是,第一中间表示信息和第二中间表示信息都可以在多个硬件平台中共用,从而在同一个算子应用于不同的硬件平台时,可以直接按照具有硬件平台的类型生成可执行代码,提高了算子的开发效率。

    图优化的方法、装置、电子设备和计算机可读存储介质

    公开(公告)号:CN115422403A

    公开(公告)日:2022-12-02

    申请号:CN202210624294.X

    申请日:2022-06-02

    Abstract: 本发明实施例公开了一种图优化的方法、装置、电子设备和计算机可读存储介质。该方法包括:获取离线确定的第一信息和第二信息,其中,该第一信息包括第一子图等价规则集合,该第二信息包括该第一子图等价规则集合中各子图等价规则的性能加速指标;从该第一子图等价规则集合中确定出第二子图等价规则集合,其中,该第二子图等价规则集合为在输入模型将要部署的硬件平台上有效的子图等价规则集合;根据该第二子图等价规则集合和该第二子图等价规则集合中各子图等价规则的性能加速指标,对该输入模型进行优化,得到优化后的模型。通过本发明,解决了相关技术中使用绝对性能指标进行图优化导致的寻优过程的实时性较差的问题。

    算子的可执行代码的生成方法及装置

    公开(公告)号:CN113687816A

    公开(公告)日:2021-11-23

    申请号:CN202010427353.5

    申请日:2020-05-19

    Abstract: 本申请公开了一种算子的可执行代码的生成方法及装置,属于数据处理领域。在本申请中,计算机设备获取算子的第一中间表示信息,通过一个或者多个计算功能单元将第一中间表示信息进行表达映射,以生成第二中间表示信息。之后,生成算子在目标硬件平台上的可执行代码。由于计算功能单元为在不同类型的多个硬件平台中具有共性计算功能的最小计算单元,且计算功能单元的颗粒度比算子小,因此,第二中间表示信息可以在不同类型的多个硬件平台中共用,也即是,第一中间表示信息和第二中间表示信息都可以在多个硬件平台中共用,从而在同一个算子应用于不同的硬件平台时,可以直接按照具有硬件平台的类型生成可执行代码,提高了算子的开发效率。

    算子的可执行代码的生成方法及装置

    公开(公告)号:CN113553039A

    公开(公告)日:2021-10-26

    申请号:CN202010327958.7

    申请日:2020-04-23

    Inventor: 韩新承

    Abstract: 本申请公开了一种算子的可执行代码的生成方法及装置,属于数据处理领域。在本申请中,计算机设备可以获取算子的第一中间表示信息,之后,从已存储的平台硬件资源配置文件中,获取目标硬件平台的硬件配置信息,进一步确定目标硬件平台支持的优化策略,并根据优化策略,对第一中间表示信息进行优化,得到第二中间表示信息。之后,根据第二中间表示信息和已存储的多个计算核,生成算子在目标硬件平台上的可执行代码。由于计算机设备是根据硬件平台的硬件配置信息确定优化策略,并通过优化策略对第一中间表示信息进行优化,因此,不再需要用户手动的对第一中间表示信息进行优化,降低了算子开发的门槛,也使得开发算子的工作量减小。

    一种表达方式转换方法、装置及电子设备

    公开(公告)号:CN115934056A

    公开(公告)日:2023-04-07

    申请号:CN202211704222.2

    申请日:2022-12-29

    Abstract: 本申请实施例提供了一种表达方式转换方法、装置及电子设备。其中,所述方法包括:根据目标算法在源框架中的源表示,确定目标算法的源表达式;根据预先设置不同框架各自支持的符号之间的对应关系,分别确定所述源表达式中各源符号对应的等价集合,所述等价集合包括:与所述源符号对应的符号;按照各所述源符号之间的关联关系,组合各所述源符号对应的等价集合,得到所述目标算法的中间表示。应用本实施例,在需要将目标算法转换到多个框架的情况下,可以在中间表示中确定出转换后的框架的符号的组合方式,进而根据这些组合方式高效的转换,提供了一种高效转换多个不同算法框架的算法程序的方法。

    网络模型的运行代码的确定方法、装置、设备及存储介质

    公开(公告)号:CN113760380A

    公开(公告)日:2021-12-07

    申请号:CN202010460979.6

    申请日:2020-05-27

    Inventor: 韩新承

    Abstract: 本申请公开了一种网络模型的运行代码的确定方法、装置、设备及存储介质,属于数据处理技术领域。该方法包括:确定网络模型的第一网络拓扑图,网络模型包括至少一个网络子模型,第一网络拓扑图用于表示至少一个网络子模型之间的拓扑关系,以及每个网络子模型包括的多个算子节点之间的结构关系;根据第一网络拓扑图中的算子节点的节点配置信息,对第一网络拓扑图进行调整,得到第二网络拓扑图;根据第二网络拓扑图和搜索空间包括的备选配置序列,确定网络模型的目标运行代码。如此,解决了采用人工方式确定网络模型的目标运行代码较为单一的问题,进而提高了网络模型的目标运行代码的运行效率。

    确定硬件运算平台分配方式的方法和装置

    公开(公告)号:CN112988372B

    公开(公告)日:2023-10-24

    申请号:CN201911292959.6

    申请日:2019-12-16

    Inventor: 韩新承

    Abstract: 本公开是关于一种确定硬件运算平台分配方式的方法和装置,属于机器学习模型应用技术领域。所述方法包括:确定待运行的机器学习模型中包括的多个计算节点;获取多个计算节点对应的多组样本平台配置信息;对于每组样本平台配置信息,基于样本平台配置信息控制将多个计算节点分配到各硬件运算平台,控制各硬件运算平台执行分配到的各计算节点,统计各硬件运算平台执行多个计算节点的总执行时长,作为样本平台配置信息对应的总执行时长;基于多组样本平台配置信息和分别对应的总执行时长,确定优化平台配置信息。采用本公开,可以保证异构硬件设备能够以较短的整体执行时长快速运行机器学习模型对应的运行代码。

Patent Agency Ranking