深度学习框架与AI加速卡片内分布式训练适配方法和装置

    公开(公告)号:CN113918351A

    公开(公告)日:2022-01-11

    申请号:CN202111487478.8

    申请日:2021-12-08

    Abstract: 本发明公开了一种深度学习框架与AI加速卡片内分布式训练适配方法和装置,包括如下步骤:S1:深度学习框架支持新增AI加速卡片内单卡配置,其子步骤如下:S11:深度学习框架支持新硬件;S12:深度学习框架支持新硬件的设备线程;S13:深度学习框架支持新硬件的内存操作;S14:深度学习框架支持新硬件的算子核函数;S2:深度学习框架支持新增AI加速卡片内多卡配置;S3:深度学习框架支持张量切分和多卡分布;S4:深度学习框架支持新增AI加速卡片内多卡集合通信,本发明打通了深度学习框架与新增AI加速卡,并将深度学习框架源码与芯片底层软件全面对接,最大限度释放芯片的硬件能力,为端侧AI提供最强劲的算力。

    基于多种一致性协议的多边缘集群数据同步的方法及系统

    公开(公告)号:CN112055054A

    公开(公告)日:2020-12-08

    申请号:CN202010788464.9

    申请日:2020-08-07

    Inventor: 崔广章 王拓

    Abstract: 本发明公开了一种基于多种一致性协议的多边缘集群数据同步的方法及系统,每个边缘集群包括至少一个管理节点和至少一个工作节点,该方法包括:边缘集群内部管理节点之间采用强一致性协议实现数据同步;边缘集群内部的管理节点与工作节点之间数据同步采用局域网弱一致性协议;不同边缘集群的管理节点之间数据同步采用广域网弱一致性协议。本发明针对同边缘集群管理节点之间、同边缘集群管理节点与工作节点之间、不同边缘集群管理节点之间三个范围分别使用不同的一致性协议,实现了边缘多边缘集群的边缘集群内及边缘集群间高效的数据同步,降低了延迟,增强了稳定性。

    基于多种一致性协议的多边缘集群数据同步的方法及系统

    公开(公告)号:CN112055054B

    公开(公告)日:2023-04-07

    申请号:CN202010788464.9

    申请日:2020-08-07

    Inventor: 崔广章 王拓

    Abstract: 本发明公开了一种基于多种一致性协议的多边缘集群数据同步的方法及系统,每个边缘集群包括至少一个管理节点和至少一个工作节点,该方法包括:边缘集群内部管理节点之间采用强一致性协议实现数据同步;边缘集群内部的管理节点与工作节点之间数据同步采用局域网弱一致性协议;不同边缘集群的管理节点之间数据同步采用广域网弱一致性协议。本发明针对同边缘集群管理节点之间、同边缘集群管理节点与工作节点之间、不同边缘集群管理节点之间三个范围分别使用不同的一致性协议,实现了边缘多边缘集群的边缘集群内及边缘集群间高效的数据同步,降低了延迟,增强了稳定性。

    深度学习框架与AI加速卡片内分布式训练适配方法和装置

    公开(公告)号:CN113918351B

    公开(公告)日:2022-03-11

    申请号:CN202111487478.8

    申请日:2021-12-08

    Abstract: 本发明公开了一种深度学习框架与AI加速卡片内分布式训练适配方法和装置,包括如下步骤:S1:深度学习框架支持新增AI加速卡片内单卡配置,其子步骤如下:S11:深度学习框架支持新硬件;S12:深度学习框架支持新硬件的设备线程;S13:深度学习框架支持新硬件的内存操作;S14:深度学习框架支持新硬件的算子核函数;S2:深度学习框架支持新增AI加速卡片内多卡配置;S3:深度学习框架支持张量切分和多卡分布;S4:深度学习框架支持新增AI加速卡片内多卡集合通信,本发明打通了深度学习框架与新增AI加速卡,并将深度学习框架源码与芯片底层软件全面对接,最大限度释放芯片的硬件能力,为端侧AI提供最强劲的算力。

    一种深度学习框架适配AI加速芯片的方法和装置

    公开(公告)号:CN113918507B

    公开(公告)日:2022-04-08

    申请号:CN202111497148.7

    申请日:2021-12-09

    Abstract: 本发明的一种深度学习框架适配AI加速芯片的方法和装置,具体分为三个阶段:芯片类型定义、芯片类型注册、芯片内存支持,所述芯片类型定义就是把需要支持的芯片的类型以一个枚举值的形式定义到proto文件中去,从而使得框架内部可以正确识别该芯片类型;芯片类型注册是把该芯片所需的基础设施注册到哈希表中去,便于框架在需要的时候可以根据芯片类型方便地找到相应的内容;芯片内存支持是把该芯片内存相关的操作放到框架中去,使得框架可以对芯片的存储空间进行统一管理。本发明简化了深度学习框架适配AI加速芯片的工作。

    一种深度学习框架适配AI加速芯片的方法和装置

    公开(公告)号:CN113918507A

    公开(公告)日:2022-01-11

    申请号:CN202111497148.7

    申请日:2021-12-09

    Abstract: 本发明的一种深度学习框架适配AI加速芯片的方法和装置,具体分为三个阶段:芯片类型定义、芯片类型注册、芯片内存支持,所述芯片类型定义就是把需要支持的芯片的类型以一个枚举值的形式定义到proto文件中去,从而使得框架内部可以正确识别该芯片类型;芯片类型注册是把该芯片所需的基础设施注册到哈希表中去,便于框架在需要的时候可以根据芯片类型方便地找到相应的内容;芯片内存支持是把该芯片内存相关的操作放到框架中去,使得框架可以对芯片的存储空间进行统一管理。本发明简化了深度学习框架适配AI加速芯片的工作。

Patent Agency Ranking