数据处理方法、装置、设备及存储介质

    公开(公告)号:CN114327405A

    公开(公告)日:2022-04-12

    申请号:CN202111633458.7

    申请日:2021-12-28

    Abstract: 本申请公开了一种数据处理方法、装置、设备及存储介质,涉及数据处理技术领域,用于自定义算子开发,从而解决算子开发框架过于庞大,框架维护非常复杂的问题。该方法用于算子开发框架,该方法包括:获取自定义算子的源代码,自定义算子包括至少两个基础算子;其中,待执行自定义算子的目标硬件平台的算子库中预先存储有至少两个基础算子,基础算子是多个硬件平台通用的基础算子,多个硬件平台包括目标硬件平台;解析源代码,得到自定义算子的拓扑结构文件,拓扑结构文件用于指示目标硬件平台执行自定义算子时从算子库中调用至少两个基础算子,以及至少两个基础算子的计算逻辑。

    一种数据处理方法、装置及设备

    公开(公告)号:CN118862963B

    公开(公告)日:2025-01-21

    申请号:CN202411347177.9

    申请日:2024-09-25

    Abstract: 本申请提供一种数据处理方法、装置及设备,该方法包括:若目标单元算子的输入特征对应多个维度,则从多个维度中选取待切分维度,在待切分维度上对输入特征进行切分得到多个切分子数据;遍历第一切分子数据存储到第一内部存储介质;通过第一计算单元读取第一切分子数据,基于第一切分子数据进行处理得到第一结果子数据,将第一结果子数据存储到第二内部存储介质;通过第二计算单元读取第一结果子数据,基于第一结果子数据进行处理得到第二结果子数据;遍历第二切分子数据存储到第一内部存储介质,通过第一计算单元读取第二切分子数据,基于第二切分子数据进行处理得到第一结果子数据。通过本申请方案,提高访存性能,提高带宽利用率。

    一种深度学习网络优化方法、系统及装置

    公开(公告)号:CN119048876A

    公开(公告)日:2024-11-29

    申请号:CN202310622726.8

    申请日:2023-05-29

    Abstract: 本申请实施例提供了一种深度学习网络优化方法、系统及装置,可以通过将原始计算图中的计算子图来确定融合策略,将原始计算图拆分成多个可以进行片上内存融合的计算子图,分别评估每个计算子图中的各个节点进行片上内存融合和不进行片上内存融合的理论性能值,然后基于理论性能值确定第一融合策略。本申请实施例中,通过每个计算子图的节点在进行片上内存融合和不进行片上内存融合的场景下分别评估的理论性能值来确定在该节点上是否进行片上内存融合,进而尽可能使得每个节点都是最优的执行方式,使得每个计算子图都是最优的执行方案,提高了原始计算图的计算效率。

    一种数据处理方法、装置及设备

    公开(公告)号:CN118862963A

    公开(公告)日:2024-10-29

    申请号:CN202411347177.9

    申请日:2024-09-25

    Abstract: 本申请提供一种数据处理方法、装置及设备,该方法包括:若目标单元算子的输入特征对应多个维度,则从多个维度中选取待切分维度,在待切分维度上对输入特征进行切分得到多个切分子数据;遍历第一切分子数据存储到第一内部存储介质;通过第一计算单元读取第一切分子数据,基于第一切分子数据进行处理得到第一结果子数据,将第一结果子数据存储到第二内部存储介质;通过第二计算单元读取第一结果子数据,基于第一结果子数据进行处理得到第二结果子数据;遍历第二切分子数据存储到第一内部存储介质,通过第一计算单元读取第二切分子数据,基于第二切分子数据进行处理得到第一结果子数据。通过本申请方案,提高访存性能,提高带宽利用率。

    一种网络拓扑结构解析方法和电子设备

    公开(公告)号:CN116361427A

    公开(公告)日:2023-06-30

    申请号:CN202111627296.6

    申请日:2021-12-28

    Abstract: 本申请实施例提供了一种网络拓扑结构解析方法和电子设备,涉及机器学习技术领域。该方法包括:获取网络模型的代码,作为目标代码。在目标代码中查找第一关键字,第一关键字用于指示目标代码的框架语言,第一关键字包括在预设的关键字数据库中。根据第一关键字,确定目标代码的第一框架语言。根据第一框架语言,确定网络模型的网络拓扑结构。从而简单快捷地得到该网络模型的网络拓扑结构,解析效率较高,且无需配置深度学习框架的运行环境,易于使用。

Patent Agency Ranking