一种基于异构多核平台上类型化DAG任务的分析及调度方法

    公开(公告)号:CN117130748B

    公开(公告)日:2024-10-22

    申请号:CN202311097095.9

    申请日:2023-08-29

    Abstract: 一种基于异构多核平台上类型化DAG任务的分析及调度方法,涉及DAG任务调度技术领域。本发明的目的是为了实现在异构多核平台上基于划分调度的类型化DAG任务的分析和处理器资源分配,提高核心的资源利用率。本发明研究基于异构多核平台上采用划分调度的类型化DAG任务的最坏情况响应时间和分配策略。本发明通过深入分析类型化DAG任务的拓扑结构的特点提出了一种全新的WCRT上界,并给出一种基于迭代方法的分析算法,该算法能够在多项式时间内计算出本发明提出的最新WCRT上界。本发明还提出了一种启发式的分配策略,该策略将DAG任务中的子任务分配到不同的核心上从而提升系统处理器资源的利用率。实验结果表明,本发明提出的WCRT分析方法和分配策略在可调度性测试方面相较于最新的方法分别提高了34.9%和26.4%。

    一种面向GPU系统深度学习推理的能效感知自适应调度方法及系统

    公开(公告)号:CN117667336A

    公开(公告)日:2024-03-08

    申请号:CN202311276347.4

    申请日:2023-09-30

    Abstract: 一种面向GPU系统深度学习推理的能效感知自适应调度方法及系统,涉及GPU系统深度学习技术领域。本发明的目的是为了提高GPU推理过程中的能耗效率,根据GPU当前环境,自适应地选择当前最合适的批处理大小和GPU频率大小来降低GPU推理的能耗,最终做到能效的最大化。能效自适应调度器根据波动的工作负载自适应地协调批处理大小和GPU核心频率大小,并使用强化学习算法训练模型以在满足延迟SLO的同时降低延迟和深度学习推理服务的能耗:智能体在每一时刻,根据环境的状态,依据一定的策略选择一个动作,然后环境依据一定的状态转移概率转移到下一个状态,与此同时根据此时状态的好坏反馈给智能体一个奖励;智能体根据环境的反馈调整其策略,然后继续在环境中探索,最终学习到一个能够获得最多奖励的最优策略,最终实现能效感知自适应调度。

    一种基于GPU的高性能多方安全计算训练方法及系统

    公开(公告)号:CN117332838A

    公开(公告)日:2024-01-02

    申请号:CN202311299871.3

    申请日:2023-10-09

    Abstract: 一种基于GPU的高性能多方安全计算训练方法及系统,涉及具体涉及多方安全计算协议领域。本发明的目的是给出一种并行程度更高的的多方安全计算训练框架,以实现通过结合数据并行与模型并行的方式来实现神经网络不同层之间的并行,来提高训练过程的数据吞吐速度。本发明方法是一种基于管道流水线训练方法的多方安全计算训练系统,如图1所示,该方法针对MPC模型训练过程中线性计算网络层与非线性计算网络层的瓶颈分别为计算与通信这一特性,设计了管道流水线训练方法,实现子网络间的并行,并实现了最优子网络分割算法以均衡每个子网络之间的训练负载。本发明给出一种并行程度更高的的多方安全计算训练框架,通过结合数据并行与模型并行的方式来实现神经网络不同层之间的并行,大大提高训练过程的数据吞吐速度。

    一种并行程序的集合通信函数建模方法

    公开(公告)号:CN106250686B

    公开(公告)日:2018-11-02

    申请号:CN201610599836.7

    申请日:2016-07-27

    Abstract: 一种并行程序的集合通信函数建模方法,本发明涉及并行程序的集合通信函数建模方法。本发明的目的是为了解决现有技术对通信时间数据获取不准确、耗费大量时间金钱的缺点。一种并行程序的集合通信函数建模方法具体过程为:步骤一、在实验平台下测量集合通信函数N次,获得集合通信函数在不同的并行度和数据量下的通信时间数据;步骤二、用基于BP反向传播算法的人工神经网络对集合通讯函数在不同的并行度和数据量下的通信时间数据进行拟合,得到相应的通信函数的神经网络模型。本发明用于通信技术领域。

    一种并行程序的集合通信函数建模方法

    公开(公告)号:CN106250686A

    公开(公告)日:2016-12-21

    申请号:CN201610599836.7

    申请日:2016-07-27

    CPC classification number: G06F19/00 G06N3/02

    Abstract: 一种并行程序的集合通信函数建模方法,本发明涉及并行程序的集合通信函数建模方法。本发明的目的是为了解决现有技术对通信时间数据获取不准确、耗费大量时间金钱的缺点。一种并行程序的集合通信函数建模方法具体过程为:步骤一、在实验平台下测量集合通信函数N次,获得集合通信函数在不同的并行度和数据量下的通信时间数据;步骤二、用基于BP反向传播算法的人工神经网络对集合通讯函数在不同的并行度和数据量下的通信时间数据进行拟合,得到相应的通信函数的神经网络模型。本发明用于通信技术领域。

    用于程序自动性能预测的视点提升方法

    公开(公告)号:CN105183651A

    公开(公告)日:2015-12-23

    申请号:CN201510579026.0

    申请日:2015-09-11

    Abstract: 用于程序自动性能预测的视点提升方法,属于程序性能预测领域。现有的程序自动性能预测方法存在难以在保证预测精度的同时确定最大预测性的问题。一种用于程序自动性能预测的视点提升方法,步骤一、定义基本块N执行次数的视点V,则利用二元组表示的基本块频率为(Ev,BV,N);步骤二、对二元组表示的基本块频率(Ev,BV,N)中的视点V的实际运行次数Ev的量进行提升操作;步骤三、确定视点V中预测到基本块N的频率BV,N;步骤四、定义基本块N的频率BN=Ev×BV,N;步骤五、得到视点V在一次运行中总的基本块频率为本发明具有在保证精度的同时确定合适的插入位置,结合静态分支概率提高预测性的优点。

    一种基于组件加权调度的Linux USB驱动模糊测试方法及系统

    公开(公告)号:CN119691750A

    公开(公告)日:2025-03-25

    申请号:CN202411763337.8

    申请日:2024-12-03

    Abstract: 一种基于组件加权调度的Linux USB驱动模糊测试方法及系统,涉及网络系统安全漏洞检测领域。本发明是为了解决现有USB驱动模糊测试技术存在的USB驱动测试用例调度不合理、影响Linux USB驱动模糊测试的覆盖率提升等问题而提出来的。技术要点:提取并筛选出Linux内核中与USB相关的组件,提取出Linux USB驱动相关组件依赖图,基于组件依赖图为USB相关组件分配不同的权重大小,保证包含USB驱动代码的组件具有更大的权重,根据USB相关组件所分配的权重大小,筛选出包含最多组件并且能够成功编译的Linux镜像配置;从Linux源码和构建目录中提取出地址和组件的映射关系。在模糊测试执行时执行测试用例的优先级需要按照覆盖率反馈追踪的组件加权评估。本发明改进了内核驱动模糊测试器的调度技术,用于提高USB驱动的漏洞挖掘效果。本发明主要应用于系统安全领域,特别是USB驱动模糊测试。

    一种基于异构多核平台上类型化DAG任务的分析及调度方法

    公开(公告)号:CN117130748A

    公开(公告)日:2023-11-28

    申请号:CN202311097095.9

    申请日:2023-08-29

    Abstract: 一种基于异构多核平台上类型化DAG任务的分析及调度方法,涉及DAG任务调度技术领域。本发明的目的是为了实现在异构多核平台上基于划分调度的类型化DAG任务的分析和处理器资源分配,提高核心的资源利用率。本发明研究基于异构多核平台上采用划分调度的类型化DAG任务的最坏情况响应时间和分配策略。本发明通过深入分析类型化DAG任务的拓扑结构的特点提出了一种全新的WCRT上界,并给出一种基于迭代方法的分析算法,该算法能够在多项式时间内计算出本发明提出的最新WCRT上界。本发明还提出了一种启发式的分配策略,该策略将DAG任务中的子任务分配到不同的核心上从而提升系统处理器资源的利用率。实验结果表明,本发明提出的WCRT分析方法和分配策略在可调度性测试方面相较于最新的方法分别提高了34.9%和26.4%。

    一种基于运行时特征和机器学习的并行程序性能预测系统

    公开(公告)号:CN110377525B

    公开(公告)日:2022-11-15

    申请号:CN201910680598.6

    申请日:2019-07-25

    Abstract: 一种基于运行时特征和机器学习的并行程序性能预测系统,属于并行程序性能预测的技术领域。本发明为了解决基于机器学习的并行程序性能预测系统存在开销比较大、预测时间长,而且准确率较低的问题。对原始程序进行混合插桩,减少基本块计数器,然后将程序删减成没有输入结果的串行程序,减少程序的运行时间的同时保留程序执行的流程,准确快速地获取到基本块频率,预处理这些数据,输入预测模型中,最后输出大规模并行程序的执行时间。本发明生成的模型具有很强的泛化能力,能够准确地预测大规模并行程序的执行时间,并且预测开销很小。

    一种面向功率约束系统的性能-能耗协同优化方法及装置

    公开(公告)号:CN112083929A

    公开(公告)日:2020-12-15

    申请号:CN202010918175.6

    申请日:2020-09-03

    Abstract: 一种面向功率约束系统的性能‑能耗协同优化方法及装置,属于高性能计算技术领域,用以解决高性能计算中系统总体运行过程中能耗过大的问题。本发明主要通过机器学习模型预测并在OpenMP并行域级别进行功率上限设置来优化程序运行的能耗和性能,本发明包括数据采集、模型训练和代码优化三个部分,其中,数据采集包括从OpenMP并行程序中提取模型训练所需要的特征数据;模型训练包括根据功率配置和提取的特征数据对性能和能耗进行建模训练;代码优化包括根据训练得到的模型获取最优功率配置,并根据最优功率配置进行代码优化。本发明有助于通用的并行应用程序进行资源的合理利用,提高效率,同时也有助于云计算、物联网等功率约束场景下提高能量的利用率。

Patent Agency Ranking