-
公开(公告)号:CN112445676A
公开(公告)日:2021-03-05
申请号:CN201910832296.6
申请日:2019-09-04
Applicant: 无锡江南计算技术研究所
IPC: G06F11/30
Abstract: 本发明公开一种基于带时间标签多序列的故障预测方法,包括以下步骤:从故障数据采样中获取故障类型列表;以故障类型列表作为候选序列;获得时间序列数据库;将N的初始值赋为1;计算出N项候选场景在第1条时间序列上逗留的窗口数;得到N项候选场景的支持度,比较N项候选场景的支持度与支持度阀值,删除小于支持度阀值的N项候选场景;找出所有的频繁N项场景;将所有生成的频繁场景组合成一个频繁场景集合S;计算获得置信度,比较置信度与置信度阈值,大于置信度阈值的第i个场景的真子场景与第i个场景产生形如X—>Y的规则并保存至规则列表;输出规则列表中的所有规则。本发明可以分析出可信的故障预测模型,提前感知故障,为故障前瞻处理提供重要的保证。
-
公开(公告)号:CN112445635A
公开(公告)日:2021-03-05
申请号:CN201910831840.5
申请日:2019-09-04
Applicant: 无锡江南计算技术研究所
IPC: G06F11/07
Abstract: 本发明公开一种数据驱动的自适应检查点优化方法,包括以下步骤:以故障历史库中的故障数据作为样本,采用最大似然估计法,计算CPU节点失效分布;根据CPU节点失效分布,建立应用失效分布模型;根据失效分布模型,计算获得最优化检查点间隔;以最优化检查点间隔指导系统进行检查点;当有新故障发生时,更新相关的CPU节点失效分布;跳转至步骤二。本发明通过真实故障数据及自适应分布模型优化算法,动态更新作业级失效分布模型及其参数,不断优化并设定作业检查点间隔,自适应动态调节检查点间隔,实现对检查点容错模型的优化完善,尽量使检查点达到最优化,从而降低基于检查点的容错开销,极大提升系统可用性水平。
-
公开(公告)号:CN105487634B
公开(公告)日:2018-04-10
申请号:CN201510828279.7
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
IPC: G06F1/32
Abstract: 一种面向异构众核芯片的量化功耗控制方法,包括:获取异构众核芯片在每种状态下的基准功耗数据,建立外部的基础功耗数据表;获取异构众核芯片所支持的所有稳定运行频率的频率档次表;而且针对所有稳定运行频率建立不同频率下运行相同应用代码的芯片功耗存在关系,其中,频率越高,功耗越大,并且最低频率档次工作功耗一定小于最大稳定运行功耗;建立芯片的功耗管理策略作为功耗管理的依据;众核操作系统启动后,将功耗阈值寄存器、功耗预警寄存器均初始化为最大稳定运行功耗;众核芯片操作系统运行时,外部功耗管理系统启动功耗管理过程,将基础功耗表、频率档次表、功耗管理策略通知到各异构众核芯片的操作系统中。
-
公开(公告)号:CN105468456A
公开(公告)日:2016-04-06
申请号:CN201510828332.3
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
CPC classification number: G06F9/5005
Abstract: 一种基于可变网络拓扑的并行作业资源调度方法,包括:通过系统计算网络的网络监控发现系统网络拓扑发生变化;网络监控向作业资源调度服务推送网络拓扑变化信息,包括最新的网络拓扑;作业资源调度收到网络拓扑变化信息,对最新的拓扑信息进行预处理,依据网络各节点的拓扑关系形成临时计算资源池信息;与当前计算资源池匹配是否需要进行计算资源池重构,如果需要进行计算资源池重构则冻结作业资源调度服务,暂停系统的作业资源调度,保证系统服务数据的一致性;启动快速计算资源池重构,使用临时计算资源池替换正式计算资源池;形成新的计算资源池;随后解冻作业资源调度服务,利用新的计算资源池继续响应系统的各种作业资源调度请求。
-
公开(公告)号:CN114218141B
公开(公告)日:2024-02-02
申请号:CN202110479722.X
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F13/28
Abstract: 本发明公开一种针对深度学习半精度算子数据访存对界处理方法,针对深度学习中算子的计算特点和张量空间分布,对多维张量的特定维度做4B对界处理,将四维张量的输入数据按照实际参与计算的维度分为不同的类,分别使用不同的半精度数据对界处理方法;具体为,根据输入的算子类型和输入数据的计算维度,选择不同的对界方法。本发明解决了异构众核平台上半精度算子DMA访存的不对界问题,且不仅能降低内存空间的占用,还能有效减少对界处理的时间,提升对界处理的性能。
-
公开(公告)号:CN112541584B
公开(公告)日:2022-10-04
申请号:CN201910897718.8
申请日:2019-09-23
Applicant: 无锡江南计算技术研究所
IPC: G06N3/08
Abstract: 本发明公开一种深度神经网络模型并行模式选择方法,包括以下步骤:S1、测算整个神经网络模型的总数据量;S2、判断S1中获得的神经网络模型的总数据量是否超过进行训练的单个计算节点的可用内存总量,如果不超过,执行S3,如果超过,执行S4;S3、选择数据并行模式;S4、将神经网络模型的网络层进行切分,根据切分的结果,得到神经网络模型所需要分布的计算节点数量,如果输入参数中的计算节点数量不足模型切分所需节点数量两倍以上,执行S5,否则执行S6;S5、选择模型并行模式;S6、选择包括数据并行和模型并行的混合并行模式。本发明通过对模型参数、超参数和数据量的信息采集和分析,实现分布式扩展并行模式的自动选择,并且保证较高的并行性能。
-
公开(公告)号:CN114564973A
公开(公告)日:2022-05-31
申请号:CN202210197587.4
申请日:2022-03-02
Applicant: 无锡江南计算技术研究所
IPC: G06G7/26
Abstract: 本发明公开一种众核实现的超越函数处理方法,包括以下步骤:步骤1、通过一定的数学变换,将超越函数转换为常用的基本函数的复合运算实现;步骤2、利用数学函数的性质,将经过步骤1转换后的超越函数按照多项式的形式展开计算,获得相应的多项式函数实现;步骤3、结合函数特性,将超越函数的输入区间分解为若干个收敛区间,采用近似多项式逼近的方式,将步骤2中生成的无穷多项式系数降低到有限数量的多项式系数,在每个收敛区间中用近似多项式函数来拟合步骤2中得到的超越函数展开的多项式函数,通过误差逼近来获得收敛区间的范围以及对应的近似多项式函数的系数。本发明可以在处理器上实现不同精度的超越函数计算。
-
公开(公告)号:CN114218141A
公开(公告)日:2022-03-22
申请号:CN202110479722.X
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F13/28
Abstract: 本发明公开一种针对深度学习半精度算子数据访存对界处理方法,针对深度学习中算子的计算特点和张量空间分布,对多维张量的特定维度做4B对界处理,将四维张量的输入数据按照实际参与计算的维度分为不同的类,分别使用不同的半精度数据对界处理方法;具体为,根据输入的算子类型和输入数据的计算维度,选择不同的对界方法。本发明解决了异构众核平台上半精度算子DMA访存的不对界问题,且不仅能降低内存空间的占用,还能有效减少对界处理的时间,提升对界处理的性能。
-
公开(公告)号:CN114217944A
公开(公告)日:2022-03-22
申请号:CN202110453555.1
申请日:2021-04-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种神经网络的针对模型并行的动态负载均衡方法,根据不同的模型和系统的相应参数给出切分策略,并在训练过程中进一步迭代更新;根据不同的模型和系统的相应参数,给出对模型网络的切分策略,在训练过程中进一步迭代更新。本发明能够根据不同的模型和系统的相应参数自动给出较好的切分策略,无需手动调整模型,保证计算节点的负载均衡,大大提高了优化效率。
-
公开(公告)号:CN112445154B
公开(公告)日:2021-09-17
申请号:CN201910794749.0
申请日:2019-08-27
Applicant: 无锡江南计算技术研究所
IPC: G05B19/042
Abstract: 本发明公开一种异构众核处理器温度报警的多级处理方法,包括以下步骤:处理器的监测系统通过温度传感器实时检测处理器的温度信息,并将检测到的温度信息传输至监测系统;当监测系统接收到的温度信息的数值高于设定的温度阈值时,发出报警信息,并对出现预警的处理器节点的主核和从核进行降频降压操作,并在降频降压操作过程中跟踪记录相应处理器节点的温度信息;在设定的时间区间内,比较处理器节点的温度信息和设定的温度阈值,如果处理器节点的温度信息的数值低于设定的温度阈值,则将处理器恢复至正常运行状态,否则,执行下一步。本发明采用多级处理方法避免了过早采取开销较大的控制手段,兼顾了有效性和开销。
-
-
-
-
-
-
-
-
-