-
公开(公告)号:CN112308734A
公开(公告)日:2021-02-02
申请号:CN202011162740.7
申请日:2020-10-27
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种IT设备非IT能耗的计量、费用分摊方法及电子装置,适用于至少两台同类IT设备与非IT设备组成的系统,包括:将采集的各IT设备信息,输入到特征提取网络,提取相邻服务器之间的交互特征;将交互特征输入到自动编码器网络,得到各IT设备的非IT能耗计量结果。本发明解决了现有技术中存在经验式的、仅基于服务器/虚拟机的能耗粗略地推算出其对应的非IT能耗,未充分考虑其他影响因素的问题,从而提高计量结果的准确率和可靠性。
-
公开(公告)号:CN112308734B
公开(公告)日:2024-01-05
申请号:CN202011162740.7
申请日:2020-10-27
Applicant: 中国科学院信息工程研究所
IPC: G06Q50/06 , G06Q10/0639 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种IT设备非IT能耗的计量、费用分摊方法及电子装置,适用于至少两台同类IT设备与非IT设备组成的系统,包括:将采集的各IT设备信息,输入到特征提取网络,提取相邻服务器之间的交互特征;将交互特征输入到自动编码器网络,得到各IT设备的非IT能耗计量结果。本发明解决了现有技术中存在经验式的、仅基于服务器/虚拟机的能耗粗略地推算出其对应的非IT能耗,未充分考虑其他影响因素的问题,从而提高计量结果的准确率和可靠性。
-
公开(公告)号:CN116755876A
公开(公告)日:2023-09-15
申请号:CN202310583278.5
申请日:2023-05-23
Applicant: 中国科学院信息工程研究所
IPC: G06F9/50 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种大模型混合并行训练加速方法和系统,其步骤包括:1)利用分布式集群采用双向流水线并行方案运行目标大模型,并采集分布式集群的静态数据和动态数据;静态数据包括集群中各GPU之间每次数据传输的通信量和目标大模型每层计算操作的计算量,动态数据包括各GPU之间每次数据传输的通信时间和目标大模型每层计算操作的计算时间;2)依据静态、动态数据构建GPU性能模型,通过平衡流水线利用率和设备利用率对双向流水线并行方案进行优化;3)结合数据并行方案和优化后的双向流水线并行方案构建混合并行方案,并依据GPU性能模型确定混合并行方案的最优混合并行模式;然后按照所确定最优混合并行模式对目标大模型进行训练。
-
-