摘要:
本发明涉及电数字数据处理技术领域,特别涉及一种智算中心网络架构的仿真寻优方法、装置、设备及介质。方法包括:获取待训练大语言模型的训练配置信息;基于训练配置信息和预设的离散事件仿真策略,利用预设仿真器对待训练大语言模型进行训练仿真,得到仿真结果,其中,预设仿真器利用预设ECS框架得到;根据仿真结果调整智算中心网络架构,并得到最优的智算中心网络架构。由此,通过采用实体组件系统框架设计智算中心网络仿真器,能够实现大语言模型训练的完整仿真过程,以寻找最优的智算中心网络架构,解决了现有网络仿真器不具备可扩展性,无法支持大规模智算中心网络的仿真的问题,从而提升仿真大规模智算中心网络的效率和准确性。
公开/授权文献
- CN118101493B 智算中心网络架构的仿真寻优方法、装置、设备及介质 公开/授权日:2024-06-25