-
公开(公告)号:CN119254686A
公开(公告)日:2025-01-03
申请号:CN202411409537.3
申请日:2024-10-10
Applicant: 北京工业大学
Abstract: 一种基于Q‑learning的高能效任务驱动动态片上互连通信方法属于计算机体系片上互连领域。本发明采用自适应拓扑结构来映射任务,并根据任务的特征不同划分出不同的区域进行任务处理。这种方法可以为每个任务分配特定的片上资源和拓扑结构类型,从而节省片上资源消耗。通过自适应拓扑结构,系统可以根据任务的需求和特性,在片上网络中灵活地调整连接关系和路由方式。同时,通过划分不同的区域,可以将不同任务的处理过程隔离开来,最大程度减少干扰和冲突的发生。使用Q‑learning强化学习算法在任务运行时以低延迟和低功耗为目标动态改变路由算法的传输方向和虚拟通道的数量可以有效实现片上网络中性能和功耗的平衡。
-
公开(公告)号:CN117591274A
公开(公告)日:2024-02-23
申请号:CN202311487081.8
申请日:2023-11-09
Applicant: 北京工业大学
Abstract: 本发明公开一种面向深度神经网络的异构多核系统访存管理方法,属于计算机体系存储系统结构领域。本发明利用CPU‑GPU异构多核系统加速DNN模型训练,并根据其访存特点设计访存控制器,在DNN训练过程中对多核心共享的末级缓存进行卸载、预取和释放操作,细粒度数据传输过程并显著提高了末级缓存利用率。此外,访存控制器还设计了延迟隐藏机制,通过将特征提取层大量中间数据的存取过程和计算过程相重叠,减少了模型计算过程中由于末级缓存未命中、需要等待DRAM访存响应带来的计算性能损耗,优化了训练效率。
-