-
公开(公告)号:CN110262900B
公开(公告)日:2023-09-29
申请号:CN201910536896.8
申请日:2019-06-20
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于申威众核处理器的主核与核组之间通信锁同步运行加速方法,包括步骤如下:A、判断程序段A、程序段B、程序段C之间的程序上下文依赖关系;如果程序段A、程序段B、程序段C三者之间都存在程序上下文依赖关系,则顺序执行;否则,调整程序段A、程序段B、程序段C之间的执行顺序,进行执行;B、对连续的后三段程序段执行步骤A直至执行完所有的程序。本发明判断程序段之间的程序上下文依赖关系,分情况灵活处理,还引入了“通信锁”同步机制,节省了主核等待时间,实现了主核和核组的并行处理,程序执行过程中,减少了对spawn和join核组线程的需要次数,提高了程序的执行效率。
-
公开(公告)号:CN113467976A
公开(公告)日:2021-10-01
申请号:CN202110854458.3
申请日:2021-07-28
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F9/54
Abstract: 本发明公开了一种自动优化的MPI通信传输方法。本发明所述自动优化MPI通信传输方法,根据通信数组的数据量、通信次数和前后代码段情况,选择最优通信数据量区间{min,max}下每个数据包的大小,利用MPI通信带宽、降低时延,提高程序通信执行效率,特别在大规模下能显著减少程序执行的时间开销,实现对不同通信数据量的MPI程序进行自动优化。
-
公开(公告)号:CN110262900A
公开(公告)日:2019-09-20
申请号:CN201910536896.8
申请日:2019-06-20
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于申威众核处理器的主核与核组之间通信锁同步运行加速方法,包括步骤如下:A、判断程序段A、程序段B、程序段C之间的程序上下文依赖关系;如果程序段A、程序段B、程序段C三者之间都存在程序上下文依赖关系,则顺序执行;否则,调整程序段A、程序段B、程序段C之间的执行顺序,进行执行;B、对连续的后三段程序段执行步骤A直至执行完所有的程序。本发明判断程序段之间的程序上下文依赖关系,分情况灵活处理,还引入了“通信锁”同步机制,节省了主核等待时间,实现了主核和核组的并行处理,程序执行过程中,减少了对spawn和join核组线程的需要次数,提高了程序的执行效率。
-
公开(公告)号:CN110222007A
公开(公告)日:2019-09-10
申请号:CN201910536855.9
申请日:2019-06-20
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于申威众核处理器的加速运行方法,包括:A、判断程序段A、程序段B、程序段C之间的程序上下文依赖关系;如果程序段A、程序段B、程序段C三者之间都存在程序上下文依赖关系,则顺序执行;否则,调整程序段A、程序段B、程序段C之间的执行顺序,进行执行;B、对连续的后三段程序段执行步骤A直至执行完所有的程序。本发明判断程序段以及程序子段之间的程序上下文依赖关系,分情况灵活处理,引入了通信锁同步机制,节省了主核等待时间,实现了主核和核组的并行处理,程序执行过程中,减少了对spawn和join核组线程的需要次数,提高了程序的执行效率。
-
公开(公告)号:CN110262884A
公开(公告)日:2019-09-20
申请号:CN201910536853.X
申请日:2019-06-20
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于申威众核处理器的核组内多程序多数据流分区并行的运行方法,本发明根据不同程序段之间的依赖关系,将多个可并行优化程序段放入同一核组执行,在同一核组内部,可以选择同步或者异步执行多个程序段;根据同一程序段内不同程序子段之间的依赖关系,在同一核组内部,可以选择并行执行多个程序子段。此种方法可以减少核组spawn与join的次数,减少主核与核组之间DMA传输的次数,重复利用核组中的数据,从而提高程序的运行效率。
-
公开(公告)号:CN113835984A
公开(公告)日:2021-12-24
申请号:CN202111135266.3
申请日:2021-09-27
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F11/34
Abstract: 本发明公开了一种基于国产超算微架构的众核应用性能评估方法。本发明针对神威国产超级计算机系统Athread并行编程模式中,线程组任务分发和结束、数据传输、数据计算、从核同步与通信等主要流程,根据大量不同规模的实际算例运行数据,拟合出对应的时间运行模型,且误差在10%以内,能有效的评估众核应用程序的运行性能。
-
公开(公告)号:CN110222007B
公开(公告)日:2023-11-24
申请号:CN201910536855.9
申请日:2019-06-20
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于申威众核处理器的加速运行方法,包括:A、判断程序段A、程序段B、程序段C之间的程序上下文依赖关系;如果程序段A、程序段B、程序段C三者之间都存在程序上下文依赖关系,则顺序执行;否则,调整程序段A、程序段B、程序段C之间的执行顺序,进行执行;B、对连续的后三段程序段执行步骤A直至执行完所有的程序。本发明判断程序段以及程序子段之间的程序上下文依赖关系,分情况灵活处理,引入了通信锁同步机制,节省了主核等待时间,实现了主核和核组的并行处理,程序执行过程中,减少了对spawn和join核组线程的需要次数,提高了程序的执行效率。
-
公开(公告)号:CN113835984B
公开(公告)日:2023-08-08
申请号:CN202111135266.3
申请日:2021-09-27
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F11/34
Abstract: 本发明公开了一种基于国产超算微架构的众核应用性能评估方法。本发明针对神威国产超级计算机系统Athread并行编程模式中,线程组任务分发和结束、数据传输、数据计算、从核同步与通信等主要流程,根据大量不同规模的实际算例运行数据,拟合出对应的时间运行模型,且误差在10%以内,能有效的评估众核应用程序的运行性能。
-
公开(公告)号:CN110262884B
公开(公告)日:2023-03-24
申请号:CN201910536853.X
申请日:2019-06-20
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于申威众核处理器的核组内多程序多数据流分区并行的运行方法,本发明根据不同程序段之间的依赖关系,将多个可并行优化程序段放入同一核组执行,在同一核组内部,可以选择同步或者异步执行多个程序段;根据同一程序段内不同程序子段之间的依赖关系,在同一核组内部,可以选择并行执行多个程序子段。此种方法可以减少核组spawn与join的次数,减少主核与核组之间DMA传输的次数,重复利用核组中的数据,从而提高程序的运行效率。
-
公开(公告)号:CN103259878B
公开(公告)日:2015-09-30
申请号:CN201310135442.2
申请日:2013-04-18
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明的针对无线局域网特定目标用户的MAC地址捕获方法,包括:a).数据获取;b).基于哈希表构建状态集和更新RSSI序列,状态集 记作:;c).更新WLAN的拓扑结构;d).以周期,更新并查找RSSI统计均值最大的第一类STA状态集;e).以周期,更新并查找RSSI统计均值最大的第二类STA状态集;f).判定特定目标用户的MAC地址。本发明的MAC地址捕获方法,支持当前的各种WLAN标准(IEEE 802.11 a/b/g/n),可用无痕迹、非介入的方式,快速捕获特定目标用户所使用的各种WLAN终端设备的MAC地址,具有多用户适用性、网络连通适用性、无线数据量适用性、取证快速性与无痕性的优点。
-
-
-
-
-
-
-
-
-