-
公开(公告)号:CN102955737A
公开(公告)日:2013-03-06
申请号:CN201210439335.4
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
IPC: G06F11/36
Abstract: 一种异构处理器体系的程序调试方法和系统。所述程序调试方法包括:调试器根据用户设置对所述主核程序和从核程序分别设置用户断点;操作系统捕获调试异常,所述调试异常由所述主核或从核基于用户断点而产生;操作系统识别所述调试异常为主核调试异常还是从核调试异常,并将所述调试异常的主核现场和/或从核现场映射到调试器可访问的地址空间,然后唤醒所述调试器;调试器被唤醒,查询所记录的主核现场和/或从核现场。本发明技术方案提供了实现异构并行程序调试的通用方案,以支撑异构处理器体系上两种组件的并行程序调试。
-
公开(公告)号:CN102929780A
公开(公告)日:2013-02-13
申请号:CN201210441991.8
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
IPC: G06F11/36
Abstract: 一种基于应用逻辑序的并行程序调试方法和装置。所述并行程序调试方法包括定义数据链,抽象描述复杂并行程序的语义逻辑,所述数据链包括应用逻辑序、逻辑分段集合和正确性验证算法,所述应用逻辑序为迭代步序或数据流序;按照所述数据链的定义跟踪所述并行程序运行时所述程序变量的数据,以所述正确性验证算法验证所述程序变量的数据并记录验证结果;在所述并行程序运行结束或异常退出后,重放所记录的验证结果。本发明基于并行应用系统语义逻辑的重放调试方案有利于并行程序的错误定位,并且减少了逻辑序信息量,节省了存储和分析的开销。
-
公开(公告)号:CN112540899B
公开(公告)日:2022-10-04
申请号:CN201910892364.8
申请日:2019-09-20
Applicant: 无锡江南计算技术研究所
IPC: G06F11/34
Abstract: 本发明公开了一种基于性能数据时空特性的分析装置,包括代码采集装置、性能采集装置、处理装置和显示装置,所述代码采集装置用于统计比重大于1%的代码空间、相同或具有90%以上重叠的代码空间、相同代码空间出现的时间节点和时间间隔以及同一代码空间与不同代码空间相邻出现的代码模式;所述性能采集装置根据代码采集装置的采集信息采集对应的性能事件;所述处理装置对采集信息进行处理,并筛选出性能事情的优缺点;所述显示装置根据处理装置输入的筛选信息,在显示屏上输出并行程序的缺陷的和优化方向。本发明能够快速定位程序的性能瓶颈,并为用户提供优化方向,分析效率高、优化速度快。
-
公开(公告)号:CN112445696B
公开(公告)日:2022-09-13
申请号:CN201910822174.9
申请日:2019-09-02
Applicant: 无锡江南计算技术研究所
IPC: G06F11/36
Abstract: 本发明公开一种面向异构众核Dcache纵向一致性的调试方法,包括以下步骤:S1、启动软件调试器,运行可执行程序,设置若干个从核断点;S2、在程序运行到从核断点前,保存现场;S3、在预设的地址空间上预先设计一段指令,用于调用函数Flush,从而刷新当前从核所有Dcache行到主存中,当程序运行到从核断点前时,执行S2;S4、在完成从核Dcache的数据刷新后,利用ret指令,在程序运行到从核断点后,将程序的控制流转回到断点处理程序,实现现场的恢复;S5、当程序完成现场恢复后,返回程序原来的指令,继续往下执行。本发明在不增加硬件实现开销的前提下,保证软件调试时获取到真实有效的数据,从而实现错误现场的精确定位,有效支撑了异构众核上的软件调试,保证了软件调试功能的可用性。
-
公开(公告)号:CN112445675B
公开(公告)日:2022-09-13
申请号:CN201910822230.9
申请日:2019-09-02
Applicant: 无锡江南计算技术研究所
IPC: G06F11/30
Abstract: 本发明公开一种基于层树网络的大规模并行程序性能数据快速收集方法,包括以下步骤:S1、依据计算节点启动的进程最多能使用的端口号数目限制M,确定子收集节点所需负责的子节点数目m;S2、根据S1中获得m值,将所需采集性能数据的总进程数N划分为一个各个树层并行度相当的拓扑网络;S3、分析各个树层的数据传输效率比1:η1,η2,...,ηh‑1,其中h为树的深度;S4、根据S3中各个树层的数据传输效率比,实现对拓扑网络的优化;S5、通过socket建立层树收集网络,实现对性能数据的收集。本发明针对异构众核结构特征,结合异构众核处理器的特点,将部分收集进程下沉至计算节点上,并且结合各树层的数据传输效率对树型收集网络进行拓扑优化,能够实现大规模并行程序性能数据的快速收集。
-
公开(公告)号:CN112433965B
公开(公告)日:2022-07-12
申请号:CN201910788897.1
申请日:2019-08-26
Applicant: 无锡江南计算技术研究所
IPC: G06F12/0897 , G06F12/0871
Abstract: 本发明公开一种面向SPM存储层次的数据缓存实现方法,包括以下步骤:S1、建立数据缓存的编程描述;S2、编译器分析编译指示,确定循环分块参数LoopBlockKey;S3、编译器根据S2中获得的循环分块参数,计算每一个循环块的计算、访存开销与数据传送开销的比值,得到并行隐藏参数Hkey;S4、根据S3得到的并行隐藏参数,反馈修正,得到最终的循环分块参数;S5、根据循环分块参数和并行隐藏参数,选择循环重构策略进行循环重构。本发明有效提升了编译器的上下文分析精确度和应用的访存效率,且可以做到计算与不同存储层次间的数据传送并行进行,有效利用处理器的各个存储层次,更进一步提升程序性能。
-
公开(公告)号:CN114238067A
公开(公告)日:2022-03-25
申请号:CN202110480190.1
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于程序性能计数的异常进程快速定位方法,包括以下步骤:S1、用户提交应用作业;S2、作业调度器在启动应用作业的同时,在每个任务对应的处理器上初始化预设的硬件性能计数器;S3、若程序正常执行直至结束,则基于性能计数器实现的性能计数不对程序产生干扰;S4、若程序执行错误,则启动错误定位处理流程;S45、报告异常任务,用于进一步展开精确的错误原因定位。本发明有效提高了开发人员的调试开发效率、提升了系统资源利用率。
-
公开(公告)号:CN112445547A
公开(公告)日:2021-03-05
申请号:CN201910822171.5
申请日:2019-09-02
Applicant: 无锡江南计算技术研究所
IPC: G06F9/448 , G06F15/163
Abstract: 本发明公开一种面向异构众核处理器的低扰动性能数据采集方法,用于国产众核处理器,包括以下步骤:S1、在主核设置需要采集的性能数据所对应的性能事件,并对性能事件进行分类;S2、通过CSR寄存器设置硬件计数器的初值、计数使能控制、计数事件的选择,即将性能事件选择为计数事件,以实现对硬件计数器的初始化;S3、用户对需要进行性能数据采集的程序段进行插装,通过计算获得该程序段触发该性能事件的次数为两次统计接口函数的差值;S4、主核通过读取保存在统计接口参数地址中的性能事件的计数值实现性能数据的采集。本发明可以对多类性能事件进行并行采集,大大提高了数据采集效率,实现了高效全面、对程序低扰动的性能数据采集。
-
公开(公告)号:CN105243023B
公开(公告)日:2017-09-26
申请号:CN201510831795.5
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
Abstract: 本发明提供了一种并行运行时错误检测方法,包括:设置初始值为0的第一计数器和第二计数器;在进程进入一个MPI阻塞操作时,第一计数器加一,并启动一个定时器;在从该阻塞操作返回时,将第一计数器的值赋给第二计数器,并取消定时器;而且,如果该MPI阻塞在一个MPI调用中,则在定时器满时触发一个软中断信号,从而进入一个中断处理函数,在中断处理函数中比较第一计数器和第二计数器的当前值,如果第一计数器和第二计数器的当前值不相等,则执行状态转储并随后执行死锁检测;如果第一计数器和第二计数器的当前值相等,则从中断处理函数返回,并继续执行并行程序。
-
-
-
-
-
-
-
-