-
公开(公告)号:CN114218062A
公开(公告)日:2022-03-22
申请号:CN202110425772.X
申请日:2021-04-20
Applicant: 无锡江南计算技术研究所
IPC: G06F11/36
Abstract: 本发明公开一种测试程序批量变种方法,包括以下步骤:S1、对测试程序源码进行分析,确定核心代码段区间;S2、得到核心段代码调用的函数代码;S3、对于改变程序执行路径的测试程序,将其核心代码段进行复制并使用if/else结构对两段相同的核心代码段进行区分,将S2得到的核心段代码调用的函数代码复制,将其中一份函数代码的函数名加上后缀,同时将if/else结构中if条件内的代码段调用的函数加上后缀;S4、得到变种程序源码;S5、将变种程序源码编译成汇编代码;S6、得到变种汇编代码;S7、将变种汇编代码编译成可执行文件。本发明解决了高速缓存一致性测试程序集合中的程序不够丰富,覆盖面不够全面的问题。
-
公开(公告)号:CN114217733A
公开(公告)日:2022-03-22
申请号:CN202110479680.X
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F3/06
Abstract: 本发明公开一种面向IO转发系统的IO处理框架,包括以下作业粒度的IO调度单元,用于在IO转发节点上,根据作业的job ID将所有的IO请求进行分类;文件粒度的IO调度单元,用于将来自同一作业的IO请求按照文件进行分配,并以文件为单位进行调度;IO操作级别的IO调度单元,用于在IO请求调度过程中分析来自同一个文件的多个IO请求之间的依赖关系,并根据这些依赖关系,实现合并写IO请求和优化预读;还包括一动态资源调度单元,用于根据各个IO调度单元对IO请求的执行情况。本发明解决了高性能计算转发架构下的IO转发服务器的IO调度问题。
-
公开(公告)号:CN109684061A
公开(公告)日:2019-04-26
申请号:CN201811583475.2
申请日:2018-12-24
Applicant: 无锡江南计算技术研究所
CPC classification number: G06F9/4881 , G06F9/5066 , G06F9/5083 , G06F2209/5018
Abstract: 本发明公开一种非结构网格众核粗粒度并行计算方法,该方法在第一级非结构网格的区域分解的基础上增加了第二级的线程级区域分解,每个从核求解各自的独立计算区域,保证从核核心计算任务的数据命中率,实现MPI进程级的粗粒度并行和从核线程级的粗粒度并行。本发明能够解决一般非结构网格应用在多态异构处理器上的适应性问题,根据非结构网格数据规模自动完成二级负载平衡和计算核心的粗粒度众核并行,提高了异构体系结构上非结构网格数值模拟的计算效率和并行效率。
-
公开(公告)号:CN105487815A
公开(公告)日:2016-04-13
申请号:CN201510828200.0
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
IPC: G06F3/06
CPC classification number: G06F3/0611 , G06F2003/0692
Abstract: 本发明提供了一种基于RDMA机制的并行输入输出方法。所述并行输入输出方法包括:客户端通过套接字端口向服务器发送输入输出操作信息;客户端通过InfiniBand端口向服务器传送输入输出操作数据;服务器根据接收到的输入输出操作信息和输入输出操作数据统一进行输入输出操作。
-
公开(公告)号:CN114564397B
公开(公告)日:2025-05-09
申请号:CN202210185716.8
申请日:2022-02-28
Applicant: 无锡江南计算技术研究所
IPC: G06F11/3668
Abstract: 本发明公开一种基于控制约束的访存测试程序生成方法,包括以下步骤:步骤1、生成控制核心运行的程序,在其中声明可操作的地址空间大小以及首地址,并生成计算核心的代码段;步骤2、生成计算核心访存测试程序,将计算核心的访存首地址设置成控制程序申请的可操作首地址;步骤3、在计算核心访存地址遍历生成时,进行地址访存序列的控制生成;步骤4、根据步骤3中获得的参数,形成对应的测试程序。本发明面向国产向众核异构处理器实现满足约束条件的随机访存测试,另外能够根据访存策略进行定制,对处理器的存储一致性实现有针对性的验证测试,实现了合法且随机的访存测试程序生成。
-
公开(公告)号:CN114218064B
公开(公告)日:2025-05-06
申请号:CN202110426746.9
申请日:2021-04-20
Applicant: 无锡江南计算技术研究所
IPC: G06F11/3668 , G06N3/126
Abstract: 本发明公开一种基于遗传算法的极端测试用例生成方法,包括以下步骤:S1、种群生成器生成初始种群;S2、适应值计算器对S1中获得的初始种群中每个个体进行适应值计算;S3、适应值收集模块收集所有个体的适应值,并反馈给遗传算法核心;S4、遗传算法核心判断是否获得近优解,得到近优解并跳转到S5,若还未获得近优解,遗传算法核心根据上一代的适应值结果,交叉和变异产生多组指令序列,并由种群生成器嵌入汇编代码,生成下一代种群,跳转到S2;S5、得到近优解汇编代码。本发明不需要人工排指令来编写极端测试用例,可以自动生成特定的极端测试用例。
-
公开(公告)号:CN114218141B
公开(公告)日:2024-02-02
申请号:CN202110479722.X
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F13/28
Abstract: 本发明公开一种针对深度学习半精度算子数据访存对界处理方法,针对深度学习中算子的计算特点和张量空间分布,对多维张量的特定维度做4B对界处理,将四维张量的输入数据按照实际参与计算的维度分为不同的类,分别使用不同的半精度数据对界处理方法;具体为,根据输入的算子类型和输入数据的计算维度,选择不同的对界方法。本发明解决了异构众核平台上半精度算子DMA访存的不对界问题,且不仅能降低内存空间的占用,还能有效减少对界处理的时间,提升对界处理的性能。
-
公开(公告)号:CN114217733B
公开(公告)日:2023-10-13
申请号:CN202110479680.X
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F3/06
Abstract: 本发明公开一种面向IO转发系统的IO处理框架,包括以下作业粒度的IO调度单元,用于在IO转发节点上,根据作业的job ID将所有的IO请求进行分类;文件粒度的IO调度单元,用于将来自同一作业的IO请求按照文件进行分配,并以文件为单位进行调度;IO操作级别的IO调度单元,用于在IO请求调度过程中分析来自同一个文件的多个IO请求之间的依赖关系,并根据这些依赖关系,实现合并写IO请求和优化预读;还包括一动态资源调度单元,用于根据各个IO调度单元对IO请求的执行情况。本发明解决了高性能计算转发架构下的IO转发服务器的IO调度问题。
-
公开(公告)号:CN115271084A
公开(公告)日:2022-11-01
申请号:CN202210933691.5
申请日:2022-08-04
Applicant: 无锡江南计算技术研究所
Abstract: 一种面向量子加速设备的混合式编译方法,属于量子计算技术领域。本发明包括如下步骤:步骤S1,通过标准化的量子代码编程接口,对混合代码中的经典代码与量子代码进行识别;步骤S2,对经典代码进行编译,生成可执行码;步骤S3,运行经典代码的可执行码,若遇到量子代码编程接口,则进行步骤S4,并在接收到步骤S5的运行结果后,继续运行并重复本步骤的操作,直至整个计算进程结束;步骤S4,对量子代码进行编译,生成可执行码;步骤S5,运行量子代码的可执行码。本发明操作简单高效,易于实现,同时可靠性高。
-
公开(公告)号:CN115271078A
公开(公告)日:2022-11-01
申请号:CN202210933684.5
申请日:2022-08-04
Applicant: 无锡江南计算技术研究所
Abstract: 一种超级计算机与量子计算机协同的软件栈及工作方法,属于量子计算技术领域。本发明的软件栈包括:经典与量子协同编程框架:在经典编程模型框架中新增量子语言要素的扩展;异构融合编译环境:能够通过要素分析识别出经典与量子混合应用程序中的经典程序部分和量子程序部分;经典与量子协同操作系统:将硬件资源进行了抽象并提供相应的驱动程序;量子指令集:对量子计算机硬件系统进行控制的指令集,与量子物理体系进行耦合。本发明将超级计算机软件模型与量子计算机软件模型融合,即能够保证传统超级计算机正常运行,又能发挥量子加速计算的性能优势,推进量子计算机更广泛应用。
-
-
-
-
-
-
-
-
-