-
公开(公告)号:CN119415252A
公开(公告)日:2025-02-11
申请号:CN202411445102.4
申请日:2024-10-16
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种软硬件结合的内存访问模式分析方法和装置,包括:获取用于执行应用程序的硬件平台,查询硬件平台中性能计数器的事件类型列表,得到性能硬件计数器支持的事件类型集;根据事件类型集,调用硬件平台的系统接口获取事件编码;根据预设的事件采集阈值和采集频率,使用系统接口配置硬件采集机制;在硬件平台中分配用于存储事件数据的存储空间;硬件平台运行硬件采集机制,按照事件采集阈值和采集频率,采集应用程序访问内存时产生的事件数据,并将其写入存储空间;当存储空间内事件数量达到设定值后,内存分析工具处理存储空间内的事件数据,计算访问地址之间的步长,通过步长和地址访问频率确定应用程序的内存访问模式。
-
公开(公告)号:CN105988952A
公开(公告)日:2016-10-05
申请号:CN201510092224.4
申请日:2015-02-28
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
CPC classification number: G06F9/3851 , G06F9/30043 , G06F9/3838 , G06F9/5066 , G06F12/08
Abstract: 本发明实施例提供一种为内存控制器分配硬件加速指令的方法和装置。该方法包括:按照多个硬件加速指令之间的依赖关系将多个硬件加速指令划分为不同的指令集合;按照将硬件加速指令之间无依赖关系的不同指令集合分配给不同的内存控制器的原则,获取各指令集合与计算机系统中的内存控制器的第一映射关系;根据第一内存控制器集合中的各内存控制器的负载信息调整第一映射关系,以获得各指令集合与计算机系统的内存控制器的第二映射关系;按照第二映射关系将各指令集合中的硬件加速指令分配给第二内存控制器集合中的内存控制器。实现由计算机系统中的多个内存控制器执行硬件加速指令时,各个内存控制器的负载均衡。
-
公开(公告)号:CN104679477B
公开(公告)日:2017-08-01
申请号:CN201510082216.1
申请日:2015-02-15
Applicant: 中国科学院计算技术研究所
IPC: G06F9/30
Abstract: 本发明提供一种面向可变粒度内存系统的二进制文件重写方法,包括:在二进制文件的中间表示中找到热循环区域;对于访存行为符合可变粒度访存模式的热循环区域,合并该区域内的访存信息,并且在该区域之前插入头语句;以及,根据修改后的热循环区域生成目标机器代码。本发明能够自动完成在二进制文件上支持可变粒度内存系统的访存操作;通过自动分析应用程序特征以及可变粒度内存系统的核心特征,选择合适的重写方式,兼顾了二进制文件重写过程的效率和二进制文件的执行性能。
-
公开(公告)号:CN104679477A
公开(公告)日:2015-06-03
申请号:CN201510082216.1
申请日:2015-02-15
Applicant: 中国科学院计算技术研究所
IPC: G06F9/30
Abstract: 本发明提供一种面向可变粒度内存系统的二进制文件重写方法,包括:在二进制文件的中间表示中找到热循环区域;对于访存行为符合可变粒度访存模式的热循环区域,合并该区域内的访存信息,并且在该区域之前插入头语句;以及,根据修改后的热循环区域生成目标机器代码。本发明能够自动完成在二进制文件上支持可变粒度内存系统的访存操作;通过自动分析应用程序特征以及可变粒度内存系统的核心特征,选择合适的重写方式,兼顾了二进制文件重写过程的效率和二进制文件的执行性能。
-
公开(公告)号:CN116521235A
公开(公告)日:2023-08-01
申请号:CN202310303174.4
申请日:2023-03-24
Applicant: 中国科学院计算技术研究所
IPC: G06F9/38 , G06F15/80 , G06F12/0811
Abstract: 本发明提出一种支持弹性向量执行的数据处理方法,包括:将主程序划分为多个子程序,选取该子程序中的向量化循环子程序为目标子程序,获取该目标子程序的计算访存比;依据该计算访存比对处理器的核分配SIMD计算通道,并运行该主程序;当任一目标子程序的计算访存比发生变化时,预测该目标子程序的性能上限,根据该性能上限对该核重新分配SIMD计算通道后,继续运行该主程序。本发明还提出一种支持弹性向量执行的数据处理系统,以及一种支持弹性向量执行的数据处理装置。
-
公开(公告)号:CN105988952B
公开(公告)日:2019-03-08
申请号:CN201510092224.4
申请日:2015-02-28
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
Abstract: 本发明实施例提供一种为内存控制器分配硬件加速指令的方法和装置。该方法包括:按照多个硬件加速指令之间的依赖关系将多个硬件加速指令划分为不同的指令集合;按照将硬件加速指令之间无依赖关系的不同指令集合分配给不同的内存控制器的原则,获取各指令集合与计算机系统中的内存控制器的第一映射关系;根据第一内存控制器集合中的各内存控制器的负载信息调整第一映射关系,以获得各指令集合与计算机系统的内存控制器的第二映射关系;按照第二映射关系将各指令集合中的硬件加速指令分配给第二内存控制器集合中的内存控制器。实现由计算机系统中的多个内存控制器执行硬件加速指令时,各个内存控制器的负载均衡。
-
公开(公告)号:CN104503819A
公开(公告)日:2015-04-08
申请号:CN201510003749.6
申请日:2015-01-05
Applicant: 中国科学院计算技术研究所
IPC: G06F9/45
Abstract: 本发明公开了一种面向异OS的汇编器及汇编移植方法,本发明涉及计算机代码移植领域,该方法包括获取源代码,将所述源代码进行编译,获取源汇编程序;选择目标操作系统,按照所述目标操作系统的汇编格式,将所述源汇编程序转化为符合所述汇编格式的目标汇编程序;获取所述目标操作系统的应用程序二进制接口规范,将所述目标汇编程序转化为符合所述应用程序二进制接口规范的新目标汇编程序;面向所述目标操作系统,将所述新目标汇编程序进行封装,以完成汇编移植。通过本发明的面向异OS汇编器可以转换成面向不同目标操作系统的可运行的汇编程序,这样就克服了不同OS带来的代码移植的困难。
-
-
-
-
-
-