-
公开(公告)号:CN118796196A
公开(公告)日:2024-10-18
申请号:CN202410034003.0
申请日:2024-01-09
Applicant: 中国移动通信有限公司研究院 , 中国科学院计算技术研究所 , 中国移动通信集团有限公司
Abstract: 本申请实施例提供一种编译方法、编译装置、处理设备、芯片及计算机可读存储介质,所述方法包括:获取第一源代码;所述第一源代码为通过第一编程语言编程的源代码;所述第一编程语言为具备领域特定语言DSL的编程语言;提取所述第一源代码中的DSL;所述DSL表征所述第一源代码中的线性代数计算过程;将所述DSL转换为第一中间表示;对所述第一中间表示进行优化操作,生成第二中间表示;所述第二中间表示是所述第一中间表示的等价中间表示,所述第二中间表示的计算量小于所述第一中间表示的计算量;将所述第二中间表示转换为第一代码;所述第一代码的编码语言为所述第一编码语言;将所述第一代码与所述第一源代码进行结合,生成第二源代码。
-
公开(公告)号:CN116521235A
公开(公告)日:2023-08-01
申请号:CN202310303174.4
申请日:2023-03-24
Applicant: 中国科学院计算技术研究所
IPC: G06F9/38 , G06F15/80 , G06F12/0811
Abstract: 本发明提出一种支持弹性向量执行的数据处理方法,包括:将主程序划分为多个子程序,选取该子程序中的向量化循环子程序为目标子程序,获取该目标子程序的计算访存比;依据该计算访存比对处理器的核分配SIMD计算通道,并运行该主程序;当任一目标子程序的计算访存比发生变化时,预测该目标子程序的性能上限,根据该性能上限对该核重新分配SIMD计算通道后,继续运行该主程序。本发明还提出一种支持弹性向量执行的数据处理系统,以及一种支持弹性向量执行的数据处理装置。
-
公开(公告)号:CN112130848B
公开(公告)日:2022-06-14
申请号:CN202011013688.9
申请日:2020-09-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出了一种面向便笺式存储器的带宽感知循环分块优化技术,该技术通过协调考虑带宽利用率和片上存储器容量来增强传统的循环分块优化方法。根据针对DMA的测试分析得到的带宽行为模型,创建决策树以针对不同类型的数据访问模式,从而选择最佳的数据提取操作。利用运行时循环分块框架来确定最佳分块大小,并在运行时生成分块代码。并且,本发明还通过利用参数引导的IPA来寻找不规则访问的静态分块机会,并使用冗余计算来节省SPM容量,从而增强循环分块的效果。
-
公开(公告)号:CN112130848A
公开(公告)日:2020-12-25
申请号:CN202011013688.9
申请日:2020-09-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出了一种面向便笺式存储器的带宽感知循环分块优化技术,该技术通过协调考虑带宽利用率和片上存储器容量来增强传统的循环分块优化方法。根据针对DMA的测试分析得到的带宽行为模型,创建决策树以针对不同类型的数据访问模式,从而选择最佳的数据提取操作。利用运行时循环分块框架来确定最佳分块大小,并在运行时生成分块代码。并且,本发明还通过利用参数引导的IPA来寻找不规则访问的静态分块机会,并使用冗余计算来节省SPM容量,从而增强循环分块的效果。
-
公开(公告)号:CN105988952B
公开(公告)日:2019-03-08
申请号:CN201510092224.4
申请日:2015-02-28
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
Abstract: 本发明实施例提供一种为内存控制器分配硬件加速指令的方法和装置。该方法包括:按照多个硬件加速指令之间的依赖关系将多个硬件加速指令划分为不同的指令集合;按照将硬件加速指令之间无依赖关系的不同指令集合分配给不同的内存控制器的原则,获取各指令集合与计算机系统中的内存控制器的第一映射关系;根据第一内存控制器集合中的各内存控制器的负载信息调整第一映射关系,以获得各指令集合与计算机系统的内存控制器的第二映射关系;按照第二映射关系将各指令集合中的硬件加速指令分配给第二内存控制器集合中的内存控制器。实现由计算机系统中的多个内存控制器执行硬件加速指令时,各个内存控制器的负载均衡。
-
-
公开(公告)号:CN104615473B
公开(公告)日:2017-11-24
申请号:CN201310539297.4
申请日:2013-11-04
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F9/45
CPC classification number: G06F8/443 , G06F11/3404
Abstract: 本发明实施例提供一种轮廓技术编译的优化方法及装置。本发明轮廓技术编译的优化方法,包括:在程序控制流图上划分出至少两个区域,将各个区域对应程序包含的插桩函数替换为计数操作;将所述各个区域对应程序在主线程上执行,执行至一个区域对应程序结束时,启动至少一个微线程执行所述区域对应程序包含的插桩函数除计数操作外的操作,用于记录所述区域对应程序执行时的信息;所述微线程与执行下一个区域对应程序的主线程并行执行。本发明实施例提高了轮廓技术编译时的执行效率,解决了现有技术中执行效率较低的问题。
-
公开(公告)号:CN104239080B
公开(公告)日:2017-11-17
申请号:CN201310239648.X
申请日:2013-06-17
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
Inventor: 刘颖
IPC: G06F9/445
Abstract: 本发明实施例提供一种异构系统程序启动方法和装置,该方法包括:在通过编译器编译开放计算语言程序核心部分时,确定核心部分的输入参数是否被修改;保存各输入参数是否被修改的结果;通过运行时系统启动核心部分时,根据所述输入参数是否被修改的结果,对被修改的输入参数执行复制操作。本发明实施例提供的异构系统程序启动方法和装置,避免运行时系统对核心部分输入参数的冗余复制操作,降低OpenCL运行时系统的开销,提高OpenCL程序执行效率。
-
公开(公告)号:CN103885886B
公开(公告)日:2016-08-24
申请号:CN201210558814.8
申请日:2012-12-20
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
Inventor: 刘颖
IPC: G06F12/02
Abstract: 本发明实施例公开了一种全局数据的地址分配方法及相关装置,其中,一种全局数据的地址分配方法包括:对源程序中的全局数据进行分组,其中,同一分组内的所有全局数据满足如下条件:同一分组内的所有全局数据在同一个基本块中被使用,同一分组内的所有全局数据的数据大小之和不大于计算机系统的缓存行大小,所述同一个基本块的执行总数大于执行总数预设值;为每个分组内的全局数据分配地址,使同一分组的全局数据分配在同一缓存行中,且使每个分组的全局数据段起始位置都与缓存行的起始位置对齐;若存在未分组的全局数据,则为所述未分组的全局数据分配地址。本发明提供的技术方案能够有效减少访问全局数据引起的缓存不命中。
-
公开(公告)号:CN104866295A
公开(公告)日:2015-08-26
申请号:CN201410065503.7
申请日:2014-02-25
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F9/44
Abstract: 本发明实施例公开了一种OpenCL运行时系统框架的设计方法及装置,涉及信息技术领域,可以降低异构系统的平台开发复杂度。所述方法包括:首先将OpenCL运行时系统框架划分为功能层、优化层及平台层,平台层包括平台层中间表示IR、平台层实现框架及至少一个平台实现,然后向功能层及优化层提供平台层IR,并向至少一个平台实现提供平台层实现框架。本发明实施例适用于在异构系统中进行跨平台移植。
-
-
-
-
-
-
-
-
-