编译方法、装置及计算机可读存储介质

    公开(公告)号:CN118796196A

    公开(公告)日:2024-10-18

    申请号:CN202410034003.0

    申请日:2024-01-09

    Abstract: 本申请实施例提供一种编译方法、编译装置、处理设备、芯片及计算机可读存储介质,所述方法包括:获取第一源代码;所述第一源代码为通过第一编程语言编程的源代码;所述第一编程语言为具备领域特定语言DSL的编程语言;提取所述第一源代码中的DSL;所述DSL表征所述第一源代码中的线性代数计算过程;将所述DSL转换为第一中间表示;对所述第一中间表示进行优化操作,生成第二中间表示;所述第二中间表示是所述第一中间表示的等价中间表示,所述第二中间表示的计算量小于所述第一中间表示的计算量;将所述第二中间表示转换为第一代码;所述第一代码的编码语言为所述第一编码语言;将所述第一代码与所述第一源代码进行结合,生成第二源代码。

    为内存控制器分配硬件加速指令的方法和装置

    公开(公告)号:CN105988952B

    公开(公告)日:2019-03-08

    申请号:CN201510092224.4

    申请日:2015-02-28

    Abstract: 本发明实施例提供一种为内存控制器分配硬件加速指令的方法和装置。该方法包括:按照多个硬件加速指令之间的依赖关系将多个硬件加速指令划分为不同的指令集合;按照将硬件加速指令之间无依赖关系的不同指令集合分配给不同的内存控制器的原则,获取各指令集合与计算机系统中的内存控制器的第一映射关系;根据第一内存控制器集合中的各内存控制器的负载信息调整第一映射关系,以获得各指令集合与计算机系统的内存控制器的第二映射关系;按照第二映射关系将各指令集合中的硬件加速指令分配给第二内存控制器集合中的内存控制器。实现由计算机系统中的多个内存控制器执行硬件加速指令时,各个内存控制器的负载均衡。

    轮廓技术编译的优化方法及装置

    公开(公告)号:CN104615473B

    公开(公告)日:2017-11-24

    申请号:CN201310539297.4

    申请日:2013-11-04

    Inventor: 刘颖 黄磊

    CPC classification number: G06F8/443 G06F11/3404

    Abstract: 本发明实施例提供一种轮廓技术编译的优化方法及装置。本发明轮廓技术编译的优化方法,包括:在程序控制流图上划分出至少两个区域,将各个区域对应程序包含的插桩函数替换为计数操作;将所述各个区域对应程序在主线程上执行,执行至一个区域对应程序结束时,启动至少一个微线程执行所述区域对应程序包含的插桩函数除计数操作外的操作,用于记录所述区域对应程序执行时的信息;所述微线程与执行下一个区域对应程序的主线程并行执行。本发明实施例提高了轮廓技术编译时的执行效率,解决了现有技术中执行效率较低的问题。

    异构系统程序启动方法和装置

    公开(公告)号:CN104239080B

    公开(公告)日:2017-11-17

    申请号:CN201310239648.X

    申请日:2013-06-17

    Inventor: 刘颖

    Abstract: 本发明实施例提供一种异构系统程序启动方法和装置,该方法包括:在通过编译器编译开放计算语言程序核心部分时,确定核心部分的输入参数是否被修改;保存各输入参数是否被修改的结果;通过运行时系统启动核心部分时,根据所述输入参数是否被修改的结果,对被修改的输入参数执行复制操作。本发明实施例提供的异构系统程序启动方法和装置,避免运行时系统对核心部分输入参数的冗余复制操作,降低OpenCL运行时系统的开销,提高OpenCL程序执行效率。

    一种全局数据的地址分配方法及相关装置

    公开(公告)号:CN103885886B

    公开(公告)日:2016-08-24

    申请号:CN201210558814.8

    申请日:2012-12-20

    Inventor: 刘颖

    Abstract: 本发明实施例公开了一种全局数据的地址分配方法及相关装置,其中,一种全局数据的地址分配方法包括:对源程序中的全局数据进行分组,其中,同一分组内的所有全局数据满足如下条件:同一分组内的所有全局数据在同一个基本块中被使用,同一分组内的所有全局数据的数据大小之和不大于计算机系统的缓存行大小,所述同一个基本块的执行总数大于执行总数预设值;为每个分组内的全局数据分配地址,使同一分组的全局数据分配在同一缓存行中,且使每个分组的全局数据段起始位置都与缓存行的起始位置对齐;若存在未分组的全局数据,则为所述未分组的全局数据分配地址。本发明提供的技术方案能够有效减少访问全局数据引起的缓存不命中。

    OpenCL运行时系统框架的设计方法及装置

    公开(公告)号:CN104866295A

    公开(公告)日:2015-08-26

    申请号:CN201410065503.7

    申请日:2014-02-25

    Abstract: 本发明实施例公开了一种OpenCL运行时系统框架的设计方法及装置,涉及信息技术领域,可以降低异构系统的平台开发复杂度。所述方法包括:首先将OpenCL运行时系统框架划分为功能层、优化层及平台层,平台层包括平台层中间表示IR、平台层实现框架及至少一个平台实现,然后向功能层及优化层提供平台层IR,并向至少一个平台实现提供平台层实现框架。本发明实施例适用于在异构系统中进行跨平台移植。

Patent Agency Ranking