Patent search ap:("中国科学院计算技术研究所") AND inv:"黄磊" Page 2

11.

发明授权
轮廓技术编译的优化方法及装置有权

公开(公告)号：CN104615473B

公开(公告)日：2017-11-24

申请号：CN201310539297.4

申请日：2013-11-04

Applicant: 华为技术有限公司 , 中国科学院计算技术研究所

Inventor： 刘颖 , 黄磊

IPC: G06F9/45

CPC classification number: G06F8/443 , G06F11/3404

Abstract: 本发明实施例提供一种轮廓技术编译的优化方法及装置。本发明轮廓技术编译的优化方法，包括：在程序控制流图上划分出至少两个区域，将各个区域对应程序包含的插桩函数替换为计数操作；将所述各个区域对应程序在主线程上执行，执行至一个区域对应程序结束时，启动至少一个微线程执行所述区域对应程序包含的插桩函数除计数操作外的操作，用于记录所述区域对应程序执行时的信息；所述微线程与执行下一个区域对应程序的主线程并行执行。本发明实施例提高了轮廓技术编译时的执行效率，解决了现有技术中执行效率较低的问题。

12.

发明授权
一种指令调度方法及装置有权

公开(公告)号：CN104424026B

公开(公告)日：2017-11-17

申请号：CN201310367751.2

申请日：2013-08-21

Applicant: 华为技术有限公司 , 中国科学院计算技术研究所

Inventor： 黄磊 , 连瑞琦

IPC: G06F9/48

CPC classification number: G06F8/445

Abstract: 本发明实施例提供一种指令调度方法及装置，涉及通信领域，能够使得处理器或流水线正常运行，提高了调度的正确性。包括：构建数据依赖图；分别从所述数据依赖图中提取k个指令进行调度得到每一拍的m个超长指令字，使得同一拍内的超长指令字之间是并行执行的关系，相邻两拍中后一拍的任一超长指令字的第t个指令槽的指令与前一拍的任一超长指令字的第t+1个指令槽的指令之间不存在依赖关系；其中，0≤k≤m×n，所述n表示一个超长指令字中指令槽的个数，所述n为大于等于1的整数，所述m表示每拍中超长指令字的个数，所述m为大于等于1的整数，所述t为大于等于1小于等于n‑1的整数。本发明实施例提供一种指令调度方法及装置用于指令的调度。

13.

发明公开
一种面向异OS的汇编器及汇编移植方法无效

公开(公告)号：CN104503819A

公开(公告)日：2015-04-08

申请号：CN201510003749.6

申请日：2015-01-05

Applicant: 中国科学院计算技术研究所

Inventor： 吕方 , 卢廷玉 , 郭磊 , 闫晓超 , 黄磊 , 李星 , 刘颖 , 付晓丽 , 胡丹琪 , 王晨曦

IPC: G06F9/45

Abstract: 本发明公开了一种面向异OS的汇编器及汇编移植方法，本发明涉及计算机代码移植领域，该方法包括获取源代码，将所述源代码进行编译，获取源汇编程序；选择目标操作系统，按照所述目标操作系统的汇编格式，将所述源汇编程序转化为符合所述汇编格式的目标汇编程序；获取所述目标操作系统的应用程序二进制接口规范，将所述目标汇编程序转化为符合所述应用程序二进制接口规范的新目标汇编程序；面向所述目标操作系统，将所述新目标汇编程序进行封装，以完成汇编移植。通过本发明的面向异OS汇编器可以转换成面向不同目标操作系统的可运行的汇编程序，这样就克服了不同OS带来的代码移植的困难。

14.

发明授权
一种使用陷阱指令优化条件转移代码性能的方法及其系统有权

公开(公告)号：CN101944041B

公开(公告)日：2012-10-10

申请号：CN201010292061.1

申请日：2010-09-26

Applicant: 中国科学院计算技术研究所

Inventor： 周舒畅 , 黄磊 , 吕方

IPC: G06F9/45

Abstract: 本发明有关于一种使用陷阱指令优化条件转移代码性能的方法及其系统，其中该方法包括：步骤1，收集程序的轮廓信息，根据轮廓信息获取符合条件的分支指令；步骤2，将符合条件的分支指令转换成陷阱指令，并将陷阱指令的地址及其陷入地址记入陷阱转移表中；步骤3，生成记入有陷阱指令和陷阱转移表的汇编文件，并根据汇编文件生成程序可执行文件；步骤4，解析程序可执行文件，获取陷阱指令的地址与其陷入地址之间的偏移值，并将偏移值记录到陷阱指令的偏移域中；步骤5，运行记入偏移值后的程序可执行文件，当陷阱指令发生陷入时，对陷入进行响应。采用本发明的方法能够减少分支指令的处理时间，提高处理器流水线的吞吐率，获得性能提高。

15.

发明公开
基于代码融合编译框架的OpenCL编译器设计方法和系统有权转让

公开(公告)号：CN109933327A

公开(公告)日：2019-06-25

申请号：CN201910106880.3

申请日：2019-02-02

Applicant: 中国科学院计算技术研究所

Inventor： 刘颖 , 黄磊 , 伍明川 , 崔慧敏 , 冯晓兵

IPC: G06F8/41

Abstract: 本发明涉及一种基于代码融合编译框架的OpenCL编译器设计方法和系统，包括：基于共享内存提供主机-内核代码融合编译框架，在编译器的中间表示——AST层上实现不同端代码的融合；WII-CFG图用来刻画Kernel代码被实例化成众多线程后，线程之间的指令执行行为，亦即分析工作组内平台特征敏感的程序执行行为；主机-内核代码联合的数据流分析，用来发掘跨越主机端或内核端的数据流关系以及线程之间的数据流关系，以分析两端代码之间的数据相关性；基于前述分析实施针对性的代码优化，并生成汇编代码进而结束编译过程。本发明能面向不同加速设备，针对主机端代码、Kernel代码同时开展分析，充分发掘线程间优化机会，使得OpenCL程序获得良好的性能可移植性。

16.

发明公开
一种线程间冗余删除的异构编译优化方法有权

公开(公告)号：CN109901840A

公开(公告)日：2019-06-18

申请号：CN201910114572.5

申请日：2019-02-14

Applicant: 中国科学院计算技术研究所

Inventor： 黄磊 , 刘颖 , 伍明川 , 洪锐 , 冯晓兵

IPC: G06F8/41

Abstract: 本发明通过自动选择优化策略以及分维度进行线程间冗余删除的收益代价分析，能自动根据代码是否含有同步操作和硬件平台的特点，针对性地选择一种优化策略，通过对Kernel代码的编译分析，得出合适的合并维度和合并因子，利于提高Kernel代码的运行性能。采用本发明方法能面向多种异构平台，进行自动分析和变换，得以优化设备端代码的线程间冗余和同步开销，提高设备端代码(即OpenCL的Kernel代码)的性能。

17.

发明授权
一种非对称的数据三模冗余方法及系统有权

公开(公告)号：CN104679603B

公开(公告)日：2018-02-06

申请号：CN201510055815.4

申请日：2015-02-03

Applicant: 中国科学院计算技术研究所

Inventor： 吕方 , 黄磊 , 胡丹琪 , 冯晓兵

IPC: G06F11/07

Abstract: 本发明涉及对单粒子翻转有效的容错技术领域，特别涉及一种非对称的数据三模冗余方法及系统，该方法包括：通过三模冗余模块，将编译器调度指令之后及寄存器分配之前的原始指令中的操作数进行复制，并将复制后的所述操作数转换成二模数据与三模数据，建立所述二模数据、所述三模数据与所述操作数对应的原始数据的映射关系，其中所述原始数据作为一模数据；将寄存器存储空间划分为集合regs_one、集合regs_two、集合regs_three，并将所述一模数据、所述二模数据、所述三模数据分别存入所述集合regs_one、所述集合regs_two、所述集合regs_three，以完成数据冗余。本发明有助于提高容错性。

18.

发明公开
一种非对称的数据三模冗余方法及系统有权

公开(公告)号：CN104679603A

公开(公告)日：2015-06-03

申请号：CN201510055815.4

申请日：2015-02-03

Applicant: 中国科学院计算技术研究所

Inventor： 吕方 , 黄磊 , 胡丹琪 , 冯晓兵

IPC: G06F11/07

Abstract: 本发明涉及对单粒子翻转有效的容错技术领域，特别涉及一种非对称的数据三模冗余方法及系统，该方法包括：通过三模冗余模块，将编译器调度指令之后及寄存器分配之前的原始指令中的操作数进行复制，并将复制后的所述操作数转换成二模数据与三模数据，建立所述二模数据、所述三模数据与所述操作数对应的原始数据的映射关系，其中所述原始数据作为一模数据；将寄存器存储空间划分为集合regs_one、集合regs_two、集合regs_three，并将所述一模数据、所述二模数据、所述三模数据分别存入所述集合regs_one、所述集合regs_two、所述集合regs_three，以完成数据冗余。本发明有助于提高容错性。

19.

发明公开
轮廓技术编译的优化方法及装置有权

公开(公告)号：CN104615473A

公开(公告)日：2015-05-13

申请号：CN201310539297.4

申请日：2013-11-04

Applicant: 华为技术有限公司 , 中国科学院计算技术研究所

Inventor： 刘颖 , 黄磊

IPC: G06F9/45

CPC classification number: G06F8/443 , G06F11/3404

Abstract: 本发明实施例提供一种轮廓技术编译的优化方法及装置。本发明轮廓技术编译的优化方法，包括：在程序控制流图上划分出至少两个区域，将各个区域对应程序包含的插桩函数替换为计数操作；将所述各个区域对应程序在主线程上执行，执行至一个区域对应程序结束时，启动至少一个微线程执行所述区域对应程序包含的插桩函数除计数操作外的操作，用于记录所述区域对应程序执行时的信息；所述微线程与执行下一个区域对应程序的主线程并行执行。本发明实施例提高了轮廓技术编译时的执行效率，解决了现有技术中执行效率较低的问题。

20.

发明公开
一种人像图片检索方法和装置失效

公开(公告)号：CN102332034A

公开(公告)日：2012-01-25

申请号：CN201110322247.1

申请日：2011-10-21

Applicant: 中国科学院计算技术研究所

Inventor： 夏添 , 张勇东 , 黄磊

IPC: G06F17/30 , G06K9/64

Abstract: 本发明提供一种人像图片检索方法和装置，该方法包括下列步骤：1000)接收用户提交的查询；2000)提取所述查询的特征；3000)人像图片库中人像图片的相应特征，计算所述查询与人像图片的匹配程度以进行人像图片检索；其中，所述查询的特征和所述人像图片的特征均包括社会关系特征，所述社会关系特征体现了人像图片中人脸的位置关系。本发明的有益效果在于：鲁棒性强，且检索结果较现有方法的结果更为理想；计算简单，实现速度快。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification