-
公开(公告)号:CN105335135B
公开(公告)日:2019-01-08
申请号:CN201410331030.0
申请日:2014-07-14
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
Abstract: 本发明实施例提供一种数据处理方法和中心节点,中心节点根据用户提供的采用MapReduce计算框架编写的第一循环函数,生成第二循环函数、启动计算函数和第二拷贝函数,其中,第二循环函数用于循环调用第一拷贝函数将计算节点中需要GPU处理的多个数据记录从计算节点的内存拷贝到GPU的显存中,启动计算函数中的Map计算函数用于指示GPU对GPU负责处理的数据记录进行处理,第二拷贝函数用于将GPU对多个数据记录的计算结果从GPU的显存中拷贝至计算节点的内存中,从而实现将适用于在CPU中运行的代码自动生成适用于在GPU中运行的代码,使Hadoop编程框架适用于在混合集群系统进行数据处理。
-
公开(公告)号:CN104424101B
公开(公告)日:2017-08-11
申请号:CN201310410943.7
申请日:2013-09-10
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F11/36
CPC classification number: G06F11/3457 , G06F11/3433 , G06F11/3452 , G06F2201/865
Abstract: 本申请公开了一种程序性能干扰模型的确定方法,从已确定好的样本程序集合中选取程序组成多个子集合,获取各个子集合中各个程序在运行时受到的性能干扰值,及各个子集合中所有程序对共享资源的总占用率,将所有子集合划分为多个分析单元;对不同分析单元中包含的每一个样本程序的性能干扰值及所述该样本程序所在的子集合所对应的总占有率做回归分析,获取目标函数模型;并依据目标函数模型获取目标程序对应的性能干扰模型。本发明实施例提供的方法,为多核处理器上的每一个程序提供性能干扰模型,对程序运行在多核处理器中受到的性能干扰进行量化,避免了相互干扰较为大的程序运行在同一多核处理器中,确保了程序在多核处理器中运行时的最优性能。
-
公开(公告)号:CN104679477B
公开(公告)日:2017-08-01
申请号:CN201510082216.1
申请日:2015-02-15
Applicant: 中国科学院计算技术研究所
IPC: G06F9/30
Abstract: 本发明提供一种面向可变粒度内存系统的二进制文件重写方法,包括:在二进制文件的中间表示中找到热循环区域;对于访存行为符合可变粒度访存模式的热循环区域,合并该区域内的访存信息,并且在该区域之前插入头语句;以及,根据修改后的热循环区域生成目标机器代码。本发明能够自动完成在二进制文件上支持可变粒度内存系统的访存操作;通过自动分析应用程序特征以及可变粒度内存系统的核心特征,选择合适的重写方式,兼顾了二进制文件重写过程的效率和二进制文件的执行性能。
-
公开(公告)号:CN106155634A
公开(公告)日:2016-11-23
申请号:CN201510152896.X
申请日:2015-04-01
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F9/38
Abstract: 本发明公开了一种预测核间性能干扰的方法及装置,涉及网络技术领域,提供了一种用以测量程序遭受的核间性能干扰的参数的模型。本发明提供的方法包括:分别获取程序集中每个程序在每个处理器上运行时的行为特征,以及每个程序在每组中的主处理器上的性能干扰函数的参数;根据所述程序集中每个程序在每个处理器上运行时的行为特征,构建特征预测模型;根据所述程序集中每个程序在主处理器上的行为特征、主处理器自身特征以及性能干扰函数的参数,构建性能干扰函数预测模型,其中,所述性能干扰函数预测模型用于:根据程序在处理器上的行为特征和处理器自身特征预测程序在处理器上的性能干扰函数的参数。
-
公开(公告)号:CN104679477A
公开(公告)日:2015-06-03
申请号:CN201510082216.1
申请日:2015-02-15
Applicant: 中国科学院计算技术研究所
IPC: G06F9/30
Abstract: 本发明提供一种面向可变粒度内存系统的二进制文件重写方法,包括:在二进制文件的中间表示中找到热循环区域;对于访存行为符合可变粒度访存模式的热循环区域,合并该区域内的访存信息,并且在该区域之前插入头语句;以及,根据修改后的热循环区域生成目标机器代码。本发明能够自动完成在二进制文件上支持可变粒度内存系统的访存操作;通过自动分析应用程序特征以及可变粒度内存系统的核心特征,选择合适的重写方式,兼顾了二进制文件重写过程的效率和二进制文件的执行性能。
-
公开(公告)号:CN104376366A
公开(公告)日:2015-02-25
申请号:CN201310354026.1
申请日:2013-08-14
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
Abstract: 本发明实施例提供一种最优网络最大流算法的选择方法和设备。涉及网络最大流领域,能够根据不同的网络流图确定最优的网络最大流算法。该方法包括:算法选择设备获取网络流图,并根据该网络流图得到第一残量网络;获取操作算法集合,其中,该操作算法集合包括至少两个算法,在该第一残量网络中通过该至少两个算法并行进行预流推进,得到第二残量网络,并在该第二残量网络中确定该至少两个算法对应的关键边的数量,确定该关键边的数量的最大值对应的算法为该网络流图的最优网络最大流算法。本发明实施例用于网络最大流算法的选择。
-
公开(公告)号:CN103970719A
公开(公告)日:2014-08-06
申请号:CN201310036087.3
申请日:2013-01-30
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F17/15
Abstract: 本发明实施例提供一种拟合方法及拟合装置,涉及计算机领域,能够提高拟合灵活性和拟合精度。该方法包括:根据预设数据特性将待拟合数据集中的数据分成n组待拟合数据,n≥2;对n组待拟合数据中满足预设拟合条件的待拟合数据进行拟合得到k个拟合函数,1≤k≤n;获取最终拟合函数,所述最终拟合函数为所述k个拟合函数的乘积。本发明实施例提供的一种拟合方法及拟合系统用于拟合。
-
公开(公告)号:CN100359470C
公开(公告)日:2008-01-02
申请号:CN200410009287.0
申请日:2004-06-30
Applicant: 中国科学院计算技术研究所
IPC: G06F9/45
Abstract: 本发明公开了动静结合二进制翻译中静态信息不完备的处理方法及装置,通过预留必要的入口,由动态翻译执行器进行即时翻译,并通过和预留入口相链接的方式发挥系统的性能。增加设置入口和采用即时翻译,克服现有技术动态执行中长时间无法返回静态所生成的本地码的问题,以及动态是单纯采用解释执行效率低的问题,提高代码质量和系统整体性能。
-
公开(公告)号:CN100345117C
公开(公告)日:2007-10-24
申请号:CN200410074532.6
申请日:2004-09-07
Applicant: 中国科学院计算技术研究所
IPC: G06F9/45
Abstract: 本发明公开了一种二进制翻译中对X86中浮点运算的处理方法,包括以下步骤:在运行时环境中设置一个浮点栈,用于仿真X86中的物理浮点栈;通过浮点寄存器映射的处理和归一方法依次对源二进制程序中的每个基本块进行处理。本发明通过用目标机器的寄存器来映射X86的源寄存器,保证了X86的浮点运算在目标机器上也是由寄存器来实现,确保运算的效率;采用归一的方法,确保每个基本块的入口满足每次top的值相同的假设,从本质上来讲,将Intel的运行过程中对投机假设的判别,用归一的方法进行了保证。本发明使得基本块不需要每次都去判别是否投机假设成立,省去了这一部分开销,提高了系统翻译效率,从而提高了系统性能。
-
公开(公告)号:CN1332308C
公开(公告)日:2007-08-15
申请号:CN200410069182.4
申请日:2004-09-10
Applicant: 中国科学院计算技术研究所
IPC: G06F9/45
Abstract: 本发明涉及一种动态二进制翻译中的翻译方法,包括以下步骤:统计寻找翻译代码中频繁出现并影响翻译质量的翻译代码片断;找出上述代码片断中的指令模式;确定指令模式的翻译对应关系;扫描待翻译的基本块,寻找所述指令模式,找到,匹配成功,给所述指令模式做标记,否则,匹配未成功,结束扫描;翻译基本块,翻译时遇到标记的指令时,按照所述指令模式的翻译对应关系翻译,否则,按照常规翻译。本发明通过指令模式匹配来翻译基本块,降低代码重复优化导致的系统开销,提高翻译质量和效果,从而提高了动态二进制翻译的性能。
-
-
-
-
-
-
-
-
-