处理系统中获取向量的欧几里得范数的方法和装置

    公开(公告)号:CN101676864A

    公开(公告)日:2010-03-24

    申请号:CN200810213578.X

    申请日:2008-09-16

    Abstract: 本发明提供了一种单处理器系统中获取向量的欧几里得范数的方法和装置以及多处理器系统中获取向量的欧几里得范数的方法和装置。其中该单处理器系统中获取向量的欧几里得范数的方法包括:将要获取欧几里得范数的向量划分为具有预定数量的元素的多个段;对于上述多个段的每一个,为该段内的元素进行基于同一缩放因子的平方累加计算,以得到该多个段的元素的平方和;以及根据上述多个段的元素的平方和,得到上述向量的欧几里得范数。本发明通过按段消除向量中的元素之间的依赖关系,能够实现数据处理的并行性,从而提升计算性能。

    在多处理器系统上进行分子动力学模拟的方法和装置

    公开(公告)号:CN101782930A

    公开(公告)日:2010-07-21

    申请号:CN200910003257.1

    申请日:2009-01-21

    CPC classification number: G16C10/00

    Abstract: 本发明提供一种在多处理器系统上进行分子动力学模拟的方法和装置。该多处理器系统包括至少一个核心处理器以及多个加速器。该方法包括:将需要进行分子动力学模拟的物质空间划分为多个小盒子;以每一个小盒子的分子数据连续存储在与该小盒子对应的存储区域中的方式,将上述多个小盒子的分子数据存储在该多处理器系统的主存储器中;以在一次DMA操作中获取至少一个小盒子的分子数据的方式,使上述多个加速器并行地从主存储器中重复获取上述多个小盒子的分子数据,并进行分子动力学模拟计算。本发明通过使每一个小盒子的分子数据连续存储在与该小盒子对应的存储区域中,能够使各加速器在进行模拟时减少与主存储器的数据交换,从而提高模拟性能。

    一种基于多处理器系统的多库函数调用方法和系统

    公开(公告)号:CN101661405A

    公开(公告)日:2010-03-03

    申请号:CN200810214486.3

    申请日:2008-08-28

    CPC classification number: G06F9/485 G06F9/5027 G06F9/522 G06F2209/509

    Abstract: 本发明提供了一种基于多处理器系统的多库函数调用方法和系统,其中所述多处理器系统包括一个主处理单元PPE和多个协处理单元SPE,包括多库函数的应用程序在PPE的内存空间执行,该方法包括:在PPE的应用程序内维护各SPE的状态,其中已经启动的SPE具有用于截获PPE命令的SPE代理;响应调用一库函数请求,PPE根据当前各SPE的状态,判断调用所述库函数的可用SPE数量是否足够;如果可用SPE数量足够,发送运行命令到选择的SPE;执行完毕全部库函数后,PPE发送终止命令到全部启动的SPE。

    在多处理器系统上进行分子动力学模拟的方法和装置

    公开(公告)号:CN101782930B

    公开(公告)日:2012-08-22

    申请号:CN200910003257.1

    申请日:2009-01-21

    CPC classification number: G16C10/00

    Abstract: 本发明提供一种在多处理器系统上进行分子动力学模拟的方法和装置。该多处理器系统包括至少一个核心处理器以及多个加速器。该方法包括:将需要进行分子动力学模拟的物质空间划分为多个小盒子;以每一个小盒子的分子数据连续存储在与该小盒子对应的存储区域中的方式,将上述多个小盒子的分子数据存储在该多处理器系统的主存储器中;以在一次DMA操作中获取至少一个小盒子的分子数据的方式,使上述多个加速器并行地从主存储器中重复获取上述多个小盒子的分子数据,并进行分子动力学模拟计算。本发明通过使每一个小盒子的分子数据连续存储在与该小盒子对应的存储区域中,能够使各加速器在进行模拟时减少与主存储器的数据交换,从而提高模拟性能。

    多处理器系统的三角线性方程组求解的方法和装置

    公开(公告)号:CN101661457A

    公开(公告)日:2010-03-03

    申请号:CN200810212524.1

    申请日:2008-08-29

    Abstract: 本发明提供了一种多处理器系统的三角线性方程组求解的方法和装置。其中该多处理器系统包括至少一个核心处理器以及多个加速器。该方法包括:按照预定的子矩阵大小,将要进行三角线性方程组求解的矩阵划分为多个子矩阵;迭代地对该多个子矩阵进行计算更新;其中,在每一次迭代中包括:从该多个子矩阵中还未进行计算更新的子矩阵开始,按照行方向并且按照为上述多个加速器预先确定的先后顺序,向该多个加速器各分配一个子矩阵;使该多个加速器并行地对各自的子矩阵进行计算更新。本发明通过逐个子矩阵地分配要进行求解的矩阵,能够使多个加速器的负载达到平衡,从而充分利用这多个加速器的计算能力来达到计算更新的峰值性能。

    在多处理器系统上对矩阵进行QR分解的方法和装置

    公开(公告)号:CN101533386A

    公开(公告)日:2009-09-16

    申请号:CN200810086073.1

    申请日:2008-03-14

    Inventor: 李晖 王佰玲

    CPC classification number: G06F17/16

    Abstract: 本发明提供了一种在多处理器系统上对矩阵进行QR分解的方法和装置。其中该多处理器系统包括至少一个核心处理器以及多个加速器。该方法包括:迭代地分解上述矩阵中的每个条带直到全部矩阵被分解;其中,在每一次迭代中包括:按照预定的块大小,将上述矩阵中未处理的矩阵部分划分为多个块;将该未处理的矩阵部分中当前处理的条带划分为至少两个子条带,其中该当前处理的条带包括多个块;以及利用上述多个加速器逐一在上述至少两个子条带上进行QR分解,并利用分解结果更新该至少两个子条带中还未进行QR分解的子条带的数据。本发明使具有高计算能力的多处理器系统能够应用于计算任务量大的矩阵QR分解。

    一种基于多处理器系统的多库函数调用方法和系统

    公开(公告)号:CN101661405B

    公开(公告)日:2012-08-29

    申请号:CN200810214486.3

    申请日:2008-08-28

    CPC classification number: G06F9/485 G06F9/5027 G06F9/522 G06F2209/509

    Abstract: 本发明提供了一种基于多处理器系统的多库函数调用方法和系统,其中所述多处理器系统包括一个主处理单元PPE和多个协处理单元SPE,包括多库函数的应用程序在PPE的内存空间执行,该方法包括:在PPE的应用程序内维护各SPE的状态,其中已经启动的SPE具有用于截获PPE命令的SPE代理;响应调用一库函数请求,PPE根据当前各SPE的状态,判断调用所述库函数的可用SPE数量是否足够;如果可用SPE数量足够,发送运行命令到选择的SPE;执行完毕全部库函数后,PPE发送终止命令到全部启动的的SPE。

    多处理器系统中网络接口卡与加速器传输数据的方法与装置

    公开(公告)号:CN101572689A

    公开(公告)日:2009-11-04

    申请号:CN200810083952.9

    申请日:2008-04-29

    Abstract: 本发明提供了一种在多处理器系统中的网络接口卡与加速器之间传输数据的方法和装置。其中该多处理器系统包括至少一个核心处理器、多个加速器以及可以被上述核心处理器、上述多个加速器和上述网络接口卡读取的主存储器。该方法包括:将在上述网络接口卡与上述多个加速器之间传输的数据以至少一个原始数据包的形式存储到上述主存储器中;设置上述原始数据包在上述主存储器中的存储位置标识;以及使上述网络接口卡或上述多个加速器根据上述存储位置标识从上述主存储器获取上述原始数据包。本发明能够优化诸如CBE的多处理器系统中的NIC驱动器与加速器之间的数据传输过程,提高系统的数据传输效率。

Patent Agency Ranking