-
公开(公告)号:CN100394407C
公开(公告)日:2008-06-11
申请号:CN200510087649.2
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 马赛厄斯A·布卢姆里奇 , 陈东 , 保罗W·科特尤斯 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 德克·霍尼克 , 马丁·奥马彻特 , 伯克哈德D·斯坦马彻一伯 , 托德E·塔肯罗 , 帕夫罗斯M·弗兰纳斯
IPC: G06F12/08
Abstract: 一种低等待时间存储器系统访问与弱排序的多处理器系统关联地被提供(图1)。多处理器中的每个处理器(12-1、12-2)共享资源,并且每个共享的资源都在锁定装置(10)中具有关联的锁,其提供对多处理器中多个处理器(12-1、12-2)之间的同步以及资源的有序共享的支持。处理器(12-1、12-2)仅当其拥有与资源关联的锁时才具有访问该资源的许可,并且处理器(12-1、12-2)尝试拥有锁仅需要单个加载操作,而不是传统的原子的加载然后存储,因此该处理器(12-1、12-2)仅执行读操作,并且硬件锁定装置(10)而不是该处理器(12-1、12-2)执行随后的写操作。
-
公开(公告)号:CN1493036A
公开(公告)日:2004-04-28
申请号:CN02805442.3
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 马赛厄斯A·布卢姆里奇 , 陈东 , 保罗W·科特尤斯 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 杰勒德V·科普斯凯 , 伯克哈德D·斯坦马彻-伯罗 , 托德E·塔肯
Abstract: 一种用于在计算结构中生成全局异步信号的系统和方法。具体而言,一种全局中断和障碍网络被实现,该网络实现这样的逻辑,该逻辑用于生成全局中断和障碍信号,该全局中断和障碍信号用于根据一种处理算法控制由在计算结构的选定处理节点的处理元件所执行的全局异步操作;该网络包括用于通过低等待时间路径将该全局中断和障碍信号传送到各元件的处理节点的物理互连。该全局异步信号按照为优化该处理算法的性能而选定的次数来分别地启动在该处理节点的中断和障碍操作。在一个实施例中,该全局中断和障碍网络在可扩展的大规模并行超级计算设备结构中加以实现,该可扩展的大规模并行超级计算设备结构包括由多个独立的网络互连起来的多个处理节点,每个节点包括用于执行在执行并行算法操作时所要求的计算或通信活动的一个或者多个处理元件。一种多个独立的网络包括用于允许在全局树形网络节点或者它的子树之间的高速全局树通信的全局树形网络。该全局中断和障碍网络可与该全局树形网络并行地操作以便提供全局异步边带信号。
-
公开(公告)号:CN1493031A
公开(公告)日:2004-04-28
申请号:CN02805422.9
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 保罗W·科特尤斯 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 伯克哈德D·斯坦马彻-伯罗
IPC: G06F13/14
CPC classification number: H05K7/20836 , F24F11/77 , G06F9/52 , G06F9/526 , G06F15/17381 , G06F17/142 , G09G5/008 , H04L7/0338
Abstract: 提供了一种用于在出现故障时监视文件系统(100)的全部性能的方法。该文件系统有N个存储设备(108),这里N是大于零的整数,和N个主文件服务器(104),每一个文件服务器可操作连接到一个相应的存储设备(110)以访问那里的文件。该文件系统另外还有一个辅助文件服务器(104a),它可操作连接到N个存储设备中的至少一个。所述方法包括:当N个主文件服务器之一出现故障时,切换N个存储设备中的一个的连接到辅助文件服务器;切换剩余的一个或者多个存储设备的连接到一个不同于发生故障的文件服务器的主文件服务器,以防止损失性能并给每一存储设备提供一个运行的文件服务器。
-
公开(公告)号:CN1244878C
公开(公告)日:2006-03-08
申请号:CN02805377.X
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 盖恩V·班诺特 , 陈东 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 伯克哈德D·斯坦马彻-伯罗 , 帕夫罗斯M·弗拉纳斯
IPC: G06F17/14
CPC classification number: H05K7/20836 , F24F11/77 , G06F9/52 , G06F9/526 , G06F15/17381 , G06F17/142 , G09G5/008 , H04L7/0338
Abstract: 本发明的目的在于一种用于实现一个多维数组的多维快速傅里叶变换(FFT)的方法、系统和程序存储设备,其中该多维数组包含多个元素,所述多个元素最初分布在一个多节点计算机系统中,所述多节点计算机系统包含多个经由一个网络进行通信的节点,其包含:经由该网络跨越该计算机系统的多个节点分布在第一维度上分布该数组的多个元素,以便于进行第一一维FFT;在第一维度上对分布在每个节点处的数组元素上执行第一一维FFT;通过经由网络跨越该计算机系统的其它节点的、以随机次序进行的“所有-到-所有”分布,在第二维度上在每个节点处重新分布经过一维FFT-转换的元素;以及在第二维度上对在每个节点处重新分布的数组元素执行第二一维FFT,其中随机次序便于网络的有效利用,由此实现多维FFT。该“所有-到-所有”重新分布或者数组元素在除了在分布存储器、并行巨型计算机上的多维FFT之外的应用中被进一步更高效地实现。
-
公开(公告)号:CN1493042A
公开(公告)日:2004-04-28
申请号:CN02805377.X
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 盖恩V·班诺特 , 陈东 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 伯克哈德D·斯坦马彻-伯罗 , 帕夫罗斯M·弗拉纳斯
IPC: G06F17/14
CPC classification number: H05K7/20836 , F24F11/77 , G06F9/52 , G06F9/526 , G06F15/17381 , G06F17/142 , G09G5/008 , H04L7/0338
Abstract: 本发明的目的在于一种用于高效地实现一个多维数组的多维快速傅里叶变换(FFT)的方法、系统和程序存储设备,其中该多维数组包含多个最初分布在一个包含多个经由一个网络进行通信的节点的多节点计算机系统中的元素,其包含:经由该网络跨越该计算机系统的多个节点分布在一个第一维度中的、该数组的多个元素以便于一个第一一维FFT;在第一维度中、分布在每个节点处的数组元素上执行第一一维FFT;通过网络,经由跨越该计算机系统的其它节点、以随机次序的“所有-到-所有”分布,在一个第二维度中在每个节点处重新分布一维FFT-转换了的元素;以及在第二维度中、在每个节点处重新分布的数组中的元素上执行一个第二一维FFT,其中随机次序便于网络的高效利用由此高效地实现多维FFT。该“所有-到-所有”重新分布或者数组元素在除了在分布存储器、并行巨型计算机上的多维FFT之外的应用中被进一步更高效地实现。
-
公开(公告)号:CN1493038A
公开(公告)日:2004-04-28
申请号:CN02805430.X
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 马赛厄斯A·布卢姆里奇 , 陈东 , 保罗W·科特尤斯 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 伯克哈德D·斯坦马彻-伯罗 , 托德E·塔肯 , 帕夫罗斯M·弗拉纳斯
IPC: G06F15/16
Abstract: 在一种包括按照m多维配置的多个节点的大规模并行计算系统中,每个节点包括计算设备,一种用于将分组路由到它们的目的节点的方法被提供,该方法包括生成包含从下行流节点导出的信息的2m个压缩位向量(115、154)中的至少之一。一种多级仲裁过程(116、155),其中在该压缩向量中所存储的下行流信息,诸如链路状态信息和下行流缓冲器(130、140)的充满度,被用于确定用于传送分组的优选方向和虚拟信道。优选方向范围被编码并且虚拟信道通过检查该多个压缩位向量(115、154)来加以选择。这一动态路由方法消除了路由表的必要性,因此就增强了交换机的可扩展性。
-
公开(公告)号:CN1322452C
公开(公告)日:2007-06-20
申请号:CN02805423.7
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 盖恩V·班诺特 , 马赛厄斯A·布卢姆里奇 , 陈东 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 伯克哈德D·斯坦马彻-伯罗 , 帕夫罗斯M·弗拉纳斯
CPC classification number: H05K7/20836 , F24F11/77 , G06F9/52 , G06F9/526 , G06F15/17381 , G06F17/142 , G09G5/008 , H04L7/0338
Abstract: 执行算术函数的方法和系统。根据本发明的第一方面,提供了方法和装置,该方法和装置和类网络路由的软件算法和硬件实现共同工作,极大地减少了环形网络上全局算术运算所需要的时间。因此,它使得在大型并行机器上运行的应用程序更具有可量测性。在改进全局运算的效率和精确性方面,该发明包含三个步骤:1)需要时,确保所有节点以同样的次序进行全局运算,从而获得唯一的答案,不受四舍五入误差的影响。2)使用环形拓扑,以使得跳点数最小,使用网络的双向能力,以将数据传送操作中的时间步数降低到绝对最小值。3)使用类函数路由,以减少数据传送中的延迟。使用本发明的方法,每个单个单元只被注入网络一次,它将被存储并发送,而不需要加任何软件开销。根据本发明的第二方面,提供方法和系统,在支持全局混合运算的网络上有效执行全局算术运算。通过使用这些方法,极大地减少了进行这种全局运算的延迟(图4,节点1,节点2,节点3)。
-
公开(公告)号:CN1311376C
公开(公告)日:2007-04-18
申请号:CN02805532.2
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 马赛厄斯A·布卢姆里奇 , 陈东 , 乔治L·丘 , 托马斯M·西珀拉 , 保罗W·科特尤斯 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 杰勒德V·科普克塞 , 劳伦斯S·莫克 , 托德E·塔肯
CPC classification number: H05K7/20836 , F24F11/77 , G06F9/52 , G06F9/526 , G06F15/17381 , G06F17/142 , G09G5/008 , H04L7/0338
Abstract: 一种数百万亿OPS规模的新颖的大规模并行超级计算机,包括基于片内系统技术的节点体系结构,其中每个处理节点都包含一个单独的专用集成电路(ASIC)。ASIC节点(20)被多个独立网络(26)互连,该网络最佳地使包通信吞吐量达到最大,并把等待时间减到最小。该多个网络可以包括用于并行算法消息传递的三个高速网络,包括一环,全局树,和提供全局障碍及通知功能的全局异步网络。可以根据需要或是算法的阶段而协作地或独立地利用这些多个独立网络以优化算法处理性能。
-
公开(公告)号:CN1537275A
公开(公告)日:2004-10-13
申请号:CN02805441.5
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 马塞厄斯A·布卢姆里奇 , 陈东 , 保罗W·科特尤斯 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 德克·霍尼克 , 马丁·奥马彻特 , 伯克哈德D·斯坦马彻-伯罗 , 托德E·塔肯 , 帕夫罗斯M·弗兰纳斯
CPC classification number: H05K7/20836 , F24F11/77 , G06F9/52 , G06F9/526 , G06F15/17381 , G06F17/142 , G09G5/008 , H04L7/0338
Abstract: 一种低等待时间存储器系统访问与弱排序的多处理器系统关联地被提供(图1)。多处理器中的每个处理器(12-1、12-2)共享资源,并且每个共享的资源都在锁定装置(10)中具有关联的锁,其提供对多处理器中多个处理器(12-1、12-2)之间的同步以及资源的有序共享的支持。处理器(12-1、12-2)仅当其拥有与资源关联的锁时才具有访问该资源的许可,并且处理器(12-1、12-2)尝试拥有锁仅需要单个加载操作,而不是传统的原子的加载然后存储,因此该处理器(12-1、12-2)仅执行读操作,并且硬件锁定装置(10)而不是该处理器(12-1、12-2)执行随后的写操作。
-
公开(公告)号:CN1494688A
公开(公告)日:2004-05-05
申请号:CN02805532.2
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 马赛厄斯A·布卢姆里奇 , 陈东 , 乔治L·丘 , 托马斯M·西珀拉 , 保罗W·科特尤斯 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 杰勒德V·科普克塞 , 劳伦斯S·莫克 , 托德E·塔肯
CPC classification number: H05K7/20836 , F24F11/77 , G06F9/52 , G06F9/526 , G06F15/17381 , G06F17/142 , G09G5/008 , H04L7/0338
Abstract: 一种数百万亿OPS规模的新颖的大规模并行超级计算机,包括基于片内系统技术的节点体系结构,其中每个处理节点都包含一个单独的专用集成电路(ASIC)。ASIC节点(20)被多个独立网络(26)互连,该网络最佳地使包通信吞吐量达到最大,并把等待时间减到最小。该多个网络可以包括用于并行算法消息传递的三个高速网络,包括一环,全局树,和提供全局障碍及通知功能的全局异步网络。可以根据需要或是算法的阶段而协作地或独立地利用这些多个独立网络以优化算法处理性能。
-
-
-
-
-
-
-
-
-