-
公开(公告)号:CN1322452C
公开(公告)日:2007-06-20
申请号:CN02805423.7
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 盖恩V·班诺特 , 马赛厄斯A·布卢姆里奇 , 陈东 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 伯克哈德D·斯坦马彻-伯罗 , 帕夫罗斯M·弗拉纳斯
CPC classification number: H05K7/20836 , F24F11/77 , G06F9/52 , G06F9/526 , G06F15/17381 , G06F17/142 , G09G5/008 , H04L7/0338
Abstract: 执行算术函数的方法和系统。根据本发明的第一方面,提供了方法和装置,该方法和装置和类网络路由的软件算法和硬件实现共同工作,极大地减少了环形网络上全局算术运算所需要的时间。因此,它使得在大型并行机器上运行的应用程序更具有可量测性。在改进全局运算的效率和精确性方面,该发明包含三个步骤:1)需要时,确保所有节点以同样的次序进行全局运算,从而获得唯一的答案,不受四舍五入误差的影响。2)使用环形拓扑,以使得跳点数最小,使用网络的双向能力,以将数据传送操作中的时间步数降低到绝对最小值。3)使用类函数路由,以减少数据传送中的延迟。使用本发明的方法,每个单个单元只被注入网络一次,它将被存储并发送,而不需要加任何软件开销。根据本发明的第二方面,提供方法和系统,在支持全局混合运算的网络上有效执行全局算术运算。通过使用这些方法,极大地减少了进行这种全局运算的延迟(图4,节点1,节点2,节点3)。
-
公开(公告)号:CN1303774C
公开(公告)日:2007-03-07
申请号:CN02805440.7
申请日:2002-02-25
Applicant: 国际商业机器公司
CPC classification number: H05K7/20836 , F24F11/77 , G06F9/52 , G06F9/526 , G06F15/17381 , G06F17/142 , G09G5/008 , H04L7/0338
Abstract: 一种用于高速信令的数据捕获技术,以便于对异步数据流的最佳采样。该技术允许极高的数据速率,不要求像在源同步系统中的那样要将一个时钟随数据一起发送。本发明也提供一种硬件机构,用于为最佳双位并发双向(SiBiDi)信令自动地调节传输延迟(图5)。
-
公开(公告)号:CN1493128A
公开(公告)日:2004-04-28
申请号:CN02805378.8
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 盖恩V·班诺特 , 马赛厄斯A·布卢姆里奇 , 陈东 , 保罗W·科特尤斯 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 伯克哈德D·斯坦马彻-伯罗 , 托德E·塔肯 , 帕夫罗斯M·弗拉纳斯
Abstract: 在诸如在其节点(Q00-Q22)上包括多个并行计算处理器的计算机网络的网络中实现类网络路由。类网络路由允许计算处理器将消息广播至计算机网络中一范围(一个或多个)的其他计算处理器,诸如列或行中的处理器。通常这类操作要求将单独的消息发送至每个处理器。采用根据本发明的类网络路由,一条消息就已足够,这通常减少了网络中的消息总数以及进行广播的延迟。类网络路由还适用于带有硬件类函数(多点广播)功能的分布式存储器并行超级计算机(图1)上的密集矩阵变换算法。这通过利用密集矩阵变换的通信模式可以通过硬件类函数提供这一事实来实现,这导致了更快的执行时间。
-
公开(公告)号:CN1493040A
公开(公告)日:2004-04-28
申请号:CN02805520.9
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 马赛厄斯A·布卢姆里奇 , 陈东 , 保罗W·科特尤斯 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 德克·霍尼克 , 伯克哈德D·斯坦马彻-伯罗 , 托德E·塔肯 , 帕夫罗斯M·弗拉纳斯
Abstract: 一种用于在根据树形网络结构互连的处理节点中启动高速、低延迟全局树形通信的系统和方法。全局树形网络(100)在具有多个互连的处理节点的计算机结构中执行的并行算法运算期间,优选地启动将执行的集合归约运算。包括了经链路互连树的节点以便有助于在虚拟树和子树结构的节点处执行低延迟全局处理运算性能的路由器设备(200)。全局运算包括以下的一个或多个:从虚拟树的根节点(110)向下到叶节点(120)的全局广播操作、从虚拟树中的叶节点向上到根节点(110)的全局归约运算,以及从虚拟树的任何节点到根节点(110)的点对点消息传递。耦合虚拟树形网络的一个节点,并其该节点充当用于提供对于虚拟树的每个节点与外部系统的I/O功能的I/O节点。可将全局树形网络(100)配置成以异步或同步的方式提供全局屏蔽和中断的功能性。因此,并行算法处理运算,例如,在并行计算系统中所采用,可根据并行算法运算的某些操作阶段优化地执行。当在大规模并行超级计算结构中实现时,根据处理算法的需要,全局树形网络(100)是物理上和逻辑上可划分的。
-
公开(公告)号:CN1901439A
公开(公告)日:2007-01-24
申请号:CN200610093430.8
申请日:2002-02-25
Applicant: 国际商业机器公司
CPC classification number: H05K7/20836 , F24F11/77 , G06F9/52 , G06F9/526 , G06F15/17381 , G06F17/142 , G09G5/008 , H04L7/0338
Abstract: 一种用于高速信令的数据捕获技术,以便于对异步数据流的最佳采样。该技术允许极高的数据速率,不要求像在源同步系统中的那样要将一个时钟随数据一起发送。本发明也提供一种硬件机构,用于为最佳双位并发双向(SiBiDi)信令自动地调节传输延迟。
-
公开(公告)号:CN1244878C
公开(公告)日:2006-03-08
申请号:CN02805377.X
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 盖恩V·班诺特 , 陈东 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 伯克哈德D·斯坦马彻-伯罗 , 帕夫罗斯M·弗拉纳斯
IPC: G06F17/14
CPC classification number: H05K7/20836 , F24F11/77 , G06F9/52 , G06F9/526 , G06F15/17381 , G06F17/142 , G09G5/008 , H04L7/0338
Abstract: 本发明的目的在于一种用于实现一个多维数组的多维快速傅里叶变换(FFT)的方法、系统和程序存储设备,其中该多维数组包含多个元素,所述多个元素最初分布在一个多节点计算机系统中,所述多节点计算机系统包含多个经由一个网络进行通信的节点,其包含:经由该网络跨越该计算机系统的多个节点分布在第一维度上分布该数组的多个元素,以便于进行第一一维FFT;在第一维度上对分布在每个节点处的数组元素上执行第一一维FFT;通过经由网络跨越该计算机系统的其它节点的、以随机次序进行的“所有-到-所有”分布,在第二维度上在每个节点处重新分布经过一维FFT-转换的元素;以及在第二维度上对在每个节点处重新分布的数组元素执行第二一维FFT,其中随机次序便于网络的有效利用,由此实现多维FFT。该“所有-到-所有”重新分布或者数组元素在除了在分布存储器、并行巨型计算机上的多维FFT之外的应用中被进一步更高效地实现。
-
公开(公告)号:CN1493042A
公开(公告)日:2004-04-28
申请号:CN02805377.X
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 盖恩V·班诺特 , 陈东 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 伯克哈德D·斯坦马彻-伯罗 , 帕夫罗斯M·弗拉纳斯
IPC: G06F17/14
CPC classification number: H05K7/20836 , F24F11/77 , G06F9/52 , G06F9/526 , G06F15/17381 , G06F17/142 , G09G5/008 , H04L7/0338
Abstract: 本发明的目的在于一种用于高效地实现一个多维数组的多维快速傅里叶变换(FFT)的方法、系统和程序存储设备,其中该多维数组包含多个最初分布在一个包含多个经由一个网络进行通信的节点的多节点计算机系统中的元素,其包含:经由该网络跨越该计算机系统的多个节点分布在一个第一维度中的、该数组的多个元素以便于一个第一一维FFT;在第一维度中、分布在每个节点处的数组元素上执行第一一维FFT;通过网络,经由跨越该计算机系统的其它节点、以随机次序的“所有-到-所有”分布,在一个第二维度中在每个节点处重新分布一维FFT-转换了的元素;以及在第二维度中、在每个节点处重新分布的数组中的元素上执行一个第二一维FFT,其中随机次序便于网络的高效利用由此高效地实现多维FFT。该“所有-到-所有”重新分布或者数组元素在除了在分布存储器、并行巨型计算机上的多维FFT之外的应用中被进一步更高效地实现。
-
公开(公告)号:CN1493038A
公开(公告)日:2004-04-28
申请号:CN02805430.X
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 马赛厄斯A·布卢姆里奇 , 陈东 , 保罗W·科特尤斯 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 伯克哈德D·斯坦马彻-伯罗 , 托德E·塔肯 , 帕夫罗斯M·弗拉纳斯
IPC: G06F15/16
Abstract: 在一种包括按照m多维配置的多个节点的大规模并行计算系统中,每个节点包括计算设备,一种用于将分组路由到它们的目的节点的方法被提供,该方法包括生成包含从下行流节点导出的信息的2m个压缩位向量(115、154)中的至少之一。一种多级仲裁过程(116、155),其中在该压缩向量中所存储的下行流信息,诸如链路状态信息和下行流缓冲器(130、140)的充满度,被用于确定用于传送分组的优选方向和虚拟信道。优选方向范围被编码并且虚拟信道通过检查该多个压缩位向量(115、154)来加以选择。这一动态路由方法消除了路由表的必要性,因此就增强了交换机的可扩展性。
-
公开(公告)号:CN1901439B
公开(公告)日:2011-04-20
申请号:CN200610093430.8
申请日:2002-02-25
Applicant: 国际商业机器公司
CPC classification number: H05K7/20836 , F24F11/77 , G06F9/52 , G06F9/526 , G06F15/17381 , G06F17/142 , G09G5/008 , H04L7/0338
Abstract: 一种用于高速信令的数据捕获技术,以便于对异步数据流的最佳采样。该技术允许极高的数据速率,不要求像在源同步系统中的那样要将一个时钟随数据一起发送。本发明也提供一种硬件机构,用于为最佳双位并发双向(SiBiDi)信令自动地调节传输延迟。
-
公开(公告)号:CN100499446C
公开(公告)日:2009-06-10
申请号:CN02805378.8
申请日:2002-02-25
Applicant: 国际商业机器公司
Inventor: 盖恩V·班诺特 , 马赛厄斯A·布卢姆里奇 , 陈东 , 保罗W·科特尤斯 , 艾伦G·加拉 , 马克E·贾姆帕帕 , 菲利普·海德伯格 , 伯克哈德D·斯坦马彻-伯罗 , 托德E·塔肯 , 帕夫罗斯M·弗拉纳斯
Abstract: 在诸如在其节点(Q00-Q22)上包括多个并行计算处理器的计算机网络的网络中实现类网络路由。类网络路由允许计算处理器将消息广播至计算机网络中一范围(一个或多个)的其他计算处理器,诸如列或行中的处理器。通常这类操作要求将单独的消息发送至每个处理器。采用根据本发明的类网络路由,一条消息就已足够,这通常减少了网络中的消息总数以及进行广播的延迟。类网络路由还适用于带有硬件类函数(多点广播)功能的分布式存储器并行超级计算机(图1)上的密集矩阵变换算法。这通过利用密集矩阵变换的通信模式可以通过硬件类函数提供这一事实来实现,这导致了更快的执行时间。
-
-
-
-
-
-
-
-
-