一种计算集群中架构重构方法、系统及存储介质

    公开(公告)号:CN119179674A

    公开(公告)日:2024-12-24

    申请号:CN202411206084.4

    申请日:2024-09-30

    Inventor: 张伟 冯岩 相飞

    Abstract: 本发明公开了一种计算集群中架构重构方法、系统及存储介质,涉及计算机技术领域。其中,应用于计算集群,计算集群至少包括集群管理节点和计算芯片,该方法包括:通过集群管理节点获取管理调度平台下发的集群切分指令;通过集群管理节点基于集群切分指令以及计算芯片的芯片标识信息确定目标计算芯片,将目标计算芯片的芯片标识信息反馈至管理调度平台;通过计算芯片响应于管理调度平台基于芯片标识信息下发的组网指令,基于目标计算芯片的芯片标识信息目标构建集群子系统。本发明实施例,实现对计算集群进行切分多个集群子系统,快速重构计算体系,以使计算集群并行计算多重任务,满足不同算力、业务场景需求,灵活适配,提升计算效率。

    一种漏液检测组件、盲插接头、分液管及液冷散热系统

    公开(公告)号:CN118999923A

    公开(公告)日:2024-11-22

    申请号:CN202411036864.9

    申请日:2024-07-31

    Inventor: 汪建宇

    Abstract: 本公开提供了一种漏液检测组件、盲插接头、分液管及液冷散热系统,包括集液腔,其内壁设有漏液检测片,所述漏液检测片上间隔的设有多根的导电条,当集液腔内有液体介质时,相邻的两根导电条能相互导通;所述集液腔一端的低位开有漏液孔,集液腔通过漏液孔与一环形的排液流道连通,排液流道外侧与一排液嘴连通,所述排液嘴能绕排液流道的轴线转动。本公开采用集液腔和与集液腔相连通的环形排液流道以及能绕排液流道轴线转动的排液嘴,使得在安装之后能自由的调节排液嘴的位置,使得排液嘴始终朝向下方,以便于在遇到冷却液泄露的情况时,及时的将泄露出的冷却液排出。

    一种超算集群的高速线缆排布方法

    公开(公告)号:CN118966133A

    公开(公告)日:2024-11-15

    申请号:CN202410999251.9

    申请日:2024-07-24

    Inventor: 张伟 冯岩 马松

    Abstract: 本发明公开了一种超算集群的高速线缆排布方法,属于芯片的连接排布的技术领域。该方法包括:S1:将芯片嵌入到计算刀片的PCBA基板上,形成芯片阵列;S2:在计算刀片上设置高速线缆通道,用来与每个计算芯片的通信接口相连;其中,每个芯片有6个轴向的通信接口,其中3个轴向的通信接口通过PCBA基板实现芯片间的信号连接,另外3个轴向的通信接口通过高速线缆通道与其他计算芯片相连;S3:将2n个嵌入芯片的计算刀片部署于一个刀框系统内,并将2n个刀框系统相连接,以将芯片布置成的立方体架构。本发明通过新型的线缆连接方式,缩短了计算芯片之间的通信距离,降低了数据传输时延,提升了各芯片间的数据交换能力。

    一种超算集群服务器的保护方法、设备及介质

    公开(公告)号:CN118885353A

    公开(公告)日:2024-11-01

    申请号:CN202410938088.5

    申请日:2024-07-12

    Inventor: 张伟 冯岩

    Abstract: 本发明公开了一种超算集群服务器的保护方法、设备及介质,属于计算机技术领域,包括:在超算集群的服务器运行时,对服务器主机的预设关键芯片进行温度监测,得到预设关键芯片的第一温度数据;若第一温度数据超过预先设定的第一温度阈值,对服务器主机发送关机指令;在预设时间后对预设关键芯片重新进行温度监测,得到预设关键芯片的第二温度数据;若第二温度数据未超过第一温度阈值,对服务器主机发送开机指令。本发明通过对服务器主机预设关键芯片的温度进行监测,能够更准确地获取主机的真实运行温度,避免了现有技术中因依赖机柜传感器而导致的温度监测不准确问题。

    一种可调间距的多螺钉同步拆装装置

    公开(公告)号:CN117680972A

    公开(公告)日:2024-03-12

    申请号:CN202311786404.3

    申请日:2023-12-22

    Inventor: 汪建宇

    Abstract: 本发明属于螺钉拆解技术领域,具体是一种可调间距的多螺钉同步拆装装置,包括滑轨、平行设置在滑轨上的主动齿轮箱和从动齿轮箱,所述滑轨末端设置端盖,所述主动齿轮箱和从动齿轮箱之间设置传动杆、且所述传动杆穿过从动齿轮箱与端盖转动连接,所述主动齿轮箱和从动齿轮箱远离滑轨的一端平行设置螺钉批头,所述主动齿轮箱上设置驱动装置,所述驱动装置转动带动两个螺钉批头同步转动。本发明的有益效果在于:可实现两个螺钉同步拆装,结构简单,不需要辅助电源、控制系统,方便携带,使用场景灵活。

    一种主板芯片、电源砖的冷板冷却结构

    公开(公告)号:CN117590913A

    公开(公告)日:2024-02-23

    申请号:CN202311244501.X

    申请日:2023-09-25

    Inventor: 张伟 马松 冯岩

    Abstract: 本发明涉及一种主板芯片、电源砖的冷板冷却结构,包括冷却板体、冷却管组件和电源砖散热片,冷却板体包括主板冷板及结构相同且内部均开设有冷却腔的冷板一、冷板二、冷板三和冷板四并呈矩形阵列固定在主板上,主板冷板内部开设有导热腔;冷却管组件包括冷却介质进液管一、冷却介质进液管二、冷却介质出液管及多个连接管,冷却介质进液管一与冷板一和冷板二上的冷却腔连接,冷却介质进液管二与冷板三和冷板四上的冷却腔连接,四个冷却腔均通过连接管与导热腔连通,冷却介质出液管的一端和导热腔连通。本发明提供的一种主板芯片、电源砖的冷板冷却结构,属于芯片散热技术领域,能够提高散热效果。

    一种互联控制方法、装置、设备及存储介质

    公开(公告)号:CN117171080A

    公开(公告)日:2023-12-05

    申请号:CN202311152899.4

    申请日:2023-09-07

    Inventor: 刘飞

    Abstract: 本发明公开了一种互联控制方法、装置、设备及存储介质,包括:在当前满足预设检测条件时,存储与目标处理器在设定连接关系下的初始配置信息,并根据第一热插拔服务软件对所述目标处理器进行在位检测,确定在位检测结果;根据所述在位检测结果对所述目标处理器进行对应的热插拔控制;根据所述初始配置信息对执行热插拔后的所述目标处理器进行资源恢复控制。上述技术方案,解决了硬件资源浪费、作业能力受限于系统内核版本的问题,减少了系统运行成本,提升了系统运行的兼容性与作业的灵活性,保障了互联控制的可靠性与稳定性。

    一种刀片服务器计算刀片的监控管理系统和方法

    公开(公告)号:CN119046082A

    公开(公告)日:2024-11-29

    申请号:CN202410975307.7

    申请日:2024-07-19

    Inventor: 张元佳 张强

    Abstract: 本发明提供了一种刀片服务器计算刀片的监控管理系统和方法,包括控制管理模块,传输模块、定制中转模块,定制接口模块;所述定制接口模块为计算刀片的监控管理提供定制采集接口;所述定制中转模块连接非标准通信接口、所述定制接口模块以及所述控制管理模块,所述控制管理模块连接标准采集接口,所述传输模块连接所述控制管理模块和所述定制中转模块,所述传输模块还与控制刀片的基板管理控制器BMC连接。本发明实现计算刀片的监控管理,在保证通用性的基础上,优化成本和减小系统复杂度,增加了监控平面的稳定性。

    代理集群式内存管理方法、代理服务器、设备、存储介质

    公开(公告)号:CN119003170A

    公开(公告)日:2024-11-22

    申请号:CN202411076298.4

    申请日:2024-08-06

    Inventor: 王崇阳

    Abstract: 本申请提供一种代理集群式内存管理方法、代理服务器、设备、存储介质,该方法应用于代理服务器;代理服务器关联至少一个内存管理服务器,每个内存管理服务器对应一个服务器集群,每个服务器集群中包括至少一个服务节点;方该法包括:确定内存管理服务器的内存管理配置信息;将内存管理配置信息分发至内存管理服务器,并将内存管理服务器的状态确定为standby,以使内存管理服务器根据内存管理配置信息初始化内存管理结构和内存管理器;在接收到内存管理服务器反馈的初始化完毕消息后,将内存管理服务器的状态更新为ready。本申请提供的方法实现简单,降低了复杂度和潜在的安全风险。

    一种电子器件的老化测试系统及测试方法

    公开(公告)号:CN118939491A

    公开(公告)日:2024-11-12

    申请号:CN202410997010.0

    申请日:2024-07-23

    Inventor: 马玉琪

    Abstract: 本发明实施例公开一种电子器件的老化测试系统及测试方法。该电子器件的老化测试系统包括电源模块,用于连接目标器件,并向目标器件供电;数据采集模块,用于连接目标器件,并采集目标器件的参数信息;控制模块,与数据采集模块连接,控制模块用于根据目标器件的参数信息,生成第一控制信号;电源控制器,连接于电源模块和控制模块之间,电源控制器包括第一同步串行I2C接口,控制模块通过第一同步串行I2C接口与电源控制器连接,第一同步串行I2C接口用于向电源控制器实时传输第一控制信号,第一控制信号用于实时调节所述电源模块向所述目标器件传输的电压值。本实施例提供的技术方案解决现有的老化测试系统存在老化测试效率较低的问题。

Patent Agency Ranking