用于多个集群的作业调度管理系统及方法

    公开(公告)号:CN101645022B

    公开(公告)日:2013-07-10

    申请号:CN200910091830.9

    申请日:2009-08-28

    Abstract: 本发明提供一种用于多个集群的作业调度管理系统和方法,其中,该方法包括以下步骤:表示层门户界面接收用户请求并且将用户请求提供给作业管理中间件;作业管理中间件接收来自表示层门户界面的用户请求,将用户请求解释为操作请求并将操作请求提供给调度策略中间件;调度策略中间件根据来自作业管理中间件的操作请求进行策略配置,将配置信息应用至一个或多个调度系统以进行作业调度;一个或多个调度系统根据调度策略中间件配置的策略信息进行作业调度并将响应结果反馈给表示层门户界面。本发明还提供一种用于多个集群的作业调度管理系统。本发明通过添加中间件实现了多个集群的统一远程管理。

    一种基于进程扫描的非法作业监控方法

    公开(公告)号:CN102521101A

    公开(公告)日:2012-06-27

    申请号:CN201110405731.0

    申请日:2011-12-08

    Abstract: 本发明提供了一种基于进程扫描的非法作业监控方法,首先,初始化进程黑名单和白名单;其次,读取作业调度的作业详细信息;再次,获取所有计算节点的进程信息及网络连接信息;然后,根据步获取的信息,按照某种匹配策略判定进程与“黑名单”、“白名单”及作业的相关性,进而判定进程的合法性。最后,根据判定结果和预定的处理策略对非法进程作出后继处理,并更新进程的“未知”进程的状态计数;本发明的优点在于:综合作业信息和操作系统信息(进程+网络)来判定进程与作业的相关性,可以不用关心用户应用的并行编程模型;通过多种类型的白名单、黑名单以及后继处理策略均可灵活配置,极大简化了管理员的工作。

    一种面向CPU和GPU的混合调度方法

    公开(公告)号:CN102521050A

    公开(公告)日:2012-06-27

    申请号:CN201110397358.9

    申请日:2011-12-02

    Abstract: 本发明提供了一种面向CPU和GPU的混合调度方法,S1,调度器初始化时读取调度策略配置、优先级配置参数;S2,调度器在每个调度循环中读取作业调度系统中的信息;S3,调度器根据作业资源请求信息和调度策略进行优先级计算,确定每个作业的优先级并降序排列;S4,根据S3中得到的排列顺序,按照调度策略进行作业调度。S5,根据S4的调度结果向调度系统发送作业启动请求;S6,休眠一段时间,然后返回S2进行下一个循环。本发明通过可定制的权重来设置GPU和非GPU作业的相对关系;在调度时判定GPU资源情况,达到GPU作业的准确调度。

    一种机柜环境采集与监控设备

    公开(公告)号:CN102495597A

    公开(公告)日:2012-06-13

    申请号:CN201110396887.7

    申请日:2011-12-02

    CPC classification number: Y02P90/02

    Abstract: 一种机柜环境采集与监控设备。本发明的设备可以有效监控计算机机房的环境温湿度、电力参数和设备运行状态,并提供实时的报警,一方面给管理员提供对设备异常的及时处理,最大程度上减少异常导致的财产损失;另一方面监控数据通过分析处理,展现个管理员和决策者,为机房的管理、设备的部署和规划,以及业务的运行状况提供决策参考依据。能够及时采集机柜的温湿度、电源等的环境信息,及时发现异常,避免由于环境异常造成的IT设备的损失;提供统一上层接口,有效节省底层监控二次开发带来的成本。

    一种基于作业规模的均衡调度方法

    公开(公告)号:CN102402461A

    公开(公告)日:2012-04-04

    申请号:CN201110405117.4

    申请日:2011-12-08

    Abstract: 本发明提供了一种基于作业规模的均衡调度方法,S1,系统启动;S2,计算作业优先级;S3,按照优先级启动调度作业,如果不能启动,则根据预约深度为作业创建预约;S4,检查当前是否还有空闲资源,如果有空闲资源,则选择可以回填的小作业回填;S5,本轮调度结束,睡眠一段时间,返回S2继续。本发明的优先级算法可以灵活定制。权重的设置可以是正数、负数、零,通过对于权重的设置,可以得到不同的优先级算法,如FIFO、大作业优先等;结合预约和抢占,可以较好的平衡大作业和小作业的竞争,提高系统的吞吐率。

    集群系统的恢复方法
    16.
    发明公开

    公开(公告)号:CN102281159A

    公开(公告)日:2011-12-14

    申请号:CN201110262566.8

    申请日:2011-09-06

    Abstract: 本发明提供了一种集群系统的恢复方法,包括:步骤S1:服务器从客户机接收客户机的文件;以及步骤S2:服务器通过将文件发送到其他客户机来恢复其他客户机的运行。利用该集群系统的恢复方法,可以是该集群系统具备可以将集群中的任意一个客户机(节点)转化为模板客户机,将该节点系统转化为模板进行保存,即用来构建集群系统中要求恢复系统的节点的模板;可以指定恢复在特定时间进行备份的系统;恢复过程可以多节点并行,运用P2P协议进行多个节点同时恢复;恢复过程对于用户透明,不需要用户进行手工干预,被恢复系统和备份系统一致,不需要进行环境变量的配置的优点。

    一种虚拟机管理功能动态扩展的管理方法

    公开(公告)号:CN102129385A

    公开(公告)日:2011-07-20

    申请号:CN201110069287.X

    申请日:2011-03-22

    Abstract: 本发明提供了一种虚拟机管理功能动态扩展的管理方法,将虚拟机管理功能模块根据系统定义的虚拟机功能模块接口重新编写,并通过系统定义的平台注册方法和系统管理接口将重新编写管理功能模块部署到系统指定位置,修改虚拟机配置信息。本发明对新的虚拟机管理功能的支持可以实现动态扩展,无需终止软件管理系统的运行,无需对原有系统的代码进行改动;可以支持不同类型虚拟机。

    基于应用特征的异构集群作业自适应调度方法和系统

    公开(公告)号:CN101739292B

    公开(公告)日:2016-02-10

    申请号:CN200910242094.2

    申请日:2009-12-04

    Abstract: 本发明提供一种基于应用特征的异构集群作业自适应调度方法和系统。其中,调度方法包括以下步骤:作业调度服务器收集异构集群的各个节点的硬件信息并根据各个节点的硬件信息将各个节点分成具有不同特征的节点组;作业调度中间件查询数据库中是否存储有当前提交的作业的运行特点;如果有,作业调度服务器根据运行特点将当前提交的作业提交到相应特征的节点组去运行;如果没有,作业调度服务器将当前提交的作业提交到任意节点组去运行,作业调度中间件记录当前提交的作业的运行数据并根据运行数据分析运行特点,将当前提交的作业的应用类型和运行特点存储到数据库中。本发明的方法和系统可以提高高性能软件的效率,提高异构集群的使用效率。

    分布式集群监控系统及方法

    公开(公告)号:CN101719841B

    公开(公告)日:2012-10-10

    申请号:CN200910238005.7

    申请日:2009-11-13

    Abstract: 本发明提供了一种分布式集群监控系统和方法,其中,该方法包括以下步骤:每个分中心监控服务器采集到每个分布式集群内部的信息后,将信息推送至中心监控服务器。中心监控服务器接收来自分中心监控服务器的信息,并按照信息对所有分布式集群进行统一配置,然后将统一配置的结果提供给分中心监控服务器。分中心监控服务器接收来自中心监控服务器的统一配置结果,按照配置结果对分布式集群进行监控和管理。本发明通过使用统一的集中式监控平台,实现对分布式集群的统一监控和管理。

    一种异构集群操作系统半自动批量部署的方法

    公开(公告)号:CN102497408A

    公开(公告)日:2012-06-13

    申请号:CN201110404908.5

    申请日:2011-12-08

    Abstract: 本发明提供了一种异构集群操作系统半自动批量部署的方法,S102,在异构集群内的分中心设置一个样板机,用于镜像服务器获取镜像;S104,在异构集群内的分中心设置一个光盘镜像服务器,用于提供光盘镜像安装服务;S106,在异构集群内的分中心设置一个镜像服务器,用于提供文件系统镜像安装服务;S108,分中心的镜像服务器从样板机获取文件系统镜像,待安装节点自动从镜像服务器下载获取到的文件系统镜像,并进行自动安装;S110,在中心设置中心镜像服务器,用于负责各个异构分中心集群的操作系统镜像注册、查询、索引工作。在本发明的技术方案中,除了用户在开始需要人工选择服务器安装镜像列表,其它过程全部自动化实现。极大提高了服务器操作系统部署的速度。

Patent Agency Ranking