一种基于ETCD的分布式集群控制方法和装置

    公开(公告)号:CN114764380A

    公开(公告)日:2022-07-19

    申请号:CN202110055020.9

    申请日:2021-01-15

    Abstract: 本发明公开一种基于ETCD的分布式集群控制方法和装置,集群内不同节点部署的CMServer服务启动后,向ETCD服务进行抢占式事务写操作,若成功,则成为CMServer主服务;Agent进程与CMServer主服务进行连接,定期监控Agent所在节点上启动的所有服务进程状态,发送节点服务进程的状态消息和心跳消息给CMServer主服务;将服务进程的状态消息更新存储在ETCD服务中的服务状态记录中,并刷新服务状态租约时间;若CMServer主服务检测到有服务状态租约过期,则判定和更新该服务为异常状态,并根据该服务的最新状态信息判断是否进行选主操作。本发明能自动发现异常和处理异常,效率高。

    一种基于分布式任务调度框架的任务容灾方法

    公开(公告)号:CN110798339A

    公开(公告)日:2020-02-14

    申请号:CN201910954331.1

    申请日:2019-10-09

    Abstract: 本发明公开一种基于分布式任务调度框架的任务容灾方法,包括以下步骤:第一步,初始化任务调度中心,并在初始化过程中启动一个守护线程,用于监测执行器的心跳状态;第二步,用户通过任务调度中心注册任务信息;第三步,调度中心根据任务的Cron配置按时提交调度请求;第四步,执行器接收并运行调度中心提交的调度请求;第五步,若守护线程监测到执行器在执行任务的过程中发生故障,则确认该执行器上是否有处于运行态的任务,如果存在,则更新该任务的运行状态;触发任务被重新调度到在线的执行器上运行;第六步,任务执行完成,返回调度结果。本发明解决了现有的分布式任务调度框架无法处理容灾场景的任务自动恢复问题。

Patent Agency Ranking