一种ETL系统的高效流程编排方法及系统

    公开(公告)号:CN111291106A

    公开(公告)日:2020-06-16

    申请号:CN202010399861.7

    申请日:2020-05-13

    Abstract: 本发明公开了一种ETL系统的高效流程编排方法及系统,本方案基于分布式计算引擎Spark,将各个操作抽象化并封装为一个个插件,然后提供可视化的流程编排将插件根据处理逻辑串联起来形成有向无环图DAG。以实现对海量数据ETL处理。插件支持动态升级和扩展,只需实现定义的对应接口并上传。插件会动态加载,然后在流程编排界面便能使用该插件。解决了现有方案在处理海量数据时较慢、存在较高的门槛、不够灵活且管理分散不易分析其血缘关系的问题。

Patent Agency Ranking