发明授权
摘要:
本发明涉及一种大规模流式集合数据的分布式处理方法,属于计算机数据处理技术领域。首先基于分布式消息系统记录流式集合数据的完备状态,如果流式集合数据完备则消息系统生成对应的消息,分布式计算系统从分布式消息系统中提取流式集合数据的状态消息,将获取的流式集合数据存储到分布式存储系统,根据具体的处理算法和业务逻辑进行分布式处理和计算,并将处理结果存储到分布式存储系统中,完成对流式集合数据的处理。本发明方法可以有效的控制流式集合数据的处理流程,并利用集合数据的批量式计算提高系统的资源利用率。本方法可以快速、有效地处理目前日益增长的流式集合数据,十分适用于工业物联网、气象信息网等典型的大数据应用场景。
公开/授权文献
- CN106990913A 一种大规模流式集合数据的分布式处理方法 公开/授权日:2017-07-28