-
公开(公告)号:CN108737483A
公开(公告)日:2018-11-02
申请号:CN201710272570.X
申请日:2017-04-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L29/08
Abstract: 本发明提出了一种基于流式计算的数据连通率实时计算方法及装置,其中的方法包括:获取预定数据的行为数据信息并存储;拉取所述存储的行为数据信息,并将所述预定数据转换成离散的数据流;通过预定规则对所述离散的数据流进行解析并提取关键信息;根据所述关键信息确定所述预定数据的数据连通率。该方法通过将预定数据的行为数据信息转换成离散的数据流并进行解析及提取关键信息,最后根据关键信息确定该预定数据的数据连通率,从而实现了将大批量数据转换成微批量数据,并通过分布式方式对微批量数据进行快速计算,达到吞吐量大、低延迟的效果,以满足数据投放系统对高时效性的要求及适用对于时间延迟敏感的业务。