大规模轨迹数据时空伴随者查询方法和系统

    公开(公告)号:CN115658737B

    公开(公告)日:2023-07-14

    申请号:CN202211362098.6

    申请日:2022-11-02

    Abstract: 一种大规模轨迹数据时空伴随者查询方法和系统,属于时空大数据处理与应用的领域。本发明分为索引建立阶段和轨迹时空伴随者查询阶段,在索引建立阶段,基于样本数据构造一个全局索引,全局索引由时间分区的排序数组和空间分区的多个四叉树组成。具体来说,本方法遵循两轮连接框架。在第一轮连接中,根据时空分布对轨迹进行划分,每个时空分区中首先在根轨迹集上构建局部三维R树索引,再找到每条轨迹的动态区域,使得满足空间邻近性和时间并发性的最近邻居必须位于特定网格范围内,实现了数据的时空局部性和负载平衡。其次,在对局部结果进行洗牌之前,先基于时空参考点去除重复数据,可以有效地减少不同机器之间的数据传输。然后将局部结果合并成全局结果。最后,建立起全局索引‑动态网格范围计数索引‑三维R树索引组成的多级索引结构。

    大规模轨迹数据时空伴随者查询方法和系统

    公开(公告)号:CN115658737A

    公开(公告)日:2023-01-31

    申请号:CN202211362098.6

    申请日:2022-11-02

    Abstract: 一种大规模轨迹数据时空伴随者查询方法和系统,属于时空大数据处理与应用的领域。本发明分为索引建立阶段和轨迹时空伴随者查询阶段,在索引建立阶段,基于样本数据构造一个全局索引,全局索引由时间分区的排序数组和空间分区的多个四叉树组成。具体来说,本方法遵循两轮连接框架。在第一轮连接中,根据时空分布对轨迹进行划分,每个时空分区中首先在根轨迹集上构建局部三维R树索引,再找到每条轨迹的动态区域,使得满足空间邻近性和时间并发性的最近邻居必须位于特定网格范围内,实现了数据的时空局部性和负载平衡。其次,在对局部结果进行洗牌之前,先基于时空参考点去除重复数据,可以有效地减少不同机器之间的数据传输。然后将局部结果合并成全局结果。最后,建立起全局索引‑动态网格范围计数索引‑三维R树索引组成的多级索引结构。

Patent Agency Ranking