一种数据挖掘方法、装置、电子设备及存储介质

    公开(公告)号:CN110825785A

    公开(公告)日:2020-02-21

    申请号:CN201911072865.8

    申请日:2019-11-05

    IPC分类号: G06F16/2458 G06Q50/26

    摘要: 本申请实施例公开了一种数据挖掘方法、装置、电子设备及存储介质。本申请实施例通过获取用于犯罪团伙挖掘的业务数据,将业务数据进行时间切片得到切片数据集,通过提取犯罪嫌疑人在对应时间段的经纬度信息或手机MAC地址信息,与切片数据集进行比对,通过确定经纬度信息或MAC地址信息存在设定关联关系的第一挖掘对象集合,以该第一挖掘对象集合中确定与犯罪嫌疑人为同伙关系的挖掘对象。采用上述技术手段,可以通过信息关联较快地进行犯罪团伙挖掘,避免繁琐的信息查询流程,进而简化同伙挖掘流程,提高信息挖掘效率。

    地铁屏蔽门故障间隔时间预测模型建立及预测方法

    公开(公告)号:CN110428109B

    公开(公告)日:2020-11-03

    申请号:CN201910728058.0

    申请日:2019-08-07

    IPC分类号: G06F16/00

    摘要: 本发明涉及一种地铁屏蔽门故障间隔时间预测模型建立及预测方法,地铁屏蔽门故障间隔时间预测模型建立,包括以下步骤:步骤1:获取地铁屏蔽门的历史运行数据,对历史运行数据进行预处理;步骤2:对预处理后的历史运行数据建立特征工程,得到特征工程数据;步骤3:对特征工程数据进行WOE和IV计算,得到每一条特征工程数据的IV值;步骤4:筛选出当前站点的当前屏蔽门的若干个IV值作为训练模型的训练数据,将训练数据输入GBDT模型进行训练,得到当前站点的当前屏蔽门的训练模型,得到的训练模型作为预测模型。本发明基于数据驱动对地铁屏蔽门故障进行预测,能够针对性的为每个屏蔽门建立对应的预测模型,预测准确性高,通用性好。

    一种地铁客流预测方法、装置、电子设备及存储介质

    公开(公告)号:CN110991607A

    公开(公告)日:2020-04-10

    申请号:CN201911120453.7

    申请日:2019-11-15

    摘要: 本申请实施例公开了一种地铁客流预测方法,包括:获取乘车数据源;将乘车数据源整合为对应的乘车数据,并根据乘车数据构建时间特征;整合分析以获得若干模型输入量;基于模型输入量构建若干个距离待测时刻不同时刻范围的数据特征集并进行归一化处理,构建每一个时间范围分别对应的RTNN模型,且按照时间范围距离待测时刻由远至近的顺序,将每个RTNN模型中的每一个数据特征依次进行传递。本方案中,基于RTNN网络模型不仅克服了现有技术中只能挖掘一个张量内各元素之间的相互关系或时序关系,而可以刻画多个张量间的时序变化,且结合了时间序列之间的传递性,可以有效避免网络中长时间间隔信息损失的问题。