-
公开(公告)号:CN110019180A
公开(公告)日:2019-07-16
申请号:CN201710678545.1
申请日:2017-08-10
Applicant: 中国电信股份有限公司
Abstract: 本发明公开一种多源数据账号关联和装置。该方法包括:将不同类型数据源的用户数据均转换成三元组数据,其中,所述三元组数据包括地点、时间和出现次数;根据所述三元组数据确定第一账号和第二账号属于同一用户的联合概率,其中,第一账号为第一数据源的账号,第二账号为第二数据源的账号,第一数据源和第二数据源为不同类型的数据源;若所述联合概率大于预定值,则将第一账号和第二账号进行关联。本发明使用联合概率模型、对不同数据源中的账号在时间和空间中的分布情况进行建模,从而计算账号间的相似程度。本发明不依赖于用户信息,适用于广泛的数据源,特别是能够实现线上、线下数据的用户账号关联。
-
公开(公告)号:CN110019180B
公开(公告)日:2021-04-30
申请号:CN201710678545.1
申请日:2017-08-10
Applicant: 中国电信股份有限公司
Abstract: 本发明公开一种多源数据账号关联和装置。该方法包括:将不同类型数据源的用户数据均转换成三元组数据,其中,所述三元组数据包括地点、时间和出现次数;根据所述三元组数据确定第一账号和第二账号属于同一用户的联合概率,其中,第一账号为第一数据源的账号,第二账号为第二数据源的账号,第一数据源和第二数据源为不同类型的数据源;若所述联合概率大于预定值,则将第一账号和第二账号进行关联。本发明使用联合概率模型、对不同数据源中的账号在时间和空间中的分布情况进行建模,从而计算账号间的相似程度。本发明不依赖于用户信息,适用于广泛的数据源,特别是能够实现线上、线下数据的用户账号关联。
-