-
公开(公告)号:CN106919554B
公开(公告)日:2020-06-30
申请号:CN201610957268.3
申请日:2016-10-27
Applicant: 阿里巴巴集团控股有限公司
IPC: G06F40/279 , G06F16/31 , G06F16/33
Abstract: 本申请涉及计算机技术领域,尤其涉及一种文档中无效词的识别方法及装置,在一种文档中无效词的识别方法中,首先对识别无效词的文档进行预处理,得到与该文档对应的词语集合;然后根据预设的语料库,确定词语集合中各个词语的平均位置以及逆文档频率;之后根各个词语的平均位置、逆文档频率以及相关词语的逆文档频率,确定各个词语的目标权重值;最后根据各个词语的目标权重值,识别第一文档中的无效词。也即本申请是根据词语的平均位置以及逆文档频率,来从第一文档中识别无效词,由此,可以提高无效词识别的效率。
-
公开(公告)号:CN106302104B
公开(公告)日:2020-01-21
申请号:CN201510369566.6
申请日:2015-06-26
Applicant: 阿里巴巴集团控股有限公司
Abstract: 本申请涉及计算机技术领域,尤其涉及一种用户关系识别方法及装置,用以实现同事关系的自动化识别。本申请实施例提供一种用户关系识别方法,包括:服务器采集多个账户的账户信息;所述账户信息包括社交关系信息和工作信息;所述服务器根据所述多个账户中每个账户的社交关系信息,配置关联账户对;其中,任一关联账户对的两个账户各自的归属用户之间具有社交关系;针对每个关联账户对,所述服务器根据该关联账户对中每个账户的工作信息,判断该关联账户对是否为同事关系账户对;其中,任一同事关系账户对的两个账户各自的归属用户之间具有同事关系。
-
公开(公告)号:CN110264037A
公开(公告)日:2019-09-20
申请号:CN201910400073.2
申请日:2019-05-14
Applicant: 阿里巴巴集团控股有限公司
IPC: G06Q10/06 , G06Q30/02 , G06F16/2455
Abstract: 本申请公开了一种用户数据的处理方法和装置,该方法包括:获取多类用户的行为数据,所述多类用户基于业务标签划分,一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识;基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识,确定所述多类用户对应的时序关联规则;基于所述多类用户中目标类用户对应的第一时序关联规则以及非目标类用户对应的第二时序关联规则,确定所述目标类用户的时序行为规则;基于所述目标类用户的时序行为规则,确定待识别用户是否属于所述目标类用户。
-
公开(公告)号:CN106875205A
公开(公告)日:2017-06-20
申请号:CN201610543528.2
申请日:2016-07-11
Applicant: 阿里巴巴集团控股有限公司
Abstract: 本发明提供一种对象选择方法和装置,其中方法包括:根据用于影响目标对象选择的业务影响参数,分别对每两个对象之间的基础关系权重进行调整,得到新对象关系权重;根据对象群体中的各新对象关系权重,分别确定对象群体中的每个对象对应的传播力值;根据每个对象在业务中的业务活动参数,分别确定每个对象对应的活跃度值;根据活跃度值和传播力值,分别确定每个对象对应的影响力值;选择影响力值大于预设阈值的对象作为目标对象。本发明提高了业务对象选择的准确性。
-
公开(公告)号:CN106817390A
公开(公告)日:2017-06-09
申请号:CN201510866768.1
申请日:2015-12-01
Applicant: 阿里巴巴集团控股有限公司
Abstract: 本申请实施例公开了一种用户数据共享的方法和设备,根据获取到的查询媒介信息,查询相关的至少一个用户帐户及其关系信息,根据查询到的信息构建局部媒介网络,并利用所述局部媒介网络,从所述至少一个用户账户中确定可信账户,获取所述可信账户的用户数据,并作为所述查询媒介信息对应的用户数据输出,以实现用户数据共享,从而,将不同业务平台之间的针对同一个用户实体的用户行为信息打通,以实现用户行为信息共享。
-
公开(公告)号:CN106487636A
公开(公告)日:2017-03-08
申请号:CN201510524970.6
申请日:2015-08-25
Applicant: 阿里巴巴集团控股有限公司
Abstract: 本申请公开了一种网络关系数据处理、用户信息及业务信息推送方法和设备,包括:获取待处理用户的网络关系数据,所述网络关系数据中包含所述待处理用户的用户信息和至少一个所述其他用户的用户信息;根据所述网络关系数据中包含所述待处理用户的用户信息和至少一个所述其他用户的用户信息,确定所述待处理用户的网络关系聚合度;根据所述网络关系聚合度,确定所述待处理用户的用户类型,有助于根据用户所属的用户类型为不同用户推送用户信息以及业务信息,有针对性地为用户提供个性化网络服务,有效提升了网络数据资源的利用率。
-
公开(公告)号:CN105631681A
公开(公告)日:2016-06-01
申请号:CN201410594627.4
申请日:2014-10-29
Applicant: 阿里巴巴集团控股有限公司
IPC: G06Q30/00
CPC classification number: G06Q30/00
Abstract: 本申请公开了一种电子凭证传输账号的检测方法。通过查询当前所有与待检测账号对应的二级账号及确定与各二级账号及待检测账号对应的三方传输操作,并在判断存在特殊二级账号之后根据当前所有与该特殊二级账号以及待检测账号对应的三方传输操作提取其中的电子凭证传输记录,在获取了电子凭证传输记录中的电子凭证数量的众数信息后根据三方传输操作的数量以及众数信息确定待检测账号是否存在问题。从而在海量的电子凭证交易记录中能够精确地对待检测的电子凭证传输账号进行验证,显著地提升了当前电子凭证传输的管理便捷性。
-
公开(公告)号:CN105391594A
公开(公告)日:2016-03-09
申请号:CN201410447016.7
申请日:2014-09-03
Applicant: 阿里巴巴集团控股有限公司
Abstract: 本申请提供一种识别特征账号的方法及装置,该方法包括:获取历史行为数据中包含的账号之间的关联关系,以及账号分别与账号属性信息、网络环境属性信息之间的关联关系;将所述关联关系映射为节点之间的对应关系,并建立对应的关系网络;当所述关系网络中存在符合预设特征的节点簇时,确定所述节点簇中包含特征账号。在本申请的技术方案中,可以通过多维度的关系网络,自动识别出特征账号。
-
公开(公告)号:CN107203946B
公开(公告)日:2020-08-07
申请号:CN201610146920.3
申请日:2016-03-15
Applicant: 阿里巴巴集团控股有限公司
Abstract: 本申请公开一种群组定位方法,包括:根据预设的目标网络维度确定关系网络的标签传播次数;从关系网络中的第一节点开始,按照标签传播次数,依次通过邻接节点向其他邻接节点进行标签传播,其中,标签用于指示标签接收节点与第一节点之间的距离;从关系网络中获取接收到至少两个标签的第二节点,以及位于第二节点与第一节点之间的第三节点;根据第一节点、第二节点以及第三节点确定目标群组。实现了快速发现给定个体节点之间存在潜在联系的群组。本申请还公开一种群组定位装置以及一种用于资金交易网络中风险群组的定位方法及装置。
-
公开(公告)号:CN105631681B
公开(公告)日:2019-06-21
申请号:CN201410594627.4
申请日:2014-10-29
Applicant: 阿里巴巴集团控股有限公司
IPC: G06Q30/06
CPC classification number: G06Q30/00
Abstract: 本申请公开了一种电子凭证传输账号的检测方法。通过查询当前所有与待检测账号对应的二级账号及确定与各二级账号及待检测账号对应的三方传输操作,并在判断存在特殊二级账号之后根据当前所有与该特殊二级账号以及待检测账号对应的三方传输操作提取其中的电子凭证传输记录,在获取了电子凭证传输记录中的电子凭证数量的众数信息后根据三方传输操作的数量以及众数信息确定待检测账号是否存在问题。从而在海量的电子凭证交易记录中能够精确地对待检测的电子凭证传输账号进行验证,显著地提升了当前电子凭证传输的管理便捷性。
-
-
-
-
-
-
-
-
-