-
公开(公告)号:CN110929141B
公开(公告)日:2022-11-01
申请号:CN201811102774.X
申请日:2018-09-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06Q50/00
Abstract: 本发明实施例提供一种团伙挖掘方法、装置、设备及存储介质。本发明的团伙挖掘方法,通过获取各个用户的第一行为数据和第二行为数据,根据所述各个用户的第一行为数据和第二行为数据,分别确定任意两个用户之间的多个类型的关联关系的权重,使用多个调节参数,分别对所述任意两个用户之间的多个类型的关联关系的权重进行拟合处理,确定任意两个用户之间的权重信息,根据所述任意两个用户之间的权重信息构建待挖掘的关联网络,通过计算模块度的方式对所述待挖掘的关联网络进行挖掘,输出团伙信息。本发明实施例可以提升团伙识别的准确率。
-
公开(公告)号:CN110895548B
公开(公告)日:2022-08-09
申请号:CN201810975593.1
申请日:2018-08-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/28
Abstract: 本申请实施例公开了用于处理信息的方法和装置。该方法的一具体实施方式包括:获取至少一条日志,其中,日志包括至少一个实体的实体信息。对于至少一条日志中的日志,按照预定的实体抽取配置规则基于该日志生成原始边。对于所生成的至少一个原始边所涉及的至少一个实体中的实体,通过预设的顶点标识字典获取该实体对应的顶点标识。对于至少一个原始边中的原始边,获取该原始边包括的两个实体对应的顶点标识,根据该原始边的边信息、两个实体对应的顶点标识和两个实体的实体信息生成关联边。该实施方式能够从海量时空数据中快速、准确地抽取出实体间的关系,并且便于存储和查找实体间的关系。
-
公开(公告)号:CN112015888A
公开(公告)日:2020-12-01
申请号:CN201910472250.8
申请日:2019-05-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/34
Abstract: 本发明提供一种摘要信息提取方法和摘要信息提取系统,其中方法包括:获取用户针对目标兴趣点标注的N个文本信息,所述N为大于或等于1的整数;从所述N个文本信息中筛选所述目标兴趣点的备选摘要信息;判断所述备选摘要信息是否符合预设的无效摘要规则;若所述备选摘要信息不符合所述无效摘要规则,则将所述备选摘要信息标注为所述目标兴趣点的摘要信息。本发明中,通过筛选出备选摘要信息,并将不符合无效摘要规则的备选摘要信息标注为该目标兴趣点的摘要信息,使得目标兴趣点的摘要信息得以提取。并且,由于最终提取的摘要信息经过了有效性验证,使得所提取的摘要信息能够准确体现该目标兴趣点,提高了摘要信息提取的准确性。
-
公开(公告)号:CN110727740A
公开(公告)日:2020-01-24
申请号:CN201810784909.9
申请日:2018-07-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/28 , G06F16/2458 , G06F16/248
Abstract: 本发明提供一种关联分析方法及装置、计算机设备与可读介质。其方法包括:根据输入的目标实体的属性,在预先建立的分布式图谱存储结构中检索出目标实体对应的初始点;根据输入的关联条件,在分布式图谱存储结构中以初始点为中心,依次检索出与初始点相关联的多个关联逻辑边以及各关联逻辑边对应的关联节点;根据初始点、各关联逻辑边以及各关联逻辑边对应的关联节点,构建目标实体相关联的事件的线索路径和对应子图。与现有技术的人工进行关联分析处理相比,本发明的技术方案,能够自动地进行关联分析处理,避免了人工分析的耗时耗力,从而能够有效地提高关联分析的准确性和处理效率。
-
公开(公告)号:CN110716970A
公开(公告)日:2020-01-21
申请号:CN201810678020.2
申请日:2018-06-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/25 , G06F16/28 , G06F16/26 , G06F16/215
Abstract: 本申请提出一种异构数据同构化处理方法、装置计算机设备及存储介质,其中,方法包括:获取待处理的第一源数据及第二源数据,其中,所述第一源数据与所述第二源数据为异构数据;将所述第一源数据进行可视化处理,以生成所述第一源数据对应的第一图谱,其中,所述第一图谱中的各节点分别为所述第一源数据中的各实体,各节点间的关联边为对应各实体间的关系数据;将所述第二源数据进行可视化处理,以生成所述第二源数据对应的第二图谱,其中,所述第二图谱中的各节点分别为所述第二源数据中的各实体,各节点间的关联边为对应实体间的关系数据。通过本方法,能够提高对异构数据进行同构化处理的准确性,保证同构化数据与异构数据之间的一致性。
-
公开(公告)号:CN110598122B
公开(公告)日:2022-04-01
申请号:CN201810606527.7
申请日:2018-06-13
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9536 , G06F16/9537 , G06Q50/00
Abstract: 本申请提出一种社交群体挖掘方法、装置、设备及存储介质,其中方法包括:获取目标用户的位置信息及网络环境信息,其中网络环境信息用于表征目标用户当前接入的网络地址;根据目标用户的位置信息,确定目标用户所属的目标集合;根据目标用户的网络环境信息及目标集合中其他各用户的网络环境信息,确定目标用户与目标集合中其他各用户间的关联度;根据目标用户与目标集合中其他各用户间的关联度,确定目标用户与目标集合的归属关系。该方法实现了基于用户的位置信息及网络环境信息,对用户与其他用户之间的关系进行挖掘,由于挖掘数据获取难度低、且覆盖范围广,从而不仅降低了用户关系挖掘的成本,而且使得最终获得的用户关系更加全面、更加实用。
-
公开(公告)号:CN111209348A
公开(公告)日:2020-05-29
申请号:CN201811392563.4
申请日:2018-11-21
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/28
Abstract: 本申请实施例公开了用于输出信息的方法和装置。该方法的一具体实施方式包括获取待识别数据;对待识别数据进行实体识别,确定待识别数据中的实体集合;对实体集合中的至少两个实体进行关系识别,确定至少两个实体间的关系;将至少两个实体和至少两个实体间的关系对应输出。该实施方式降低了数据结构化的人力成本。
-
公开(公告)号:CN110929141A
公开(公告)日:2020-03-27
申请号:CN201811102774.X
申请日:2018-09-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06Q50/00
Abstract: 本发明实施例提供一种团伙挖掘方法、装置、设备及存储介质。本发明的团伙挖掘方法,通过获取各个用户的第一行为数据和第二行为数据,根据所述各个用户的第一行为数据和第二行为数据,分别确定任意两个用户之间的多个类型的关联关系的权重,使用多个调节参数,分别对所述任意两个用户之间的多个类型的关联关系的权重进行拟合处理,确定任意两个用户之间的权重信息,根据所述任意两个用户之间的权重信息构建待挖掘的关联网络,通过计算模块度的方式对所述待挖掘的关联网络进行挖掘,输出团伙信息。本发明实施例可以提升团伙识别的准确率。
-
公开(公告)号:CN110895548A
公开(公告)日:2020-03-20
申请号:CN201810975593.1
申请日:2018-08-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/28
Abstract: 本申请实施例公开了用于处理信息的方法和装置。该方法的一具体实施方式包括:获取至少一条日志,其中,日志包括至少一个实体的实体信息。对于至少一条日志中的日志,按照预定的实体抽取配置规则基于该日志生成原始边。对于所生成的至少一个原始边所涉及的至少一个实体中的实体,通过预设的顶点标识字典获取该实体对应的顶点标识。对于至少一个原始边中的原始边,获取该原始边包括的两个实体对应的顶点标识,根据该原始边的边信息、两个实体对应的顶点标识和两个实体的实体信息生成关联边。该实施方式能够从海量时空数据中快速、准确地抽取出实体间的关系,并且便于存储和查找实体间的关系。
-
公开(公告)号:CN110598122A
公开(公告)日:2019-12-20
申请号:CN201810606527.7
申请日:2018-06-13
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9536 , G06F16/9537 , G06Q50/00
Abstract: 本申请提出一种社交群体挖掘方法、装置、设备及存储介质,其中方法包括:获取目标用户的位置信息及网络环境信息,其中网络环境信息用于表征目标用户当前接入的网络地址;根据目标用户的位置信息,确定目标用户所属的目标集合;根据目标用户的网络环境信息及目标集合中其他各用户的网络环境信息,确定目标用户与目标集合中其他各用户间的关联度;根据目标用户与目标集合中其他各用户间的关联度,确定目标用户与目标集合的归属关系。该方法实现了基于用户的位置信息及网络环境信息,对用户与其他用户之间的关系进行挖掘,由于挖掘数据获取难度低、且覆盖范围广,从而不仅降低了用户关系挖掘的成本,而且使得最终获得的用户关系更加全面、更加实用。
-
-
-
-
-
-
-
-
-