一种基于企业关联关系的工商高管人名消歧方法

    公开(公告)号:CN110020433A

    公开(公告)日:2019-07-16

    申请号:CN201910256769.2

    申请日:2019-04-01

    IPC分类号: G06F17/27 G06F16/35 G06Q50/00

    摘要: 本发明公开了一种基于企业关联关系的工商高管人名消歧方法,涉及实体消歧领域,包括以下步骤:将待消歧数据集U,按高管姓名划分成组n个高管姓名组A;根据步骤S1得到的姓名组划分结果,对每个组A,构建N层以内的高管及企业关联关系网络G;针对每个姓名组A,根据密切度计算规则,计算姓名组A中高管节点之间的关联密切度f;根据关联密切度构建聚类函数CL,使用层次聚类算法得到消歧结果。本发明能自动化对工商高管人名进行消歧,具有较高的消歧准确率,且具有一定的阈值设置灵活性,可满足较多应用场景的工商高管人名消歧;同时可构建高管任职关联关系、高管投资关联关系,为高管全视角的关联图谱分析提供支撑。

    一种基于企业关联关系的工商高管人名消歧方法

    公开(公告)号:CN110020433B

    公开(公告)日:2023-04-18

    申请号:CN201910256769.2

    申请日:2019-04-01

    摘要: 本发明公开了一种基于企业关联关系的工商高管人名消歧方法,涉及实体消歧领域,包括以下步骤:将待消歧数据集U,按高管姓名划分成组n个高管姓名组A;根据步骤S1得到的姓名组划分结果,对每个组A,构建N层以内的高管及企业关联关系网络G;针对每个姓名组A,根据密切度计算规则,计算姓名组A中高管节点之间的关联密切度f;根据关联密切度构建聚类函数CL,使用层次聚类算法得到消歧结果。本发明能自动化对工商高管人名进行消歧,具有较高的消歧准确率,且具有一定的阈值设置灵活性,可满足较多应用场景的工商高管人名消歧;同时可构建高管任职关联关系、高管投资关联关系,为高管全视角的关联图谱分析提供支撑。

    一种基于标准SQL的流式数据清洗转换方法和系统

    公开(公告)号:CN113760877A

    公开(公告)日:2021-12-07

    申请号:CN202110337239.8

    申请日:2021-03-10

    摘要: 本发明公开了一种基于标准SQL的流式数据清洗转换方法和系统,根据本发明的一方面包括以下步骤:S1、系统初始化,针对系统库、工作线程、Groovy函数线程、SQL解析引擎进行初始化操作;S2、在上述初始化完成以后,系统开始进行数据清洗转换的工作。根据本发明的另一方面还包括系统初始化模块、内置算子库、SQL解析引擎、提交SQL模块、提交Groovy模块、Groovy类初始化模块、Groovy执行模块、数据重组模块、数据输入和输出模块。本发明的有益效果为:更加高效、便捷、灵活地对流式数据清洗、转换,筛选符合条件的数据,让数据对用户更加有价值。

    一种基于用户行为的爬虫用户识别方法

    公开(公告)号:CN118646588A

    公开(公告)日:2024-09-13

    申请号:CN202410908967.3

    申请日:2024-07-08

    IPC分类号: H04L9/40

    摘要: 本发明提供一种基于用户行为的爬虫用户识别方法,包括第一次认证用户,访问页面或访问接口设置验证信息,获取设备ID的请求记录,将请求记录异常的设备ID标记为爬虫;第二次认证用户,设置埋点信息获取设备ID或IP地址的行为日志,进而获取设备ID或IP地址在每个埋点处的行为模式,将行为模式异常的设备ID或IP地址标记为爬虫;应对措施,判断特征库内设备ID或IP地址是否被标记,若是,限制设备ID或IP地址的访问频率、屏蔽请求或引导至验证码页面,否,允许正常访问,将设备ID的行为特征更新至特征库。本发明能够有效区分正常用户和爬虫,从而在不影响正常用户体验的同时,保护网络资源和数据安全。