孤立树模型建立的方法和装置
    1.
    发明公开

    公开(公告)号:CN112990246A

    公开(公告)日:2021-06-18

    申请号:CN201911302317.X

    申请日:2019-12-17

    Inventor: 郝龙伟 姜伟浩

    Abstract: 本申请公开了一种孤立树模型建立的方法,属于计算机技术领域,方法包括:获取数据样本,生成根节点作为目标父节点,选取目标父节点的分割参考特征,当分割参考特征为类别型特征时,在分割参考特征的各特征值中选取分割参考特征值。生成目标父节点的第一子节点和第二子节点,将包括分割参考特征值的数据样本作为第一子节点的数据样本,将不包括分割参考特征值的数据样本作为第二子节点的数据样本;将满足预设条件的子节点确定为叶节点,将不满足预设条件的子节点作为目标父节点,转至执行在多个特征中选取分割参考特征的处理,直到将各子节点全部确定为目标孤立树模型的叶节点,生成目标孤立树模型。通过本申请可以提高孤立森林模型的检测准确度。

    数据处理方法、装置、电子设备及可读存储介质

    公开(公告)号:CN111177190A

    公开(公告)日:2020-05-19

    申请号:CN201811348720.1

    申请日:2018-11-13

    Inventor: 郝龙伟

    Abstract: 本申请提供一种数据处理方法、装置、电子设备及可读存储介质,该方法包括:根据数据集中的数据样本的特征维度的方差对所述数据集中的数据样本进行分区划分;分别对各分区内的数据样本进行聚类,以得到各分区的聚类结果;对所述各分区的聚类结果进行合并,以得到所述数据集的聚类结果。该方法可以在保证算法准确率的情况下,提高算法输出效率。

    数据标签的确定方法、装置及计算机可读存储介质

    公开(公告)号:CN111291036A

    公开(公告)日:2020-06-16

    申请号:CN201811394214.6

    申请日:2018-11-21

    Abstract: 本发明是关于一种数据标签的确定方法、装置及计算机可读存储介质,涉及大数据处理领域。该方法包括:根据对多个抽样数据构建第一球树。由于可以根据第一球树对样本数据集中的样本数据进行分区,得到多个数据分区,因此可以根据多个数据分区中包括的样本数据,并行地构建每个数据分区对应的第二球树,也即并行地得到了多个第二球树。进而可以根据该多个第二球树确定待确定标签的目标数据的标签。如此,通过由第一球树和多个样本数据得到的多个数据分区,可以并行地构建多个第二球树,进而可以同时通过该多个第二球树确定目标数据的标签,提高了确定目标数据标签的效率。

    数据标签的确定方法、装置及计算机可读存储介质

    公开(公告)号:CN111291036B

    公开(公告)日:2023-10-20

    申请号:CN201811394214.6

    申请日:2018-11-21

    Abstract: 本发明是关于一种数据标签的确定方法、装置及计算机可读存储介质,涉及大数据处理领域。该方法包括:根据对多个抽样数据构建第一球树。由于可以根据第一球树对样本数据集中的样本数据进行分区,得到多个数据分区,因此可以根据多个数据分区中包括的样本数据,并行地构建每个数据分区对应的第二球树,也即并行地得到了多个第二球树。进而可以根据该多个第二球树确定待确定标签的目标数据的标签。如此,通过由第一球树和多个样本数据得到的多个数据分区,可以并行地构建多个第二球树,进而可以同时通过该多个第二球树确定目标数据的标签,提高了确定目标数据标签的效率。

    孤立树模型建立的方法和装置

    公开(公告)号:CN112990246B

    公开(公告)日:2022-09-09

    申请号:CN201911302317.X

    申请日:2019-12-17

    Inventor: 郝龙伟 姜伟浩

    Abstract: 本申请公开了一种孤立树模型建立的方法,属于计算机技术领域,方法包括:获取数据样本,生成根节点作为目标父节点,选取目标父节点的分割参考特征,当分割参考特征为类别型特征时,在分割参考特征的各特征值中选取分割参考特征值。生成目标父节点的第一子节点和第二子节点,将包括分割参考特征值的数据样本作为第一子节点的数据样本,将不包括分割参考特征值的数据样本作为第二子节点的数据样本;将满足预设条件的子节点确定为叶节点,将不满足预设条件的子节点作为目标父节点,转至执行在多个特征中选取分割参考特征的处理,直到将各子节点全部确定为目标孤立树模型的叶节点,生成目标孤立树模型。通过本申请可以提高孤立森林模型的检测准确度。

Patent Agency Ranking