网页聚类方法及相关装置

    公开(公告)号:CN114611038A

    公开(公告)日:2022-06-10

    申请号:CN202210094439.X

    申请日:2022-01-26

    Abstract: 本申请提供一种网页聚类方法及相关装置,其中,所述方法包括:将同类的待聚类网页数据归类为一簇,并设置相应的簇心,通过待聚类网页和各个已有簇的簇心间进行比较,对待聚类网页进行聚类。其中:通过DOM树尺寸的预比较,减少了距离计算的次数;通过提出层次分布距离的定义并以此作为DOM树相似程度的衡量方法,使得所提出方法在具有较高执行效率的同时,能够保证更优的聚类效果。

    多维时间序列异常检测方法、装置、电子设备、存储介质及程序产品

    公开(公告)号:CN119917967A

    公开(公告)日:2025-05-02

    申请号:CN202411870166.9

    申请日:2024-12-18

    Inventor: 张树壮 段忠

    Abstract: 本公开提供一种多维时间序列异常检测方法、装置、电子设备、存储介质及程序产品,包括:确定多维时间序列,对所述多维时间序列进行掩码,得到掩码后的序列;基于时间自注意力机制对多维时间序列进行特征提取,得到第一序列特征;基于特征自注意力机制对多维时间序列进行特征提取,得到第二序列特征;基于第一序列特征和第二序列特征对掩码后的序列进行重建,得到重构序列;通过异常检测模型,确定异常分数;基于预设阈值对异常分数判断,响应于异常分数大于等于预设阈值,确定多维时间序列存在异常。本公开能够精确捕捉单个时间序列中的顺序依赖关系,洞察不同维度时间序列之间的相互依赖性,提高异常检测的准确性和稳定性。

    一种基于地址翻译的网络会话流量对准方法

    公开(公告)号:CN110365807A

    公开(公告)日:2019-10-22

    申请号:CN201910500388.4

    申请日:2019-06-11

    Abstract: 本发明提供一种基于地址翻译的网络会话流量对准方法,具体过程为:为每台流量处理服务器分配相应的可用地址池,地址池中包含一组可用的IP地址;当流量服务器获取上行数据包时,从其对应地址池选取一个IP地址来替换所述数据包中的源IP地址,然后提取上行数据包的五元组,存储到会话映射表中;当目标收到上行数据包时,生成下行数据包,当下行数据包经过另一个流量服务器时,将下行数据包发送至上行对应的流量处理服务器;流量服务器接收到下行数据包后获取数据包的五元组,当其与所存储的会话映射表比对后确定其为同一会话数据包时,则完成对准,否则回注到网络中。本发明实现了特定点只使用特定IP地址的功能,满足了网络审计、网络安全等相关应用中需要对双向流量进行处理的场景,方法快捷高效。

    网页聚类方法及相关装置

    公开(公告)号:CN114611038B

    公开(公告)日:2024-10-15

    申请号:CN202210094439.X

    申请日:2022-01-26

    Abstract: 本申请提供一种网页聚类方法及相关装置,其中,所述方法包括:将同类的待聚类网页数据归类为一簇,并设置相应的簇心,通过待聚类网页和各个已有簇的簇心间进行比较,对待聚类网页进行聚类。其中:通过DOM树尺寸的预比较,减少了距离计算的次数;通过提出层次分布距离的定义并以此作为DOM树相似程度的衡量方法,使得所提出方法在具有较高执行效率的同时,能够保证更优的聚类效果。

    网站识别方法、装置及电子设备
    7.
    发明公开

    公开(公告)号:CN116405250A

    公开(公告)日:2023-07-07

    申请号:CN202310208193.9

    申请日:2023-02-27

    Inventor: 张树壮 李杰

    Abstract: 本申请提供一种网站识别方法、装置及电子设备。所述方法包括:获取加密数据流中的多个数据包;根据所有所述数据包的属性值,通过网页资源序列算法,得到网页资源序列;对所述网页资源序列进行特征提取,得到网页资源特征;对所述网页资源特征进行特征编码,得到网页资源特征向量;根据所述网页资源特征向量,通过训练好的分类模型,得到目标网站结果及所述目标网站结果对应的可能性。通过所述方法,提高了网站的识别准确率。

Patent Agency Ranking