一种基于KNN算法的半结构化数据分类方法及装置

    公开(公告)号:CN108268458A

    公开(公告)日:2018-07-10

    申请号:CN201611253977.X

    申请日:2016-12-30

    CPC classification number: G06F16/35

    Abstract: 本发明公开一种基于KNN算法的半结构化数据分类方法及装置,该方法包括:步骤S1,将训练集中的所有训练半结构化数据都表示成计算机能够识别的数据向量;步骤S2,得到该类别的类中心向量;步骤S3,接收测试半结构化数据后,将所述测试半结构化数据表示为所述数据向量;步骤S4,计算所述测试半结构化数据与训练集中每个类的类中心向量的距离;步骤S5,计算对应的相似度;步骤S6,将所述测试半结构化数据归类为与其相似度最大的类中;该装置包括对应的训练转换单元、类中心向量计算单元、测试转换单元、距离计算单元、相似度计算单元和分类单元。这样,引入测试半结构化数据与训练半结构化数据所在类的相似性,使得分类结果准确,且提高了分类精度。

    一种网络流量数据采集系统

    公开(公告)号:CN212115347U

    公开(公告)日:2020-12-08

    申请号:CN202021117755.7

    申请日:2020-06-17

    Abstract: 本实用新型公开了一种网络流量数据采集系统,涉及互联网技术领域,旨在解决如何合理进行网络流量数据采集,以减轻存储服务器的负担的问题,提供了以下技术方案,所述网络流量数据采集系统包括采集装置、存储服务器和网络设备;所述采集装置与所述存储服务器、所述网络设备通讯联接;所述采集装置内设有中央处理器,所述中央处理器联接有的配置管理模块、数据采集模块和监控管理模块;所述配置管理模块,用于配置数据采集任务;所述数据采集模块,包括至少一个采集端口,所述采集端口用于采集网络流量的请求数据;监控管理模块,用于监控所述配置管理模块和所述数据采集模块,并控制所述采集端口的开启/关闭。

Patent Agency Ranking