一种通过聚类算法判定互联网网站归属的方法

    公开(公告)号:CN111444961B

    公开(公告)日:2023-08-18

    申请号:CN202010223235.2

    申请日:2020-03-26

    Abstract: 一种通过聚类算法判定互联网网站归属的方法,属于网络空间安全技术领域,本发明为了解决传统网站备案信息判定方法和网页信息判定方法无法判定网站归属,或者导致判定归属错误的问题。步骤a,输入待判定归属单位的网站集合,基础数据为网站URL;步骤b,对网站基础信息进行提取;步骤c,对步骤二中提取到的所有信息进行量化;步骤d,将各类特征值映射到同一量纲下的[0,1]区间;归一化特征向量FNwebsite;步骤e,利用无监督聚类算法DBSCAN对数据集进行聚类。本发明的一种通过聚类算法判定互联网网站归属的方法使用聚类分析算法,实现网站归属的自动化判定,有效提升归属判定准确率。

    一种通过聚类算法判定互联网网站归属的方法

    公开(公告)号:CN111444961A

    公开(公告)日:2020-07-24

    申请号:CN202010223235.2

    申请日:2020-03-26

    Abstract: 一种通过聚类算法判定互联网网站归属的方法,属于网络空间安全技术领域,本发明为了解决传统网站备案信息判定方法和网页信息判定方法无法判定网站归属,或者导致判定归属错误的问题。步骤a,输入待判定归属单位的网站集合,基础数据为网站URL;步骤b,对网站基础信息进行提取;步骤c,对步骤二中提取到的所有信息进行量化;步骤d,将各类特征值映射到同一量纲下的[0,1]区间;归一化特征向量FNwebsite;步骤e,利用无监督聚类算法DBSCAN对数据集进行聚类。本发明的一种通过聚类算法判定互联网网站归属的方法使用聚类分析算法,实现网站归属的自动化判定,有效提升归属判定准确率。

Patent Agency Ranking