一种面向URL的钓鱼网站检测方法

    公开(公告)号:CN112468501B

    公开(公告)日:2022-10-25

    申请号:CN202011361704.3

    申请日:2020-11-27

    Applicant: 安徽大学

    Abstract: 本发明公开一种面向URL的钓鱼网站检测方法,包括以下步骤:截获用户要访问的URL并发送给服务器端;服务器端将URL分隔成固定长度的五个部分;嵌入层利用CNN和BiLSTM法提取以上五个部分的URL特征并将其转化成一个向量;利用TF‑IDF和注意力机制筛选有用特征以此来降低特征向量的维度,即得到一个精简的URL最优特征向量;利用数据集训练全连接层神经网络分类器;用最优特征向量表示的URL送入全连接层神经网络分类器,并根据计算出来的概率判定其是否为钓鱼网站的URL。本发明充分利用深度学习算法的优点,并且利用Attention机制降低特征维度,大大提高检测钓鱼网站的准确性和速度。

    一种面向URL的钓鱼网站检测方法

    公开(公告)号:CN112468501A

    公开(公告)日:2021-03-09

    申请号:CN202011361704.3

    申请日:2020-11-27

    Applicant: 安徽大学

    Abstract: 本发明公开一种面向URL的钓鱼网站检测方法,包括以下步骤:截获用户要访问的URL并发送给服务器端;服务器端将URL分隔成固定长度的五个部分;嵌入层利用CNN和BiLSTM法提取以上五个部分的URL特征并将其转化成一个向量;利用TF‑IDF和注意力机制筛选有用特征以此来降低特征向量的维度,即得到一个精简的URL最优特征向量;利用数据集训练全连接层神经网络分类器;用最优特征向量表示的URL送入全连接层神经网络分类器,并根据计算出来的概率判定其是否为钓鱼网站的URL。本发明充分利用深度学习算法的优点,并且利用Attention机制降低特征维度,大大提高检测钓鱼网站的准确性和速度。

Patent Agency Ranking