-
公开(公告)号:CN112468501B
公开(公告)日:2022-10-25
申请号:CN202011361704.3
申请日:2020-11-27
Applicant: 安徽大学
IPC: H04L9/40 , G06F16/955 , G06N3/04
Abstract: 本发明公开一种面向URL的钓鱼网站检测方法,包括以下步骤:截获用户要访问的URL并发送给服务器端;服务器端将URL分隔成固定长度的五个部分;嵌入层利用CNN和BiLSTM法提取以上五个部分的URL特征并将其转化成一个向量;利用TF‑IDF和注意力机制筛选有用特征以此来降低特征向量的维度,即得到一个精简的URL最优特征向量;利用数据集训练全连接层神经网络分类器;用最优特征向量表示的URL送入全连接层神经网络分类器,并根据计算出来的概率判定其是否为钓鱼网站的URL。本发明充分利用深度学习算法的优点,并且利用Attention机制降低特征维度,大大提高检测钓鱼网站的准确性和速度。
-
公开(公告)号:CN112468501A
公开(公告)日:2021-03-09
申请号:CN202011361704.3
申请日:2020-11-27
Applicant: 安徽大学
IPC: H04L29/06 , G06F16/955 , G06N3/04
Abstract: 本发明公开一种面向URL的钓鱼网站检测方法,包括以下步骤:截获用户要访问的URL并发送给服务器端;服务器端将URL分隔成固定长度的五个部分;嵌入层利用CNN和BiLSTM法提取以上五个部分的URL特征并将其转化成一个向量;利用TF‑IDF和注意力机制筛选有用特征以此来降低特征向量的维度,即得到一个精简的URL最优特征向量;利用数据集训练全连接层神经网络分类器;用最优特征向量表示的URL送入全连接层神经网络分类器,并根据计算出来的概率判定其是否为钓鱼网站的URL。本发明充分利用深度学习算法的优点,并且利用Attention机制降低特征维度,大大提高检测钓鱼网站的准确性和速度。
-