-
公开(公告)号:CN112926303A
公开(公告)日:2021-06-08
申请号:CN202110201467.2
申请日:2021-02-23
Applicant: 南京邮电大学
IPC: G06F40/205 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种基于BERT‑BiGRU的恶意URL检测的方法,解决当前对于恶意URL检测识别准确度不高的问题。本发明首先使用BERT模型的Transformer特征提取器,代替了传统常用的CNN或者RNN的固有模式,利用其能够提取词向量的动态特征特点以及其本身并行计算的优点,此外由于其多头自注意力机制,可以获得相关性更强的URL文本特征。然后将训练得到的特征向量,输入到BiGRU网络结构,由于其双向各训练一个GRU模型,使得序列中每个词完整依赖上下文信息,接着把神经网络向量拼接之后得到的结果向量,通过全连接层结合softmax分类器,实现URL分类。本发明通过这些模型方法的结合应用,能够提高URL分类的准确性和稳定性,具有良好的实施性和实效性。
-
公开(公告)号:CN112926303B
公开(公告)日:2023-06-27
申请号:CN202110201467.2
申请日:2021-02-23
Applicant: 南京邮电大学
IPC: G06F40/205 , G06N3/0455 , G06N3/08
Abstract: 本发明提出一种基于BERT‑BiGRU的恶意URL检测的方法,解决当前对于恶意URL检测识别准确度不高的问题。本发明首先使用BERT模型的Transformer特征提取器,代替了传统常用的CNN或者RNN的固有模式,利用其能够提取词向量的动态特征特点以及其本身并行计算的优点,此外由于其多头自注意力机制,可以获得相关性更强的URL文本特征。然后将训练得到的特征向量,输入到BiGRU网络结构,由于其双向各训练一个GRU模型,使得序列中每个词完整依赖上下文信息,接着把神经网络向量拼接之后得到的结果向量,通过全连接层结合softmax分类器,实现URL分类。本发明通过这些模型方法的结合应用,能够提高URL分类的准确性和稳定性,具有良好的实施性和实效性。
-