-
公开(公告)号:CN117714165A
公开(公告)日:2024-03-15
申请号:CN202311733061.4
申请日:2023-12-15
Applicant: 中国科学院计算技术研究所
IPC: H04L9/40 , G06N3/0455 , G06F18/22 , H04L61/4511
Abstract: 本发明提供一种恶意域名识别模型的训练方法以及恶意域名识别方法,所述识别方法包括:将待识别域名与已知恶意域名集中的每一域名分别组成识别域名对;将域名对输入至训练好的基于BERT模型的恶意域名识别模型中,所述识别模型输出所述识别域名对的预测相似度;若识别域名对的预测相似度大于预设阈值,则确定所述待识别域名为恶意域名。本发明的基于BERT模型的恶意域名识别模型充分挖掘了DNS流量中包含的信息,有效结合了域名的文本特征和交互行为的特征,将域名二分类问题转换为预测域名之间的相似度问题,基于该识别模型的识别方法解决了分类器方法在样本不平衡场景下表现不佳的问题,实现了识别结果更准确、识别应用场景更广的效果。