-
公开(公告)号:CN113098874A
公开(公告)日:2021-07-09
申请号:CN202110359991.2
申请日:2021-04-02
IPC: H04L29/06 , G06K9/62 , G06F16/903
Abstract: 本发明公开一种基于URL字符串随机率特征提取的钓鱼网站检测方法,本发明通过字符串随机率将正确的英文单词和正确的汉语全拼定义为标准字符串,而标准字符串之外的字符串则赋予值为[0,1]区间的不同程度的随机率;在字符串的随机率的基础上,通过最佳的标准相邻列表将字符串的随机率与标准相邻列表相结合,提出6个新的URL特征。并通过建立决策树分类模型的方式实现对钓鱼网站的检测。本发明仅通过URL进行钓鱼网站的检测,具备时间开销小、检测准确性高的特点。
-
公开(公告)号:CN105817029A
公开(公告)日:2016-08-03
申请号:CN201610145217.0
申请日:2016-03-14
Applicant: 安徽大学
Abstract: 本发明公开了一种六子棋博弈系统中基于路和棋型的混合搜索方法,本发明是在使用Alpha?Beta剪枝算法对博弈树进行搜索时扩展中间节点阶段对候选节点的估值使用了基于“路”的估值方式,在对叶子节点进行估值时使用了基于“棋型”的估值方式。将这两种估值方式混合使用,应用于Alpha?Beta剪枝搜索中,结合两者的优点。混合搜索模式与单一的基于“路”的搜索模式相比,在搜索效率相同的情况下提高了博弈水平,与单一的基于“棋型”的搜索模式相比,在相同的博弈水平下提高了搜索效率。
-
公开(公告)号:CN119814391A
公开(公告)日:2025-04-11
申请号:CN202411847970.5
申请日:2024-12-16
Applicant: 安徽大学
IPC: H04L9/40 , H04L51/42 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06F16/334 , G06F16/35 , G06F40/20 , G06F18/214
Abstract: 本发明公开一种基于词频和上下文语义多特征融合的钓鱼邮件深度检测方法,通过融合字符级与词级的邮件头和邮件体特征,以及结合1‑D CNN模块和BiLSTM,在提高模型处理多样化和复杂邮件文本的能力方面显示出显著的创新性;不仅利用了CNN的局部特征提取能力和BiLSTM的序列数据处理优势,还增强了模型对复杂邮件特性的理解和分类效率。同时,应用了如文本标准化、词性还原的数据预处理步骤,以及TF‑IDF和Word2Vec技术,为特征提取和分类任务提供了标准化输入数据,并有效捕获了词语的语义信息,这些都是文本分析领域的常规做法。总体上,本发明在融合先进的模型架构和利用成熟的自然语言处理技术方面,为复杂文本分析任务提供了新的解决方案。
-
公开(公告)号:CN119652627A
公开(公告)日:2025-03-18
申请号:CN202411849428.3
申请日:2024-12-16
Applicant: 安徽大学
IPC: H04L9/40 , G06N3/0464 , G06N3/08 , G06F18/24
Abstract: 本发明公开一种融合URL字符和HTML内容语义的钓鱼网页检测方法,基于多尺度卷积策略的URL字符级局部特征精细提取,利用不同尺寸卷积核的CNN并行处理URL字符串,提取不同粒度的特征,从而全面捕捉数据的多层次信息,增强模型对URL潜在威胁的敏感;基于级联密集连接CNN架构的HTML文本词级特征提取。通过堆叠多个卷积层并在卷积块之间建立密集连接,提取更深层次和细粒度的语义特征;通过全连接层将URL特征字符和HTML特征进行融合,并计算出相应的概率以判定其是否为钓鱼网页。本发明充分利用深度学习算法的优势,整合钓鱼网页的URL字符与HTML内容的特征,形成更为全面的语义表示,极大地提高了钓鱼网页检测的识别率。
-
公开(公告)号:CN119341816A
公开(公告)日:2025-01-21
申请号:CN202411472624.3
申请日:2024-10-22
Applicant: 安徽大学
IPC: H04L9/40 , H04L61/4511 , G06F16/904 , G06F16/906 , G06F16/955 , G06F18/214 , G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于YOLOv5和Resnet‑101的钓鱼网站检测方法,构建和训练钓鱼网站检测网络模型,钓鱼网站检测网络模型包括基于目标检测模块和相似度计算模块;目标检测模块结合有YOLOv5s网络和注意力模块,相似度计算模块基于Resnet‑101网络;通过目标检测模块得到待检测网站的目标信息,使用相似度计算模块对检测目标Logo图像和合法Logo图像进行特征提取和余弦相似度计算,当余弦相似度高于设定阈值,则判断检测目标Logo图像为正确的,标记待检测网站为合法网站。本发明不需要任何钓鱼数据的训练,具备时间开销小、检测准确性高、可拓展性强的特点。
-
公开(公告)号:CN117454387A
公开(公告)日:2024-01-26
申请号:CN202311468206.2
申请日:2023-11-07
Applicant: 安徽大学
IPC: G06F21/57 , G06F21/56 , G06F18/2415 , G06F18/25 , G06N3/0442 , G06N3/086
Abstract: 本发明公开一种基于多维度的特征提取的漏洞代码检测方法,利用Joern平台对代码数据进行提取出数据流图、控制流图以及抽象语法树,从这些图形中抽象出图形信息;将图中节点代码转化成可使用Codebert模型进行特征提取的嵌入向量,作为图注意力网络输入,得到整个代码图形的图形编码,这样就得到图形维度的特征。另外,对原代码文本信息进行处理,采用Codebert进行编码任务,得到文本维度的特征信息。将这两种维度的特征相结合作为漏洞检测的分类任务输入,进而从多层次对漏洞代码进行分析检测。本发明通过一种新型特征提取融合方法,以及一种新型漏洞检测模型,极大提高了漏洞代码检测的准确率与速度。
-
公开(公告)号:CN119341815A
公开(公告)日:2025-01-21
申请号:CN202411472593.1
申请日:2024-10-22
Applicant: 安徽大学
IPC: H04L9/40 , G06F16/955 , G06F16/958 , G06F16/906 , G06F16/9032 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本发明公开一种基于大模型的多模态钓鱼网站检测方法,服务器提取目标网站URL地址的域名文本以及URL地址所对应的网页截图,随后将得到的域名文本和网页截图分别预处理得到文本初始特征和图片初始特征;通过神经网络深度学习模型CLIP处理得到文本特征和图片特征;计算得到的文本特征和图片特征之间的相似度,得到图文本相似度矩阵,并归一化处理得到图文本概率矩阵;将图文本概率矩阵通过分析选择器生成决策集和扩展集,最后通过分析决策集和扩展集,判断目标网站是否属于钓鱼网站。
-
公开(公告)号:CN113098874B
公开(公告)日:2022-04-26
申请号:CN202110359991.2
申请日:2021-04-02
IPC: H04L9/40 , G06K9/62 , G06F16/903
Abstract: 本发明公开一种基于URL字符串随机率特征提取的钓鱼网站检测方法,本发明通过字符串随机率将正确的英文单词和正确的汉语全拼定义为标准字符串,而标准字符串之外的字符串则赋予值为[0,1]区间的不同程度的随机率;在字符串的随机率的基础上,通过最佳的标准相邻列表将字符串的随机率与标准相邻列表相结合,提出6个新的URL特征。并通过建立决策树分类模型的方式实现对钓鱼网站的检测。本发明仅通过URL进行钓鱼网站的检测,具备时间开销小、检测准确性高的特点。
-
公开(公告)号:CN107526970B
公开(公告)日:2020-05-19
申请号:CN201710737006.0
申请日:2017-08-24
Applicant: 安徽大学
IPC: G06F21/57
Abstract: 本发明公开了一种基于动态二进制平台检测运行时程序漏洞的方法,属于虚拟机与程序分析技术领域,包括:基于二进制代码执行平台Pin,对主存和寄存器中来自外部渠道的输入进行识别并将其作为可疑污染源加以标记;通过中间指令层实现可疑污染源传播行为的跟踪,根据各指令操作数的污点状态对污染行为进行分析,其中污点状态包括被污染、未被污染和受控污染;建立内存模型和寄存器模型记录每个主存字节和寄存器字节的污点状态。本发明提出受约束的污染状态,提高了漏洞检测的覆盖率。提供全新的Hash链接表结构,该结构可以在不增加存取时间的情况下,减少污点信息的存储空间。通过将不相关的API函数过滤机制,大大降低了系统运行开销。
-
公开(公告)号:CN110909792A
公开(公告)日:2020-03-24
申请号:CN201911146579.1
申请日:2019-11-21
Applicant: 安徽大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于改进K-means算法和新聚类有效性指标的聚类分析方法,首先通过密度信息获取高密度初始聚类中心点,按照初始聚类中心点进行K-means算法聚类;不断迭代聚类中心点;计算聚类有效性指标的值并将最小的聚类有效性指标对应的簇数作为数据集的最佳聚类数并输出最佳聚类结果。本发明可以有效的降低K-means聚类算法的迭代次数,减少聚类时间消耗,提升聚类效率;高密度初始中心点和中心点替换方法的结合降低了K-means聚类算法陷入局部最优解的可能性;聚类结果稳定精确。
-
-
-
-
-
-
-
-
-