基于图像分类的恶意代码检测方法、装置、设备及介质

    公开(公告)号:CN117218449A

    公开(公告)日:2023-12-12

    申请号:CN202311283225.8

    申请日:2023-09-28

    Inventor: 王瑞琪 安晓宁

    Abstract: 本申请实施例提供一种基于图像分类的恶意代码检测方法、装置、设备及存储介质,涉及恶意代码检测技术领域。所述方法包括:获取待检测代码样本的字节流文件;基于三种间隔距离分别对字节流文件进行字节对提取,得到三个字节对集合;基于三个字节对集合进行计算得到对应的三个马尔可夫概率转移矩阵;基于三个马尔可夫概率转移矩阵生成待测RGB图像;将待测RGB图像输入至训练好的图像分类模型,得到恶意代码检测结果。本申请实施例通过采用三种不同的方式提取待测字节文件的字节对并计算相应的马尔可夫概率转移矩阵,作为RGB图像的三个通道输入信息以实现代码可视化,从而能够充分提取得到代码的特征及语义信息,提高对恶意代码进行检测的准确性。

    恶意软件家族分类的方法、装置、存储介质及电子设备

    公开(公告)号:CN117195056A

    公开(公告)日:2023-12-08

    申请号:CN202311228978.9

    申请日:2023-09-21

    Inventor: 宣羽泽 安晓宁

    Abstract: 本申请的一些实施例提供了一种恶意软件家族分类的方法、装置、存储介质及电子设备,该方法包括:对软件样本进行反汇编和多特征提取,获取所述软件样本的特征矩阵;利用所述软件样本中的第一样本对应的第一特征矩阵对自编码器模型进行训练,获取表征模型;将所述软件样本中除所述第一样本之外的第二样本的第二特征矩阵输入至所述表征模型,得到所述第二样本对应的表征向量;利用所述第二样本对应的表征向量对初始软件家族分类器进行训练,获取所述原型网络模型和原型集,其中,所述表征模型、所述原型网络模型和所述原型集用于对恶意软件家族分类。本申请的一些实施例可以实现对恶意软件家族的准确分类。

    一种恶意代码分类方法、装置、电子设备及存储介质

    公开(公告)号:CN118070276A

    公开(公告)日:2024-05-24

    申请号:CN202311355602.4

    申请日:2023-10-18

    Abstract: 本申请实施例提供一种恶意代码分类方法、装置、电子设备及存储介质,所述方法包括:将恶意代码的二进制文件进行反汇编,得到控制流图;提取控制流图中每个基本块的语义特征;将各基本块的语义特征与控制流图的结构信息输入基于注意力的图神经网络,输出控制流图的整图嵌入;基于整图嵌入进行恶意家族分类,得到恶意代码所属的恶意家族。在图神经网络中融合注意力机制,使得在融合各基本块的语义特征与结构信息时,可以忽略掺杂有混淆手段的无效基本块及其结构信息。整图嵌入融合了更多重要节点的语义特征及结构信息,使得在恶意家族分类时考虑的是有用的语义特征及调用关系,提高了抵抗恶意软件中的混淆手段的能力与分类准确性。

    一种代码同源性分析方法及装置
    34.
    发明公开

    公开(公告)号:CN118012480A

    公开(公告)日:2024-05-10

    申请号:CN202311462337.X

    申请日:2023-11-02

    Abstract: 本申请提供一种代码同源性分析方法及装置,该方法包括:获取待处理原始代码;对待处原始代码进行二进制提升处理,得到LLVM IR中间语言;基于LLVM IR中间语言进行重优化处理和预处理,得到预处理代码;基于CBOW扩展模型、SIF模型和预处理代码,生成基本块的特征向量;基于基本块向量进行基于恶意功能的匹配处理,得到目标匹配结果;基于目标匹配结果进行同源性分析,得到两个恶意二进制函数以及两个恶意二进制函数的同源性指数。可见,该方法及装置能够解决多样化编译环境干扰二进制语义提取的问题,有利于消除编译器、编译选项、架构等对语义分析产生的干扰,提升了恶意代码同源性分析准确率,提升了恶意代码识别准确率。

    一种识别恶意软件类型的方法、装置、介质及电子设备

    公开(公告)号:CN117313090A

    公开(公告)日:2023-12-29

    申请号:CN202311267458.9

    申请日:2023-09-27

    Inventor: 宣羽泽 安晓宁

    Abstract: 本申请实施例提供一种识别恶意软件类型的方法、装置、介质及电子设备,采用本申请实施例能够深入挖掘可执行文件的内在结构和语义信息,所述方法包括:获取待识别恶意软件中的所有函数,并得到所述所有函数中各函数的程序控制流图;获取所述待识别恶意软件的函数调用图;以所述函数调用图中的边作为边结构,并以与每个程序控制流图对应的嵌入向量为节点,构建层次图;将所述层次图编码为一个目标特征向量;将所述目标特征向量输入恶意软件分类模型获取所述待识别恶意软件的类别。本申请的实施例基于分层图的图神经网络模型,能够更准确地捕捉函数内部的结构语义和不同函数之间的关联语义,有效解决了CFG和FCG层次特征表征不准确的问题。

Patent Agency Ranking