-
公开(公告)号:CN120030540A
公开(公告)日:2025-05-23
申请号:CN202510183190.3
申请日:2025-02-19
Applicant: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
Inventor: 李海燕
IPC: G06F21/56 , G06F18/213 , G06F18/214 , G06F18/241 , G06F18/25 , G06V10/44 , G06V10/82 , G06F40/151 , G06F40/284 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本申请实施例提供一种模型训练方法、恶意文件检测方法、设备、介质及程序产品,涉及文件检测技术领域。所述方法包括:收集样本PDF文件数据集;获取样本PDF文件的二进制编码数据,确定对应的转移概率矩阵并转换成灰度图像;基于灰度图像提取图像特征;对样本PDF文件的内容编码数据提取对应的预处理数据并转换成词向量数据,基于词向量数据提取文本特征;基于样本PDF文件的特征及其相应的样本标注信息对待训练的分类模型进行训练,得到训练好的恶意文件检测模型。本申请通过获取PDF文件不同编码形式的数据,并分别从中提取图像特征和文本特征,以基于提取得到的多模态特征数据进行模型训练,进而有效提高恶意PDF文件检测的精确性和可靠性。
-
公开(公告)号:CN115186262A
公开(公告)日:2022-10-14
申请号:CN202210820036.9
申请日:2022-07-12
Applicant: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
Inventor: 李海燕
Abstract: 本申请提供一种ELF文件的聚类方法、装置、电子设备及计算机可读存储介质,其中,该方法包括:输入原始ELF文件;获取所述原始ELF文件的影像化矩阵和影像化衍生体矩阵;根据所述影像化矩阵和所述影像化衍生体矩阵构建CNN分类模型;将待分类的ELF文件输入所述CNN分类模型,获得分类概率矩阵;根据所述分类概率矩阵获得聚类结果。实施本申请实施例,能够自动进行ELF文件的特征提取,避免了对ELF文件解析、手动提取特征的过程,同时提升模型的拟合能力,实现在没有标签的情况下对ELF文件进行聚类。
-
公开(公告)号:CN114973298A
公开(公告)日:2022-08-30
申请号:CN202210730324.5
申请日:2022-06-24
Applicant: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
Inventor: 李海燕
IPC: G06V30/422 , G06V30/19 , G06V30/18 , G06N3/04 , G06N3/08
Abstract: 本申请提供一种工程图识别方法、装置、电子设备及存储介质,用于改善识别出工程图的效率较低的问题。该方法包括:获取多个待识别图像,并根据预设条件从多个待识别图像中剔除掉非工程图,获得剔除后的至少一个图像;使用训练后的图像分类模型识别出至少一个图像的绘图类型,绘图类型表征待识别图像是否为工程图。通过根据预设条件从多个待识别图像中剔除掉非工程图,然后,使用训练后的图像分类模型进一步识别出剔除后的待识别图像的绘图类型,有效地结合了深度学习的图像分类模型识别绘图类型和根据预设条件识别绘图类型,从而避免了使用人工识别的方式或者手工提取图像特征的方式识别工程图,有效地提高了识别出工程图的效率。
-
公开(公告)号:CN112347478B
公开(公告)日:2021-08-24
申请号:CN202011089772.9
申请日:2020-10-13
Applicant: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
Abstract: 本发明实施例提供一种恶意软件检测方法及装置,涉及网络安全技术领域。该方法包括:将待检测软件转换为第一图像和第二图像,第一图像为行宽度和列宽度均为N,第二图像为行宽度和列宽度均M;将第一图像分割平均为L个第三图像;基于深度学习预测模型各图像为各个软件类别的概率;判断命中数量是否大于X,命中数量为待预测图像集中命中目标软件类别的图像的数量,待预测图像集中任一图像命中的软件类别为该图像的概率中的最大值对应的软件类别,目标软件类别为被待预测图像集中的图像命中次数最多的软件类别;若否,则输出用于为非恶意软件的指示信息。本发明实施例用于在进行恶意软件检测时减小误报率。
-
公开(公告)号:CN115690412A
公开(公告)日:2023-02-03
申请号:CN202211197390.7
申请日:2022-09-29
Applicant: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
Inventor: 李海燕
Abstract: 本申请涉及图像处理技术领域,提供了一种文档遮盖区域检测方法、装置、电子设备及存储介质。所述方法包括:对待检测文档图像执行图像预处理及形态学处理,得到第一图像;对第一图像执行第一遮盖区域检测,得到一个或多个第一候选区域,基于第一候选区域得到第二图像;对第二图像执行第二遮盖区域检测,得到一个或多个第二候选区域;对第二候选区域执行第三遮盖区域检测,得到待检测文档图像对应的目标遮盖区域。本申请在降低算力的基础上,快速、准确地检测文档遮盖区域。
-
公开(公告)号:CN112347478A
公开(公告)日:2021-02-09
申请号:CN202011089772.9
申请日:2020-10-13
Applicant: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
Abstract: 本发明实施例提供一种恶意软件检测方法及装置,涉及网络安全技术领域。该方法包括:将待检测软件转换为第一图像和第二图像,第一图像为行宽度和列宽度均为N,第二图像为行宽度和列宽度均M;将第一图像分割平均为L个第三图像;基于深度学习预测模型各图像为各个软件类别的概率;判断命中数量是否大于X,命中数量为待预测图像集中命中目标软件类别的图像的数量,待预测图像集中任一图像命中的软件类别为该图像的概率中的最大值对应的软件类别,目标软件类别为被待预测图像集中的图像命中次数最多的软件类别;若否,则输出用于为非恶意软件的指示信息。本发明实施例用于在进行恶意软件检测时减小误报率。
-
-
-
-
-