-
公开(公告)号:CN117762418A
公开(公告)日:2024-03-26
申请号:CN202311605076.2
申请日:2023-11-28
Applicant: 中国科学院信息工程研究所 , 国网福建省电力有限公司信息通信分公司
Abstract: 本发明提供二进制函数的嵌入生成方法、装置、电子设备和介质,涉及计算机技术领域。该方法包括:将目标二进制函数输入到预先训练的控制流语义学习模型,得到控制流语义嵌入,其中,控制流语义学习模型用于将二进制函数对应的关系控制流图转换成向量并输出;将目标二进制函数输入到预先训练的全局顺序语义学习模型,得到全局顺序语义嵌入,全局顺序语义学习模型用于将二进制函数对应的机器码转换成向量并输出;对控制流语义嵌入和全局顺序语义嵌入进行整合,将整合结果作为目标二进制函数对应的嵌入。本发明的方案能够入,使得二进制函数的嵌入能够最大程度的保留代码信息,具有较好的泛化性能,提高了二进制函数嵌入质量。
-
公开(公告)号:CN116150763A
公开(公告)日:2023-05-23
申请号:CN202310069034.5
申请日:2023-01-13
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及数据处理技术领域,提供一种第三方库重用检测方法、装置、电子设备和存储介质,该方法包括:对待检测二进制文件和侯选库进行锚点检测,得到多个锚点;对每个锚点进行锚点增强,得到每个锚点的候选重用区域;调整候选重用区域,基于调整结果确定重用分值最高的候选重用区域,并将重用分值最高的候选重用区域作为第三方库的重用区域。本发明将第三方库重用检测任务转化为第三方库重用区域探测任务,在常量特征和函数特征的基础上,进一步进行函数调用图粒度的区域探索,以减少不同编译选项和体系结构的影响,同时探索真正的重用范围,解决传统特征单一和粒度不匹配问题,减少漏报和误报,提高第三方库重用检测的准确性。
-
公开(公告)号:CN118278002A
公开(公告)日:2024-07-02
申请号:CN202410286080.5
申请日:2024-03-13
Applicant: 中国科学院信息工程研究所
IPC: G06F21/56 , G06F21/53 , G06N3/0442 , G06N3/0455 , G06F18/213 , G06F18/25 , G06N3/084
Abstract: 本发明公开了一种基于API调用序列特征挖掘的软件后门检测方法及装置,涉及网络安全技术领域,通过BLTF‑Net模型分析获取API序列并进行嵌入编码,通过BiLSTM生成API调用的时间依赖特征,通过Transformer生成API调用的生成全局上下文信息特征;将生成的API调用的时间依赖特征和全局上下文信息特征进行融合,根据融合后的全面特征表示进行是否存在后门行为检测,输出检测结果。本发明兼顾了API调用的双向时间依赖关系和全局的长距离依赖关系,能够识别潜在的软件后门活动,具有更强的检测能力。
-
公开(公告)号:CN118012740A
公开(公告)日:2024-05-10
申请号:CN202311814301.3
申请日:2023-12-26
Applicant: 中国科学院信息工程研究所
Abstract: 本申请实施例提供一种基于方向识别的复杂重用关系检测方法及装置,所述方法包括:获取目标文件与第三方库之间的重用函数;基于所述目标文件获取所述重用函数的重用方向特征,所述重用方向特征是基于所述重用函数的函数名、所述重用函数的字符串模式和所述重用函数的调用关系确定的;根据所述重用方向特征对所述第三方库进行检测,得到所述重用函数的重用方向;基于所述重用函数的重用方向确定重用类型。本申请实施例提供的基于方向识别的复杂重用关系检测方法及装置,通过利用重用方向特征,在第三方库重用函数检测的结果上,进一步进行重用方向检测,以检测复杂重用关系,可以解决无法获得源码的情况,并显著减少误报。
-
公开(公告)号:CN117033546A
公开(公告)日:2023-11-10
申请号:CN202310790290.3
申请日:2023-06-29
Applicant: 中国科学院信息工程研究所
IPC: G06F16/33 , G06F40/194 , G06F16/901 , G06F16/903 , G06F18/22 , G06F8/53 , G06F8/75 , G06N3/0464
Abstract: 本发明提供一种相似代码搜索方法及系统,方法包括:根据多个代码文件对应的函数集,获取目标代码文件中的目标函数和搜索对象中的各个函数之间的相似度,多个代码文件包括目标代码文件和搜索对象,搜索对象包括一个或多个代码文件,相似度是根据目标函数的第一语义嵌入和搜索对象中的各个函数的第二语义嵌入确定的,第一语义嵌入是根据目标函数的外部语义嵌入和内部语义嵌入确定的,第二语义嵌入是根据搜索对象中的各个函数的外部语义嵌入和内部语义嵌入确定的;根据相似度,从搜索对象中筛选出与目标代码文件相似的代码文件。所述系统执行所述方法。本发明能够从大规模代码文件中准确召回与目标代码文件最为相似的代码文件。
-
公开(公告)号:CN116243962A
公开(公告)日:2023-06-09
申请号:CN202310078257.8
申请日:2023-01-17
Applicant: 中国科学院信息工程研究所
IPC: G06F8/71 , G06F8/41 , G06F40/194
Abstract: 本发明提供的一种开源软件的版本识别方法、电子设备及存储介质,通过获取待识别开源软件的目标二进制文件;根据所述目标二进制文件,提取所述待识别开源软件的目标版本特征;根据所述目标版本特征进行版本粗筛选,得到候选版本集合;将所述候选版本集合中的候选版本与所述目标二进制文件进行比较,得到所述待识别开源软件的目标版本。本发明通过进行版本差异特征的比较,在有效避免冗余噪声特征对版本差异识别的影响的同时,能够识别邻接版本之间细粒度的改动差异。并且采用先进行粗筛选再进行仔细比对的方式,兼顾了识别的准确率和效率。
-
公开(公告)号:CN119046938A
公开(公告)日:2024-11-29
申请号:CN202410286095.1
申请日:2024-03-13
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于多粒度特征匹配的软件后门候选区定位方法及系统,涉及网络安全技术领域。创建可信工业软件特征数据库;将待检测软件的二进制文件转换为统一的中间语言并提取软件结构化特征;将待检测软件与可信工业软件特征数据库的软件结构化特征文件基于函数调用图CG进行函数初始映射,得到两文件相似函数映射集合;根据相似函数映射集合,对每个函数对应的控制流图CFG进行结构匹配,找出差异代码块并作为软件后门候选区。本发明基于工业软件特征数据库解决定位类型单一问题,转换为中间语言表示可以兼容不同架构设计的软件,基于多粒度特征匹配能够提高定位准确度和精度。
-
-
-
-
-
-