-
公开(公告)号:CN108280197A
公开(公告)日:2018-07-13
申请号:CN201810082622.1
申请日:2018-01-29
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种识别同源二进制文件的方法及系统,所述方法包括:S1,使用最小哈希算法分别获取待识别二进制文件和各原二进制文件的签名;S2,使用分桶法对各所述签名进行分桶,获取各所述签名划分到各桶的字符串;其中,位于同一桶中的各所述字符串具有相同的字符数;S3,根据各桶中所述原二进制文件的签名对应的字符串,使用倒排索引法获取与各桶一一对应的字典;S4,根据各桶中所述待识别二进制文件的签名对应的字符串,从各桶对应的字典中获取与所述待识别二进制文件同源的原二进制文件。本发明减少计算量,提高识别同源二进制文件的速度和精度,适用于各种同源二进制文件的识别。
-
公开(公告)号:CN105488531B
公开(公告)日:2018-10-16
申请号:CN201510855073.3
申请日:2015-11-30
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
IPC: G06K9/62
Abstract: 本发明涉及一种嵌入式设备固件解压成功的判断方法,其主要步骤包括:试验样本集固件收集、固件熵谱获取、固件熵谱指纹特征提取、分类器训练及固件是否解压成功的判断。该方法采用处理图像信号的方法对固件熵谱作相应处理,提取了固件熵谱的多域综合特征;利用正向熵阈值和负向熵阈值之间的回差有效避免了熵值在多次穿越单一阈值时所产生的干扰;在训练分类器时,首先对固件熵谱特征作Z‑Score标准化处理,再采用机器学习的思想和K折交叉验证的方法对分类器进行多次交叉重复训练;对于待测试固件,通过加权统计的方法对各分类器判断结果进行累计加权统计,以次数居多者作为对固件是否解压成功的最终判定结果,保证了所得结果的准确性。
-
公开(公告)号:CN105868108B
公开(公告)日:2018-09-07
申请号:CN201610182075.5
申请日:2016-03-28
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于神经网络的指令集无关的二进制代码相似性检测方法,其主要步骤包括:对二进制文件进行逆向分析,提取函数的调用关系特征、字符串特征、栈空间特征、代码规模特征、路径序列特征、路径基本特征,度序列特征、度基本特征,图规模特征等9个方面共24个特征。基于特征的表现形式,采用3种相似度计算方法计算待比较的两个函数的24个特征的相似程度,作为集成神经网络分类器的输入向量,获得两个函数整体相似度的预测值并进行排序。本发明与现有的技术比,不依赖特定的指令集,可以实现不同指令集的二进制文件的相似度检测,准确率高,技术简单,易于推广。
-
公开(公告)号:CN108280197B
公开(公告)日:2020-09-11
申请号:CN201810082622.1
申请日:2018-01-29
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种识别同源二进制文件的方法及系统,所述方法包括:S1,使用最小哈希算法分别获取待识别二进制文件和各原二进制文件的签名;S2,使用分桶法对各所述签名进行分桶,获取各所述签名划分到各桶的字符串;其中,位于同一桶中的各所述字符串具有相同的字符数;S3,根据各桶中所述原二进制文件的签名对应的字符串,使用倒排索引法获取与各桶一一对应的字典;S4,根据各桶中所述待识别二进制文件的签名对应的字符串,从各桶对应的字典中获取与所述待识别二进制文件同源的原二进制文件。本发明减少计算量,提高识别同源二进制文件的速度和精度,适用于各种同源二进制文件的识别。
-
公开(公告)号:CN106295335B
公开(公告)日:2021-09-24
申请号:CN201510319074.6
申请日:2015-06-11
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提出了一种面向嵌入式设备的固件漏洞检测方法及系统,涉及嵌入式设备固件的漏洞挖掘与分析。本发明可利用固件中的函数之间的关联性,将已挖掘到的固件漏洞自动扩散到其他固件。其方法流程主要包括:固件爬取与漏洞收集,设备信息提取,固件的解码与反汇编,函数的指纹提取与匹配以及漏洞验证等步骤。本发明通过属性计数型指纹配合结构度量型指纹的方法兼顾了匹配的速度与精度,同时所用到的指纹特征均具有跨编译器和跨处理器平台的特性,因此保证了匹配时的强鲁棒性。
-
公开(公告)号:CN107704501A
公开(公告)日:2018-02-16
申请号:CN201710750221.4
申请日:2017-08-28
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明提供一种从数据库中识别同源二进制文件的方法和系统,所述数据库中包含复数个二进制的基础文件,所述方法包括:根据最小哈希算法,分别获得待识别文件的签名以及各基础文件的签名;对任意一个签名,根据分桶法对该签名进行分桶处理;根据倒排索引法和所有基础文件的分桶后的签名,获得与桶一一对应的字典,每个所述字典包含至少一个键值对;根据待识别文件的每个桶中的字符串,遍历对应的字典,根据匹配的键所对应的值,获得所述待识别文件的同源二进制文件。本发明采用最小哈希算法求取签名并采用局部敏感哈希算法进行分桶,能够显著地减少计算量,采用倒排索引的方法,对所有的签名建立索引表,提高识别同源二进制文件的速度。
-
公开(公告)号:CN105740477A
公开(公告)日:2016-07-06
申请号:CN201610157731.6
申请日:2016-03-18
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30705 , G06F17/30628 , G06F17/30634
Abstract: 本发明涉及一种针对大规模嵌入式设备固件的函数搜索方法和搜索引擎。首先收集固件并进行预处理,依据所提取的函数信息构建固件函数信息库;然后采用基于最小哈希的方法对同平台、同编译选项的函数进行快速离线聚类,从而压缩函数信息库的样本数量;再对固件函数信息进一步处理,从中抽取出索引项,构建固件函数索引数据库。待测固件函数进行关联检索时,采用基于最小哈希的方法依次在固件函数索引数据库中检索、识别与待关联函数同平台同编译选项和不同平台同编译选项的函数;而后再检索、识别与待关联函数同平台不同编译选项的函数,并以所得检索结果为跳板,去搜索与跳板不同平台同编译选项的函数。本发明能够提高固件函数关联的速率和准确率。
-
公开(公告)号:CN108520180B
公开(公告)日:2020-04-24
申请号:CN201810172682.2
申请日:2018-03-01
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种基于多维度的固件Web漏洞检测方法及系统,提取大量固件Web漏洞的通用漏洞特征,通过多类特征表征漏洞,形成固件的多维度Web漏洞特征库,然后提取待检测固件的脆弱性特征,通过多维度固件Web漏洞匹配算法进行漏洞特征匹配,通过漏洞规则推理模型对漏洞是否存在的可信程度进行量化判断,能够有效地检测、发现物联网及工业控制系统设备的固件中存在的Web安全漏洞及后门,在一定程度上降低固件Web漏洞检测漏报率和误报率,降低漏洞检测时间复杂度。
-
公开(公告)号:CN105868108A
公开(公告)日:2016-08-17
申请号:CN201610182075.5
申请日:2016-03-28
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F11/3608 , G06K9/6256 , G06K9/6267
Abstract: 本发明涉及一种基于神经网络的指令集无关的二进制代码相似性检测方法,其主要步骤包括:对二进制文件进行逆向分析,提取函数的调用关系特征、字符串特征、栈空间特征、代码规模特征、路径序列特征、路径基本特征,度序列特征、度基本特征,图规模特征等9个方面共24个特征。基于特征的表现形式,采用3种相似度计算方法计算待比较的两个函数的24个特征的相似程度,作为集成神经网络分类器的输入向量,获得两个函数整体相似度的预测值并进行排序。本发明与现有的技术比,不依赖特定的指令集,可以实现不同指令集的二进制文件的相似度检测,准确率高,技术简单,易于推广。
-
公开(公告)号:CN105488531A
公开(公告)日:2016-04-13
申请号:CN201510855073.3
申请日:2015-11-30
Applicant: 中国科学院信息工程研究所
IPC: G06K9/62
CPC classification number: G06K9/6256 , G06K9/6268
Abstract: 本发明涉及一种嵌入式设备固件解压成功的判断方法,其主要步骤包括:试验样本集固件收集、固件熵谱获取、固件熵谱指纹特征提取、分类器训练及固件是否解压成功的判断。该方法采用处理图像信号的方法对固件熵谱作相应处理,提取了固件熵谱的多域综合特征;利用正向熵阈值和负向熵阈值之间的回差有效避免了熵值在多次穿越单一阈值时所产生的干扰;在训练分类器时,首先对固件熵谱特征作Z-Score标准化处理,再采用机器学习的思想和K折交叉验证的方法对分类器进行多次交叉重复训练;对于待测试固件,通过加权统计的方法对各分类器判断结果进行累计加权统计,以次数居多者作为对固件是否解压成功的最终判定结果,保证了所得结果的准确性。
-
-
-
-
-
-
-
-
-