-
公开(公告)号:CN113918171A
公开(公告)日:2022-01-11
申请号:CN202111217152.3
申请日:2021-10-19
Applicant: 哈尔滨理工大学
Abstract: 本发明提出了一种可执行文件反汇编方法,可以对于任意字节序列进行反汇编。所述方法包括如下步骤:步骤1:建立字节序列从每一个字节为起始地址的反汇编结果集合;步骤2:将反汇编结果按照控制流构建扩展控制流图;步骤3:删除部分非法的控制流图;步骤4:使用图注意力神经网络对扩展控制流图节点进行分类。与传统方法不同,本方法构建字节序列包含所有可能反汇编结果的扩展控制流图,并使用深度学习方法判别正确的反汇编结果。可以有效的处理传统方法无法识别的无任何附加信息的任意一段二进制序列,并且完成字节序列反汇编,代码和数据的区分以及函数识别。
-
公开(公告)号:CN113554101A
公开(公告)日:2021-10-26
申请号:CN202110855101.7
申请日:2021-07-27
Applicant: 哈尔滨理工大学
IPC: G06K9/62 , G06F16/901 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于深度学习的二进制代码相似度检测方法,针对传统图匹配算法在二进制代码相似度检测方面存在不适应跨架构跨版本以及面对较大函数体时时间复杂度较高的问题,本发明提出了一种新的图嵌入表示模型用来表示二进制函数,从而通过计算二进制函数的嵌入值来计算二进制函数之间的相似度。本发明对相较于传统二进制代码相似度计算方法进行了以下三个方面的改进:(1)使用Structure2Vec来生成二进制函数的控制流图的图嵌入。(2)引入CNN来处理控制流图基本块间的顺序结构信息,从而更好的明确函数内部块间的先后关系。(3)融合前两部分特征,形成二进制函数最终的嵌入值表示,最后通过暹罗架构计算函数之间的相似度。实验结果表明本发明的方法可行且有效,既提高了相似度检测工作的效率,又能够很好的适应跨架构和跨版本相似度检测工作。
-