-
公开(公告)号:CN113703773B
公开(公告)日:2022-07-19
申请号:CN202110988539.2
申请日:2021-08-26
Applicant: 北京计算机技术及应用研究所
IPC: G06F8/41 , G06F40/216 , G06F40/284
Abstract: 本发明涉及一种基于NLP的二进制代码相似性比对方法,属于代码比对领域。本发明利用代码中的跳转标识将汇编样本切分多个函数块,并利用NLP的方式将函数代码映射成函数特征向量,同时设计了以函数为基本分析单元的工程相似计算方法,从而完成代码溯源。该方法能满足二进制代码相似性对比中相似度检测的需求,且有着较高的准确率和召回率。
-
公开(公告)号:CN113703773A
公开(公告)日:2021-11-26
申请号:CN202110988539.2
申请日:2021-08-26
Applicant: 北京计算机技术及应用研究所
IPC: G06F8/41 , G06F40/216 , G06F40/284
Abstract: 本发明涉及一种基于NLP的二进制代码相似性比对方法,属于代码比对领域。本发明利用代码中的跳转标识将汇编样本切分多个函数块,并利用NLP的方式将函数代码映射成函数特征向量,同时设计了以函数为基本分析单元的工程相似计算方法,从而完成代码溯源。该方法能满足二进制代码相似性对比中相似度检测的需求,且有着较高的准确率和召回率。
-