-
公开(公告)号:CN120010909A
公开(公告)日:2025-05-16
申请号:CN202510486738.1
申请日:2025-04-18
Applicant: 厦门理工学院
IPC: G06F8/75 , G06F8/53 , G06F9/455 , G06F18/22 , G06F18/213 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/048
Abstract: 本发明提供的基于GNN的跨架构二进制程序相似性检测方法、装置及设备,涉及信息安全处理技术领域。本发明通过获取待检测的两份二进制程序,并反汇编为低级虚拟机中间表示LLVM IR;基于LLVM IR构建程序图;然后将所述程序图输入FastText模型提取出LLVM IR指令,并基于LLVM IR指令创建的语料库作为FastText模型的词汇表进行多轮训练,以将指令标记表示为连续向量空间中的词向量,生成指令向量;根据所述程序图和所述指令向量,利用全局注意力增强的图神经网络GNN进行处理,以生成固定维度的图嵌入向量;计算两份二进制程序对应的图嵌入向量之间的相似性以评估相似度。本发明能实现跨架构二进制程序的统一程序表示,捕获高层语义特征,有效提高大规模程序库分析的处理效率。