一种智能合约字节码相似性检测方法

    公开(公告)号:CN116627490A

    公开(公告)日:2023-08-22

    申请号:CN202310593717.0

    申请日:2023-05-24

    Applicant: 东南大学

    Abstract: 本发明公开一种智能合约字节码相似性检测方法,包括:字节码数据预处理;通过数据增强实现训练数据集构造;自监督学习网络构建;自监督学习的训练;使用训练得到的模型生成表征向量,完成相似度计算。本发明基于自监督学习方法,能够对输入的字节码在函数级别进行表征学习,利用学习到的表征向量实现智能合约字节码的相似性计算。本发明结合Transformer和CNN模型,共同完成字节码特征提取,实现捕获更多语义,在缺乏带有相似性标签的数据集的前提下,自监督学习方法在现有数据集上以完成辅助任务的方式实现表征学习,免去了人工构造带有相似性标签的训练数据集的复杂过程。

Patent Agency Ranking