-
公开(公告)号:CN115587318A
公开(公告)日:2023-01-10
申请号:CN202211302051.0
申请日:2022-10-24
申请人: 中国人民解放军战略支援部队信息工程大学
摘要: 本发明提供一种基于神经网络的源码分类方法。该方法包括:将待分类源码转换为AST;定义并初始化整个AST叶子节点对应的向量矩阵,记作从AST中随机抽取n条路径{p1,…,pn};针对抽取到的任一条路径pi,可将其转换为二元组 ;从value_vocab中分别查询到当前路径pi上起始节点和末端节点的向量,进而得到当前路径pi的向量ci,记作:ci作为全连接神经网络中的一个神经元的输入,得到对应的输出n条路径{p1,…,pn}对应的n个向量{c1,…,cn}输入到含有n个神经元的全连接神经网络后,得到n个输出将所有的输出聚合为代码嵌入v;定义一个类别标签矩阵,记作将代码嵌入v与tags_vocab中每一个训练函数标签的嵌入进行运算后得到代码嵌入v的预测分布。