一种基于多粒度特征融合的代码摘要生成方法

    公开(公告)号:CN119739857B

    公开(公告)日:2025-05-09

    申请号:CN202510260828.9

    申请日:2025-03-06

    Abstract: 本发明提供了一种基于多粒度特征融合的代码摘要生成方法,包括:步骤1,对数据集中样本进行预处理操作,获取代码整体语义信息;步骤2,搭建源代码多粒度特征编码器,基于词元序列、抽象语法树和控制流图三种粒度特征的数据规模和数据结构差异,获得各个粒度特征的上下文向量;步骤3,对不同粒度特征编码器的输出实现粒度特征融合;步骤4,将融合后所得到的词元序列融合特征与控制流图融合特征输入到基于Transformer的解码器中,输出当前时间步预测单词,并最终组成摘要。本发明所公开的基于多粒度特征融合的代码摘要生成方法,能有效提取源代码关键特征并尽量减少计算开销,并且有效缓解特征序列的长距离依赖问题。

    一种基于多粒度特征融合的代码摘要生成方法

    公开(公告)号:CN119739857A

    公开(公告)日:2025-04-01

    申请号:CN202510260828.9

    申请日:2025-03-06

    Abstract: 本发明提供了一种基于多粒度特征融合的代码摘要生成方法,包括:步骤1,对数据集中样本进行预处理操作,获取代码整体语义信息;步骤2,搭建源代码多粒度特征编码器,基于词元序列、抽象语法树和控制流图三种粒度特征的数据规模和数据结构差异,获得各个粒度特征的上下文向量;步骤3,对不同粒度特征编码器的输出实现粒度特征融合;步骤4,将融合后所得到的词元序列融合特征与控制流图融合特征输入到基于Transformer的解码器中,输出当前时间步预测单词,并最终组成摘要。本发明所公开的基于多粒度特征融合的代码摘要生成方法,能有效提取源代码关键特征并尽量减少计算开销,并且有效缓解特征序列的长距离依赖问题。

Patent Agency Ranking