-
公开(公告)号:CN119739857B
公开(公告)日:2025-05-09
申请号:CN202510260828.9
申请日:2025-03-06
Applicant: 南京信息工程大学
IPC: G06F16/34 , G06F16/31 , G06F40/289 , G06F40/30 , G06N3/045 , G06F18/25 , G06N3/0464
Abstract: 本发明提供了一种基于多粒度特征融合的代码摘要生成方法,包括:步骤1,对数据集中样本进行预处理操作,获取代码整体语义信息;步骤2,搭建源代码多粒度特征编码器,基于词元序列、抽象语法树和控制流图三种粒度特征的数据规模和数据结构差异,获得各个粒度特征的上下文向量;步骤3,对不同粒度特征编码器的输出实现粒度特征融合;步骤4,将融合后所得到的词元序列融合特征与控制流图融合特征输入到基于Transformer的解码器中,输出当前时间步预测单词,并最终组成摘要。本发明所公开的基于多粒度特征融合的代码摘要生成方法,能有效提取源代码关键特征并尽量减少计算开销,并且有效缓解特征序列的长距离依赖问题。
-
公开(公告)号:CN119166214B
公开(公告)日:2025-03-25
申请号:CN202411672757.5
申请日:2024-11-21
Applicant: 南京信息工程大学
IPC: G06F8/73 , G06F8/71 , G06F8/30 , G06F18/214 , G06F8/41 , G06F18/25 , G06N3/042 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于跨模态信息融合的代码摘要生成方法及系统,方法包括:由公共数据集中获取训练源代码,通过解析单元对训练源代码进行解析获得标记序列特征、AST节点特征和CFG节点特征;将标记序列特征、AST节点特征和CFG节点特征输入编码单元和解码单元获得训练代码摘要;将训练源代码中实际摘要作为真实标签,根据训练代码摘要和真实标签计算训练损失,根据训练损失对代码摘要生成器的参数进行优化,重复迭代直至达到训练终止条件输出训练后的代码摘要生成器;本发明获取源代码特征序列的长距离依赖关系,提取特征间的深层次关联,从而生成更加准确、自然的代码摘要。
-
公开(公告)号:CN119739857A
公开(公告)日:2025-04-01
申请号:CN202510260828.9
申请日:2025-03-06
Applicant: 南京信息工程大学
IPC: G06F16/34 , G06F16/31 , G06F40/289 , G06F40/30 , G06N3/045 , G06F18/25 , G06N3/0464
Abstract: 本发明提供了一种基于多粒度特征融合的代码摘要生成方法,包括:步骤1,对数据集中样本进行预处理操作,获取代码整体语义信息;步骤2,搭建源代码多粒度特征编码器,基于词元序列、抽象语法树和控制流图三种粒度特征的数据规模和数据结构差异,获得各个粒度特征的上下文向量;步骤3,对不同粒度特征编码器的输出实现粒度特征融合;步骤4,将融合后所得到的词元序列融合特征与控制流图融合特征输入到基于Transformer的解码器中,输出当前时间步预测单词,并最终组成摘要。本发明所公开的基于多粒度特征融合的代码摘要生成方法,能有效提取源代码关键特征并尽量减少计算开销,并且有效缓解特征序列的长距离依赖问题。
-
公开(公告)号:CN119166214A
公开(公告)日:2024-12-20
申请号:CN202411672757.5
申请日:2024-11-21
Applicant: 南京信息工程大学
IPC: G06F8/73 , G06F8/71 , G06F8/30 , G06F18/214 , G06F8/41 , G06F18/25 , G06N3/042 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于跨模态信息融合的代码摘要生成方法及系统,方法包括:由公共数据集中获取训练源代码,通过解析单元对训练源代码进行解析获得标记序列特征、AST节点特征和CFG节点特征;将标记序列特征、AST节点特征和CFG节点特征输入编码单元和解码单元获得训练代码摘要;将训练源代码中实际摘要作为真实标签,根据训练代码摘要和真实标签计算训练损失,根据训练损失对代码摘要生成器的参数进行优化,重复迭代直至达到训练终止条件输出训练后的代码摘要生成器;本发明获取源代码特征序列的长距离依赖关系,提取特征间的深层次关联,从而生成更加准确、自然的代码摘要。
-
-
-