- 专利标题: 样本构建方法、代码处理方法及电子设备
-
申请号: CN202411469887.9申请日: 2024-10-21
-
公开(公告)号: CN118981334A公开(公告)日: 2024-11-19
- 发明人: 张文轩 , 陈瑶 , 林聚财 , 施成谕 , 殷俊
- 申请人: 浙江大华技术股份有限公司
- 申请人地址: 浙江省杭州市滨江区滨安路1187号
- 专利权人: 浙江大华技术股份有限公司
- 当前专利权人: 浙江大华技术股份有限公司
- 当前专利权人地址: 浙江省杭州市滨江区滨安路1187号
- 代理机构: 深圳市威世博知识产权代理事务所(普通合伙) 44280专利代理师严翠霞
- 主分类号: G06F8/75
- IPC分类号: G06F8/75 ; G06F8/30 ; G06F8/73 ; G06F8/72 ; G06F8/41
摘要:
本申请公开了一种样本构建方法、代码处理方法及电子设备,该样本构建方法包括:按照源代码文件对应的语法结构将源代码文件含有的语法元素构建为抽象语法树;基于所有抽象语法树含有的各个语法元素之间的关联关系,确定当前主函数依赖的所有语法元素;从每个源代码文件中提取出依赖的所有语法元素对应的代码内容,对当前主函数依赖的所有语法元素对应的代码内容进行重组,得到重组代码;获取重组代码对应的代码注释,将重组代码和重组代码对应的代码注释作为模型训练样本。通过对各个源代码文件进行重构,将功能函数及其相关依赖和实现呈现至同一个文件中,便于后续模型学习和理解代码的结构,提高后续训练得到的代码处理模型的代码处理能力。