-
公开(公告)号:CN117349453B
公开(公告)日:2024-02-23
申请号:CN202311645652.6
申请日:2023-12-04
Applicant: 武汉大学
IPC: G06F16/38 , G06F40/289 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06F16/33
Abstract: 索。本发明能实现对深度学习代码搜索的加速工本发明提供一种基于扩展代码的深度学习 作。代码搜索模型的加速方法,属于代码搜索技术领域,包括:获取数据集中带有描述的代码,执行预处理;将代码与其对应的描述作为模型的输入和标签,对大规模预训练模型进行微调;使用微调后的模型对待搜索的代码库中的每条代码生成扩展描述,将生成的扩展描述添加到对应代码之后得到扩展后的序列,重复该步骤将代码库扩展为代码+扩展描述库;使用Lucene对代码+扩展描述库进行索引;在线搜索阶段,输入查询语句,使
-
公开(公告)号:CN117349453A
公开(公告)日:2024-01-05
申请号:CN202311645652.6
申请日:2023-12-04
Applicant: 武汉大学
IPC: G06F16/38 , G06F40/289 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06F16/33
Abstract: 本发明提供一种基于扩展代码的深度学习代码搜索模型的加速方法,属于代码搜索技术领域,包括:获取数据集中带有描述的代码,执行预处理;将代码与其对应的描述作为模型的输入和标签,对大规模预训练模型进行微调;使用微调后的模型对待搜索的代码库中的每条代码生成扩展描述,将生成的扩展描述添加到对应代码之后得到扩展后的序列,重复该步骤将代码库扩展为代码+扩展描述库;使用Lucene对代码+扩展描述库进行索引;在线搜索阶段,输入查询语句,使用Lucene在代码+扩展库中检索出特定数量的代码+扩展描述作为候选条目;使用待加速的深度学习代码搜索模型,在候选条目中进行代码搜索。本发明能实现对深度学习代码搜索的加速工作。
-