一种基于大型语言模型的自然语言到SQL转换方法

    公开(公告)号:CN118643050A

    公开(公告)日:2024-09-13

    申请号:CN202410665916.2

    申请日:2024-05-27

    Applicant: 复旦大学

    Abstract: 本发明公开了一种基于大型语言模型的自然语言到SQL转换方法,涉及信息技术领域,步骤1:数据库模式剪枝;利用预先训练好的大语言模型分析输入的自然语言查询,自动剪枝数据库模式,排除与查询无关的表格和字段;步骤2:SQL骨架预测,基于剪裁后的数据库模式和输入的自然语言查询,基于大语言模型预测SQL骨架构建可预测的SQL骨架;步骤3:样例选择;根据预测出的SQL骨架从预先定义的SQL样例库中选出与之匹配的SQL样例;步骤4:数据库适配;将大语言模型生成的SQL根据特定数据库进行调整,修正具体的数据库的SQL查询,使得生成的SQL语句能够在特定的数据库环境中执行。

Patent Agency Ranking