发明公开
- 专利标题: 一种基于LLM模型的NL2SQL方法及存储介质
-
申请号: CN202311788083.0申请日: 2023-12-22
-
公开(公告)号: CN117609279A公开(公告)日: 2024-02-27
- 发明人: 董霖 , 潘彦霖 , 陈志勇 , 尹雅露
- 申请人: 杭州西湖数据智能研究院
- 申请人地址: 浙江省杭州市西湖区西斗门路9号福地创业园4号楼4303室
- 专利权人: 杭州西湖数据智能研究院
- 当前专利权人: 杭州西湖数据智能研究院
- 当前专利权人地址: 浙江省杭州市西湖区西斗门路9号福地创业园4号楼4303室
- 代理机构: 北京锺维联合知识产权代理有限公司
- 代理商 谢沙沙
- 主分类号: G06F16/242
- IPC分类号: G06F16/242 ; G06F16/22 ; G06F16/28
摘要:
本发明提供了一种基于LLM模型的NL2SQL方法及存储介质,涉及自然语言处理领域,所述方法包括:获取训练用自然语句列表和训练用SQL语句列表,获取预测SQL语句列表并对预测SQL语句进行拆分,获取预测SQL语句对应的键值对,获取预测SQL语句对应的难度等级,获取任意难度等级的预测SQL语句列表且计算该难度等级的预测SQL语句列表对应的损失,若对任意难度等级的预测SQL语句列表的损失均小于对应的损失阈值,将初始LLM模型作为目标LLM模型,使用目标LLM模型获取目标语句对应的SQL语句;本发明通过对预测SQL语句划分为不同的难度等级,达到对LLM模型转化SQL语句的特定难度等级的训练。