-
公开(公告)号:CN115809314A
公开(公告)日:2023-03-17
申请号:CN202211448380.6
申请日:2022-11-18
Applicant: 东南大学
IPC: G06F16/33 , G06F16/332 , G06F40/30 , G06F16/35 , G06N3/08 , G06N3/0442 , G06N3/04
Abstract: 本发明公开了基于双层多门控专家混合模型(MMOE)的多任务NL2SQL方法,包括以下步骤:步骤1编码层构建步骤,用于获取问题和表模式的嵌入表示;步骤2多门控循环神经网络混合层构建步骤,用于利用多门控专家混合模型,进一步提取不同类型的语义信息,步骤3多门控注意力池化混合层构建步骤,用于利用多门控专家混合模型,获取不同子任务下的问题的向量表示;步骤4子任务学习层构建步骤,用于对各项子任务进行预测;步骤5多任务NL2SQL模型训练步骤,用于构建损失函数,构建优化函数。本发明在查询匹配正确率上的提升尤为显著,说明本发明的模型对于NL2SQL的数据集有着显著的效果提升。
-
公开(公告)号:CN115796029A
公开(公告)日:2023-03-14
申请号:CN202211502427.2
申请日:2022-11-28
Applicant: 东南大学
IPC: G06F30/27 , G06F16/242 , G06F18/24 , G06N3/0442 , G06N3/08 , G06F111/08 , G06F111/04
Abstract: 本发明公开了基于显式及隐式特征解耦的NL2SQL方法,包括以下步骤:(1)构建特定子模块专家系统的步骤;(2)结合多次随机失活和专家系统步骤;(3)构建多次随机失活和专家系统专用损失函数的步骤;(4)训练不同子系统进行显式解耦步骤,包括将不同子系统之间进行分别训练;(5)构建子系统输出显式特征耦合专家系统编码模型,包括构建子系统输出显式特征耦合专家系统编码模型,用于整合不同子系统输出;(6)训练最终耦合的NL2SQL方法模型步骤,用于得到最终耦合完成的模型。本发明的实验结果,显示本发明的方法较之以往的模型在逻辑准确率方面有了很大的提升,本发明的模型对于NL2SQL任务有着显著的效果提升。
-