-
公开(公告)号:CN118467562A
公开(公告)日:2024-08-09
申请号:CN202310090344.5
申请日:2023-02-09
Applicant: 复旦大学
IPC: G06F16/242 , G06F16/2452 , G06N3/047 , G06N3/048 , G06N3/08 , G06N3/0442
Abstract: 本发明提供一种基于自裁剪异构图的自然语言转结构化查询方法,首先基于专家知识的异构图构建规则使用数据库模式和问句来构建异构图,并融入了专家知识形成的规则来约束异构图中边的构建,相比全量异构图拥有更少但是更加重要的信息,更好地建模了问句与数据库模式之间的联系,能够促进模型学习到正确的SQL语言特征,提升模型的准确率和执行率。然后针对数据库模式中元素的重要程度问题,提出一种自裁剪机制,根据二分类模型判断异构图中节点与问句的是否存在关联,并裁剪掉图中与问句无关的节点和边,帮助模型剔除与问句相对无关的信息,从而实现了精细化的数据过滤,减少了结构化模式信息中无用信息的噪声,提升了模型的检索响应速度与准确率。