-
公开(公告)号:CN119782456A
公开(公告)日:2025-04-08
申请号:CN202411635374.0
申请日:2024-11-15
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/3329 , G06F16/3332 , G06N3/042
Abstract: 本发明公开一种基于图神经网络和大语言模型的数据问答方法及系统,属于数据库与自然语言处理技术领域。所述方法包括:构建用户问题和数据库模式的对齐关系图,并基于图神经网络,在数据库中获取与用户问题相关的数据集表项;利用大语言模型生成所述数据集表项的SQL查询语句;连接数据库并执行所述SQL查询语句;基于用户问题和所述SQL查询语句的查询结果,生成所述用户问题的答案。本发明可以增强数据问答能力。
-
公开(公告)号:CN120030144A
公开(公告)日:2025-05-23
申请号:CN202411989396.7
申请日:2024-12-31
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/334 , G06F16/35 , G06N3/0455 , G06N3/045 , G06N3/0442 , G06N3/084 , G06Q40/12
Abstract: 本发明提供了一种基于多层语义编码和三元组学习的报销信息敏感内容精准检测方法和系统,属于自然语言处理领域。通过对真实报销数据中的误筛选案例进行系统性分析,本发明设计了一套多层语义编码框架,并结合三元组学习方法,显著提升了敏感内容识别的准确性。相较于现有技术,本发明的主要创新点包括:通过真实数据分析归纳出三类典型的伪敏感内容场景;创新性地将包含敏感词的报销文本构建三元组结构,通过多层语义编码与深度学习方法,实现对包含敏感词文本是否包含敏感内容的精准判别,有效区分真实敏感内容和伪敏感内容。本方法显著提升了报销信息敏感内容检测的准确率,具有重要的实践价值。
-