-
公开(公告)号:CN113536741B
公开(公告)日:2022-10-14
申请号:CN202010303263.5
申请日:2020-04-17
Applicant: 复旦大学
IPC: G06F40/157 , G06F16/242
Abstract: 本发明提供一种中文自然语言转数据库语言的方法及装置,用于根据数据库将用户输入的自然语言文本转换为可以对数据库进行查询的查询语句,其特征在于,包括如下步骤:预处理步骤,对自然语言文本进行规范化修正得到规范文本;列填充步骤,基于规范文本以及数据库中各个数据表的表头进行列填充处理从而生成连接符、SELECT列与对应的聚合函数以及WHERE列与对应的WHERE操作符;条件填充步骤,基于规范文本以及WHERE列对规范文本进行抽取并填充与WHERE列相对应的WHERE内容;组装输出步骤,将连接符、SELECT列与对应的聚合函数、WHERE列与对应的WHERE操作符和WHERE内容组装为查询语句并输出。
-
公开(公告)号:CN113535967B
公开(公告)日:2022-02-22
申请号:CN202010303271.X
申请日:2020-04-17
Applicant: 复旦大学
Abstract: 本发明提供一种中文通用概念图谱纠错装置,用于对中文通用的概念图谱中实体与概念之间的isA关系进行纠错,其特征在于,包括:概念图谱获取模块,用于获取概念图谱中所有的isA关系以及对应的实体和概念;不兼容概念对构建模块,依次判断每两个概念是否兼容并基于所有不兼容的两个概念构建多组不兼容概念对,每一组不兼容概念对包含一个作为可疑实体的实体、作为待判定概念的两个概念以及作为待纠错isA关系的两个相应的isA关系;错误isA关系判定模块,依次基于每组不兼容概念对中的可疑实体以及待判定概念判定相应的两个待纠错isA关系中错误的一个;以及概念图谱纠错模块,用于在概念图谱中删除被判定错误的待纠错isA关系从而完成对概念图谱的纠错。
-
公开(公告)号:CN113536741A
公开(公告)日:2021-10-22
申请号:CN202010303263.5
申请日:2020-04-17
Applicant: 复旦大学
IPC: G06F40/157 , G06F16/242
Abstract: 本发明提供一种中文自然语言转数据库语言的方法及装置,用于根据数据库将用户输入的自然语言文本转换为可以对数据库进行查询的查询语句,其特征在于,包括如下步骤:预处理步骤,对自然语言文本进行规范化修正得到规范文本;列填充步骤,基于规范文本以及数据库中各个数据表的表头进行列填充处理从而生成连接符、SELECT列与对应的聚合函数以及WHERE列与对应的WHERE操作符;条件填充步骤,基于规范文本以及WHERE列对规范文本进行抽取并填充与WHERE列相对应的WHERE内容;组装输出步骤,将连接符、SELECT列与对应的聚合函数、WHERE列与对应的WHERE操作符和WHERE内容组装为查询语句并输出。
-
公开(公告)号:CN113535967A
公开(公告)日:2021-10-22
申请号:CN202010303271.X
申请日:2020-04-17
Applicant: 复旦大学
Abstract: 本发明提供一种中文通用概念图谱纠错装置,用于对中文通用的概念图谱中实体与概念之间的isA关系进行纠错,其特征在于,包括:概念图谱获取模块,用于获取概念图谱中所有的isA关系以及对应的实体和概念;不兼容概念对构建模块,依次判断每两个概念是否兼容并基于所有不兼容的两个概念构建多组不兼容概念对,每一组不兼容概念对包含一个作为可疑实体的实体、作为待判定概念的两个概念以及作为待纠错isA关系的两个相应的isA关系;错误isA关系判定模块,依次基于每组不兼容概念对中的可疑实体以及待判定概念判定相应的两个待纠错isA关系中错误的一个;以及概念图谱纠错模块,用于在概念图谱中删除被判定错误的待纠错isA关系从而完成对概念图谱的纠错。
-
-
-