-
公开(公告)号:CN111401073A
公开(公告)日:2020-07-10
申请号:CN202010155372.7
申请日:2020-03-09
Applicant: 南京大学
Abstract: 本发明公开了一种基于语义解析的时间表达式标准化方法。该方法为:首先构建时间表达式中的语义项,包括语义计算函数和语义值;然后使用训练集标注的时间表达式标准化值和其基准时间值,穷举其所有可能的语义组合;接着将时间表达式语义项分配问题建模为整数规划问题,通过优化算法完成底层语义项的自动分配;最后使用启发式规则自动组合语义项,解析待标准化的时间表达式语义,得到其标准化值。本发明无需手工分配与组合底层语义项,减少了人力成本,提高了时间表达式标准化的灵活性和泛化能力。
-
公开(公告)号:CN105701253A
公开(公告)日:2016-06-22
申请号:CN201610125710.6
申请日:2016-03-04
Applicant: 南京大学
IPC: G06F17/30
CPC classification number: G06F17/30666 , G06F17/30684 , G06F17/30731
Abstract: 本发明公开了一种中文自然语言问句语义化的知识库自动问答方法,包括以下步骤:对用户输入的事实型问题进行中文自然语言处理,实现分词、词性标注、命名实体识别和扩展,生成语义依存树;使用泛化模板和语义解析技术获得问句中的时间、空间、事实主体、事实客体等组成成分,然后进行语义化处理,提取问句中所有事件相关的组成元素属性及其取值,生成多个“属性—取值”对,其中待回答的元素以疑问词代替,形成复杂事实三元组集合;待回答部分所在三元组联合其他相关事实三元组形成一个带条件约束的知识库查询,到知识库中进行基于相似度计算的查询匹配,从知识库中抽取结果,得到最终答案。本发明实现了对知识库的快速准确的查询应答。
-
公开(公告)号:CN116483959A
公开(公告)日:2023-07-25
申请号:CN202310327295.2
申请日:2023-03-30
Applicant: 南京大学
IPC: G06F16/332 , G06F16/36 , G06F40/295 , G06F40/30 , G06N3/04
Abstract: 基于证据图模式检索问题相关子图的方法、设备及介质,从图结构的知识库中检索出一个规模较小的能为自然语言问题的求解提供事实支撑的证据子图,首先通过关联资源对检索模型将自然语言问题转化为向量表示并从离线构建的关联资源对向量库中检索出与之相关性较高的候选;然后根据关联资源对候选枚举出所有可能的证据图模式;最后通过排序模型对所有证据图模式进行统一排序并使用排名靠前的多个证据图模式导出问题相关子图。本发明将对问题相关子图的检索转化为对少量证据图模式的检索,避免了直接在大规模图数据上做带剪枝的迭代式子图拓展导致的剪枝损耗,能有效提升在多跳问题上的子图检索性能。
-
公开(公告)号:CN110569368B
公开(公告)日:2022-11-29
申请号:CN201910861941.7
申请日:2019-09-12
Applicant: 南京大学
IPC: G06F16/36 , G06F40/205
Abstract: 本发明公开了一种面向知识库问答的查询松弛方法,其特征在于,包括以下步骤:将无结果SPARQL语句进行分割,对查询条件进行分析,抽取待学习推理规则的谓词,组成谓词集合;针对上述步骤得到的谓词集合,获得其中每一个谓词的推理规则集合和置信度计算模型;基于上述步骤中所获得的推理规则集合,对相应的谓词进行补充,重组查询条件,查询候选结果;基于上述步骤所获得的置信度计算模型对所述候选结果打分、排序,保留部分高置信度结果作为最终结果,并输出令每条结果成立的推理规则。本发明实现了对无查询结果SPARQL语句的高效、准确的结果预测。
-
公开(公告)号:CN115186671A
公开(公告)日:2022-10-14
申请号:CN202210530158.4
申请日:2022-05-16
Applicant: 南京大学
IPC: G06F40/30 , G06F40/211 , G06F40/253 , G06F40/268 , G06F40/289 , G06N5/02 , G06F40/242
Abstract: 一种基于外延的将名词短语映射到描述逻辑概念的方法,首先穷举名词短语的所有文本片段,生成文本片段到知识库中资源的映射表;然后根据名词短语的分词、词性标注与句法树,生成解析顺序;最后按解析顺序,从EL++的概念开始,用索引到的资源生成的基本概念不断细化,直到解析完全部的词,得到名词短语映射到的描述逻辑概念。本发明通过对句法树的分析,可以自动处理复杂的含有隐式关系的名词短语可以生成的高质量的描述逻辑概念。
-
公开(公告)号:CN105701253B
公开(公告)日:2019-03-26
申请号:CN201610125710.6
申请日:2016-03-04
Applicant: 南京大学
Abstract: 本发明公开了一种中文自然语言问句语义化的知识库自动问答方法,包括以下步骤:对用户输入的事实型问题进行中文自然语言处理,实现分词、词性标注、命名实体识别和扩展,生成语义依存树;使用泛化模板和语义解析技术获得问句中的时间、空间、事实主体、事实客体等组成成分,然后进行语义化处理,提取问句中所有事件相关的组成元素属性及其取值,生成多个“属性—取值”对,其中待回答的元素以疑问词代替,形成复杂事实三元组集合;待回答部分所在三元组联合其他相关事实三元组形成一个带条件约束的知识库查询,到知识库中进行基于相似度计算的查询匹配,从知识库中抽取结果,得到最终答案。本发明实现了对知识库的快速准确的查询应答。
-
公开(公告)号:CN103077237B
公开(公告)日:2015-10-28
申请号:CN201310007682.4
申请日:2013-01-09
Applicant: 南京大学
IPC: G06F17/30
Abstract: 本发明提供一种基于全局关键属性的语义网对象共指自动消解方法,包括下列步骤:1)语义网对象样本分类,将具有相同类型和付费域名的对象样本归类在一起;2)全局关键属性识别,针对具有相同类型和付费域名的一组语义网对象样本,识别出其中共指的对象样本集合和不共指的对象样本集合,计算上述两个集合中对象样本所含数据样本中属性间的相似度,统计识别全局关键属性;3)语义网对象共指消解,给定任意一个语义网对象,基于它的类型和付费域名,重用已识别出的全局关键属性,寻找具有相似关键属性值的其它对象,实现对象共指消解。本发明能够准确高效的自动识别出语义网对象的全局关键属性,并以此为基础,实现语义网对象共指的自动消解,此外已识别的全局关键属性在今后的消解过程中可以重用。
-
公开(公告)号:CN112445887B
公开(公告)日:2024-05-03
申请号:CN201910808954.8
申请日:2019-08-29
Applicant: 南京大学
IPC: G06F16/31 , G06F16/332 , G06F16/335 , G06N3/044 , G06N3/088 , G06N3/084 , G06N3/0985
Abstract: 基于检索的机器阅读理解系统的实现方法及装置,包括文本初步检索模块、检索结果重排序模块和机器阅读理解模块,文本初步检索模块被配置为事先构造领域文档集合,提取文档集合特征,将用户提出的问题和领域文档集合中的文档计算相似度,返回相似度最高的前x个文档给检索结果重排序模块,检索结果重排序模块根据所得x个文档与问题重新计算相关性,并将相关性最高的文档传导至机器阅读理解模块,机器阅读理解模块根据问题从最相关的文档中抽取出问题对应的答案。本发明针对用户的问题找到最相关的文档,将得到的文档和用户的问题交给机器阅读理解模型,最终得到问题对应的答案,构成了一个基于检索的机器阅读理解系统,提高问题类搜索的效率。
-
公开(公告)号:CN117391064A
公开(公告)日:2024-01-12
申请号:CN202210783841.9
申请日:2022-07-05
Applicant: 南京大学
IPC: G06F40/211 , G06F40/268 , G06F40/295 , G06F40/30 , G06F16/332
Abstract: 一种问句时间约束理解方法、计算机设备及存储介质,所述方法包括问句解析步骤、时态元素标注步骤和时间约束生成步骤,问句解析步骤对问句进行解析,得到问句的分词结果、词性标注结果和命名实体列表;时态元素标注步骤标注问句中的时间、事件、时序关系信号和序数信号;时间约束生成步骤识别序数约束和时序约束;并提供了实现所述方法的计算机设备及计算机可读存储介质。本发明能够全面准确理解问句中的时序约束、序数约束、以及对时态元素的求解意图,相比现有的问句时间约束理解方法,本发明能更好的表示问句的查询意图,可应用于无标注训练数据的问句时间约束理解。
-
公开(公告)号:CN114090782A
公开(公告)日:2022-02-25
申请号:CN202010857287.5
申请日:2020-08-24
Applicant: 南京大学
IPC: G06F16/36 , G06F16/332 , G06F16/33
Abstract: 一种结构优先的知识库问答实现方法及其系统,包括问句结构分析和SPARQL查询结构图生成两部分,问句结构分析的技术方法对自然语言问句进行句法解析,设计并构建了实体描述图和放松查询图两种图模型;SPARQL查询结构图的生成技术从放松查询图出发,使用构建模板的方式,构建放松查询图和SPARQL查询图的查询结构映射库,然后对于待求问句,从映射库中提取模板并拼接得到待求问句对应SPARQL查询结构图的候选。本发明能生成高准确性的SPARQL查询结构图,通过使用实体链接和关系链接可以构建完整的基于知识库的问答系统。
-
-
-
-
-
-
-
-
-