-
公开(公告)号:CN111309849B
公开(公告)日:2023-06-23
申请号:CN202010083902.1
申请日:2020-02-10
Applicant: 南京大学
IPC: G06F16/31 , G06F16/903 , G06F40/289 , G06F40/30 , G06F16/35 , G06N3/045 , G06N3/0442 , G06N3/0455 , G06N3/047 , G06N3/098 , G06F18/26
Abstract: 本发明公开了利用一种基于联合学习模型的细粒度数值信息抽取方法,包括如下步骤:对输入文本进行预处理;根据数值相关正则表达式识别候选的数值,以数值为触发词,与其前后词例拼接,作为联合学习模型的输入;联合学习模型的底层接入词嵌入层,并对词嵌入层的输出加入数值触发词的位置信息,得到每个词例最终的分布式表示;基于分布式表示接入后续的特征提取网络,并在高层分别接入具体任务的网络:接入分类网络得到数值信息的语义类型,接入序列标注网络得到数值触发词相关的数个语义角色;合并具体任务的输出得到数值信息单元;针对多个数值信息单元,基于统计方法判断它们之间的复合关系。本发明无需人工设计特征、准确性高、泛化能力强。
-
公开(公告)号:CN111401073A
公开(公告)日:2020-07-10
申请号:CN202010155372.7
申请日:2020-03-09
Applicant: 南京大学
Abstract: 本发明公开了一种基于语义解析的时间表达式标准化方法。该方法为:首先构建时间表达式中的语义项,包括语义计算函数和语义值;然后使用训练集标注的时间表达式标准化值和其基准时间值,穷举其所有可能的语义组合;接着将时间表达式语义项分配问题建模为整数规划问题,通过优化算法完成底层语义项的自动分配;最后使用启发式规则自动组合语义项,解析待标准化的时间表达式语义,得到其标准化值。本发明无需手工分配与组合底层语义项,减少了人力成本,提高了时间表达式标准化的灵活性和泛化能力。
-
公开(公告)号:CN116483959A
公开(公告)日:2023-07-25
申请号:CN202310327295.2
申请日:2023-03-30
Applicant: 南京大学
IPC: G06F16/332 , G06F16/36 , G06F40/295 , G06F40/30 , G06N3/04
Abstract: 基于证据图模式检索问题相关子图的方法、设备及介质,从图结构的知识库中检索出一个规模较小的能为自然语言问题的求解提供事实支撑的证据子图,首先通过关联资源对检索模型将自然语言问题转化为向量表示并从离线构建的关联资源对向量库中检索出与之相关性较高的候选;然后根据关联资源对候选枚举出所有可能的证据图模式;最后通过排序模型对所有证据图模式进行统一排序并使用排名靠前的多个证据图模式导出问题相关子图。本发明将对问题相关子图的检索转化为对少量证据图模式的检索,避免了直接在大规模图数据上做带剪枝的迭代式子图拓展导致的剪枝损耗,能有效提升在多跳问题上的子图检索性能。
-
公开(公告)号:CN115186671A
公开(公告)日:2022-10-14
申请号:CN202210530158.4
申请日:2022-05-16
Applicant: 南京大学
IPC: G06F40/30 , G06F40/211 , G06F40/253 , G06F40/268 , G06F40/289 , G06N5/02 , G06F40/242
Abstract: 一种基于外延的将名词短语映射到描述逻辑概念的方法,首先穷举名词短语的所有文本片段,生成文本片段到知识库中资源的映射表;然后根据名词短语的分词、词性标注与句法树,生成解析顺序;最后按解析顺序,从EL++的概念开始,用索引到的资源生成的基本概念不断细化,直到解析完全部的词,得到名词短语映射到的描述逻辑概念。本发明通过对句法树的分析,可以自动处理复杂的含有隐式关系的名词短语可以生成的高质量的描述逻辑概念。
-
公开(公告)号:CN113190655B
公开(公告)日:2023-08-11
申请号:CN202110506597.7
申请日:2021-05-10
Applicant: 南京大学
IPC: G06F16/33 , G06F16/35 , G06F40/284 , G06F40/30 , G06F18/241 , G06N3/0455 , G06N3/045 , G06N3/048 , G06N3/08
Abstract: 一种基于语义依赖的空间关系抽取方法及装置,构建语义依赖识别模型,从非结构化文本中抽取出空间关系元组,首先定义语义依赖类型,分别为包含触发词角色类型和不包含触发词角色类型;然后将待识别文本及预标注的空间元素输入基于深度自注意力网络的语义依赖识别模型,结合定义的语义依赖类型,得到空间元素间的所有语义依赖识别结果;最后将得到的语义依赖识别结果进行组合,输出完整的空间关系元组。本发明将空间关系抽取问题转化为语义依赖识别问题,可同时处理多种空间关系,包括包含触发词和不含触发词的空间关系;本发明可以有效表示文本中的空间语义信息,抽取出空间元素间的语义依赖,无须人工设计特征,泛化性能强,准确率高。
-
公开(公告)号:CN111401073B
公开(公告)日:2023-06-09
申请号:CN202010155372.7
申请日:2020-03-09
Applicant: 南京大学
IPC: G06F40/30 , G06F18/2411 , G06F18/214
Abstract: 本发明公开了一种基于语义解析的时间表达式标准化方法。该方法为:首先构建时间表达式中的语义项,包括语义计算函数和语义值;然后使用训练集标注的时间表达式标准化值和其基准时间值,穷举其所有可能的语义组合;接着将时间表达式语义项分配问题建模为整数规划问题,通过优化算法完成底层语义项的自动分配;最后使用启发式规则自动组合语义项,解析待标准化的时间表达式语义,得到其标准化值。本发明无需手工分配与组合底层语义项,减少了人力成本,提高了时间表达式标准化的灵活性和泛化能力。
-
公开(公告)号:CN111309849A
公开(公告)日:2020-06-19
申请号:CN202010083902.1
申请日:2020-02-10
Applicant: 南京大学
IPC: G06F16/31 , G06F16/903 , G06F40/289 , G06F40/30 , G06F16/35 , G06N3/04
Abstract: 本发明公开了利用一种基于联合学习模型的细粒度数值信息抽取方法,包括如下步骤:对输入文本进行预处理;根据数值相关正则表达式识别候选的数值,以数值为触发词,与其前后词例拼接,作为联合学习模型的输入;联合学习模型的底层接入词嵌入层,并对词嵌入层的输出加入数值触发词的位置信息,得到每个词例最终的分布式表示;基于分布式表示接入后续的特征提取网络,并在高层分别接入具体任务的网络:接入分类网络得到数值信息的语义类型,接入序列标注网络得到数值触发词相关的数个语义角色;合并具体任务的输出得到数值信息单元;针对多个数值信息单元,基于统计方法判断它们之间的复合关系。本发明无需人工设计特征、准确性高、泛化能力强。
-
公开(公告)号:CN117391064A
公开(公告)日:2024-01-12
申请号:CN202210783841.9
申请日:2022-07-05
Applicant: 南京大学
IPC: G06F40/211 , G06F40/268 , G06F40/295 , G06F40/30 , G06F16/332
Abstract: 一种问句时间约束理解方法、计算机设备及存储介质,所述方法包括问句解析步骤、时态元素标注步骤和时间约束生成步骤,问句解析步骤对问句进行解析,得到问句的分词结果、词性标注结果和命名实体列表;时态元素标注步骤标注问句中的时间、事件、时序关系信号和序数信号;时间约束生成步骤识别序数约束和时序约束;并提供了实现所述方法的计算机设备及计算机可读存储介质。本发明能够全面准确理解问句中的时序约束、序数约束、以及对时态元素的求解意图,相比现有的问句时间约束理解方法,本发明能更好的表示问句的查询意图,可应用于无标注训练数据的问句时间约束理解。
-
公开(公告)号:CN113190655A
公开(公告)日:2021-07-30
申请号:CN202110506597.7
申请日:2021-05-10
Applicant: 南京大学
Abstract: 一种基于语义依赖的空间关系抽取方法及装置,构建语义依赖识别模型,从非结构化文本中抽取出空间关系元组,首先定义语义依赖类型,分别为包含触发词角色类型和不包含触发词角色类型;然后将待识别文本及预标注的空间元素输入基于深度自注意力网络的语义依赖识别模型,结合定义的语义依赖类型,得到空间元素间的所有语义依赖识别结果;最后将得到的语义依赖识别结果进行组合,输出完整的空间关系元组。本发明将空间关系抽取问题转化为语义依赖识别问题,可同时处理多种空间关系,包括包含触发词和不含触发词的空间关系;本发明可以有效表示文本中的空间语义信息,抽取出空间元素间的语义依赖,无须人工设计特征,泛化性能强,准确率高。
-
-
-
-
-
-
-
-