-
公开(公告)号:CN111930906A
公开(公告)日:2020-11-13
申请号:CN202010745796.9
申请日:2020-07-29
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/332 , G06F16/36 , G06F40/242 , G06F40/30
Abstract: 本发明涉及一种基于语义块的知识图谱问答方法及装置,包括获取问句,并通过预设的知识图谱生成上下文字典;将上下文字典输入到预训练的图神经网络模型中,生成语义块序列,根据语义块序列构建语义查询图;根据知识图谱对语义查询图进行解析,输出结果。本发明通过构造问句的上下文词典附加到图神经网络中,有效解决了隐式实体和关系挑战,改进了语义解析的效果。通过构建的语义查询图生成问题的逻辑形式,能够快速的在知识库中检索出答案。结合基于规则的准确度和基于深度学习的覆盖度,通过构建语义块的形式改进问句中的约束条件和多意图组合,使得问题语义块的解析不依赖于问答输出的逻辑形式,具有较强的适应性。
-
公开(公告)号:CN111783418A
公开(公告)日:2020-10-16
申请号:CN202010517766.2
申请日:2020-06-09
Applicant: 北京北大软件工程股份有限公司
IPC: G06F40/205 , G06F40/247 , G06F40/30
Abstract: 本发明涉及一种中文词义表示学习方法及装置,包括获取训练语料,生成全局上下文矩阵;对HowNet知识库进行解析,生成词义-词相似度矩阵;根据所述全局上下文矩阵和词义-词相似度矩阵,计算生成全局词义上下文向量;对所述全局词义上下文向量进行词义软消歧;采用基于注意力拓展的跳字模型对词义软消歧后的词义向量进行训练,输出词义向量。本发明通过提出的上下文软消歧机制,能够捕捉词的真正词义,提高深度学习模型在下游任务的效果。
-
公开(公告)号:CN111553160A
公开(公告)日:2020-08-18
申请号:CN202010332120.7
申请日:2020-04-24
Applicant: 北京北大软件工程股份有限公司
IPC: G06F40/295 , G06F40/35 , G06F16/332 , G06F16/33 , G06F16/35 , G06Q50/18
Abstract: 本发明公开了一种获取法律领域问句答案的方法和系统,属于语义理解领域,在获取用户的自然语言问句后生成词语的实体,识别实体并将实体分为命名实体和一般实体,根据命名实体和一般实体的关系生成语法依存树,根据语法依存树生成实体间的谓词路径,在根据谓词路径生成查询语句,执行查询语句从数据库中获取用户问句的答案。通过上述方案能够理解用户的语义,帮助用户快速准确的获取问句的答案,同时获取的答案更全面。
-
公开(公告)号:CN111858732B
公开(公告)日:2024-04-05
申请号:CN202010672743.9
申请日:2020-07-14
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/25 , G06F16/28 , G06F16/215 , G06F40/295 , G06N20/00 , G06F16/2458 , G06F16/248
Abstract: 本申请涉及数据融合方法及终端,属于数据融合技术领域。本申请包括:接收输入的数据,基于数据的元数据进行数据理解处理,包括:根据数据的数据值进行属性分类,以及为各属性建立对应的有效性判断和数据转换解析器;确定数据的数据值分布情况,并利用有效性判断和数据转换解析器进行有效性判断;对判断为有效的数据,利用对应的有效性判断和数据转换解析器,进行数据转换,输出融合数据进行存储。通过本申请,有助于实现形成元数据规范,数据标准统一,数据格式整齐的数据融合。
-
公开(公告)号:CN111666419A
公开(公告)日:2020-09-15
申请号:CN202010462778.X
申请日:2020-05-27
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/36 , G06F16/35 , G06F40/242 , G06F40/295
Abstract: 本申请涉及法律数据的知识图谱构建方法及装置,属于知识图谱技术领域。本申请包括:步骤S101、对法律数据进行知识抽取,以提取用于知识图谱构建的实体、属性以及关系,其中,法律数据包括:案件和法律法规数据;步骤S102、对提取的实体以及关系采取不同的知识表示方式进行建模;步骤S103、利用gStore作为存储系统,生成能够进行多跳关系查询的法律垂直领域知识图谱。通过本申请,有助于使知识表示更加全面,提高查询准确率以及提高应用效率。
-
公开(公告)号:CN109614460A
公开(公告)日:2019-04-12
申请号:CN201811542431.5
申请日:2018-12-17
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/30 , G06F16/2458 , G06Q50/18
Abstract: 本申请涉及法条数据处理方法、装置、存储介质及电子设备,属于数据处理技术领域。本申请包括:获取数据库中的法条数据;通过预设的规则确定法条的句式复杂程度,所述句式复杂程度包括:句式简单或者句式复杂;根据确定出的所述句式复杂程度对法条进行拆分处理。通过本申请可以实现根据法条的句式复杂程度对法条进行相应的拆分处理,有助于满足对法条的拆分处理精准度需求。
-
-
-
-
-