-
公开(公告)号:CN108763333A
公开(公告)日:2018-11-06
申请号:CN201810445536.2
申请日:2018-05-11
Applicant: 北京航空航天大学 , 国家计算机网络与信息安全管理中心
CPC classification number: G06F17/2795
Abstract: 本发明则提出一种基于社会媒体的事件图谱构建方法,首先进行多源数据预处理,接着对预处理后的数据进行多源事件信息抽取,然后通过事件关系评价对事件间关系进行判定,最后进行实体信息融合,对异构图中的实体进行属性补全。本发明将事件看做抽象实体,基于社会媒体文本数据对抽取事件基本构成要素,事件进行关联,并融合已有结构化知识库构建事件图谱,这样能够提供更全面更直接的面向事件的信息检索服务,还能通过将传统非结构化文本内容的研究转化为基于图的研究,有利于发掘更深层次的信息。
-
公开(公告)号:CN108647318A
公开(公告)日:2018-10-12
申请号:CN201810443980.0
申请日:2018-05-10
Applicant: 北京航空航天大学 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提出一种基于多源数据的知识融合方法,在融合多个来源的实体数据时,首先分别对每个数据源的属性进行规范化表示,其中包括了同义属性映射和对属性值的数值单位的统一转换,这样对属性的规范化处理可以减少对后续实体比较造成的影响;然后基于实体名和实体属性对实体进行分块聚合,这样仅将同一分块内不同来源的实体作为候选匹配实体对,避免了将两个数据源中所有的实体两两间比较,减少计算复杂度;最后将同一分块内不同来源的实体作为候选实体对,采用实体对齐算法计算实体间的相似度,将匹配得到不同来源中描述同一客观世界的实体对,建立不同数据源之间同一实体的等价链接,并进行实体属性的合并,而对于一个数据源中独有的实体,可以直接添加到知识库中。
-
公开(公告)号:CN108763333B
公开(公告)日:2022-05-17
申请号:CN201810445536.2
申请日:2018-05-11
Applicant: 北京航空航天大学 , 国家计算机网络与信息安全管理中心
IPC: G06F16/36 , G06F40/295
Abstract: 本发明则提出一种基于社会媒体的事件图谱构建方法,首先进行多源数据预处理,接着对预处理后的数据进行多源事件信息抽取,然后通过事件关系评价对事件间关系进行判定,最后进行实体信息融合,对异构图中的实体进行属性补全。本发明将事件看做抽象实体,基于社会媒体文本数据对抽取事件基本构成要素,事件进行关联,并融合已有结构化知识库构建事件图谱,这样能够提供更全面更直接的面向事件的信息检索服务,还能通过将传统非结构化文本内容的研究转化为基于图的研究,有利于发掘更深层次的信息。
-
公开(公告)号:CN108595708A
公开(公告)日:2018-09-28
申请号:CN201810443976.4
申请日:2018-05-10
Applicant: 北京航空航天大学 , 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明提出一种基于知识图谱的异常信息文本分类方法,首先构建领域知识图谱,构建出基于所述领域知识图谱的实体识别和实体链接,然后构建文本特征表示向量vtext和实体特征表示向量vent,最后将文本特征表示向量与实体特征表示向量拼接得到融入了知识特征的新的文本表示向量vmerge,对所述新的文本表示向量进行分类训练,得到最终的分类结果。
-
公开(公告)号:CN111858886B
公开(公告)日:2022-05-31
申请号:CN202010666697.1
申请日:2020-07-13
Applicant: 北京航空航天大学
IPC: G06F16/332 , G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本发明涉及自然语言处理领域的一种机场评论的对象与观点抽取系统,通过设置系统逻辑架构上包括数据输入模块、数据预处理和数据划分模块、数据增强模块、评论对象抽取模块、评论内容提取模块、对象与内容匹配模块、评论结果输出模块,利用改进的基于BiLSTM‑CRF模型实现对基于中文的评论对象及评论内容的抽取,从而实现减小对情感分类进行数据标注时的人工成本、扩展标签体系进而关注新的评论对象、标准化展示对特定评论对象的情感倾向,并最终输出标准化的评论匹配结果。
-
公开(公告)号:CN111309867B
公开(公告)日:2022-05-31
申请号:CN202010099740.0
申请日:2020-02-18
Applicant: 北京航空航天大学
IPC: G06F16/33 , G06F16/35 , G06F16/951 , G06N5/02
Abstract: 本发明公开了一种知识库动态更新方法,包括:数据获取、数据解析、实体对齐、数据融合,数据融合包括,将实体的相同属性以及含义相近属性进行合并,合并方法为:实体属性规范化以及实体属性融合,实体属性融合包括,单值型属性值对原有属性值进行覆盖;枚举型属性值包括新增、删除以及更新,进行删除操作时,记录实体每个数据源的枚举属性值,对比更新前后的枚举属性值集合,建立删除的属性值集合,将每个数据源删除的属性值分别添加到各自的删除的属性值集合中,集合全部数据源的更新结果,排除所述更新结果在所述删除的属性值集合中的值,得到属性最终值;本发明增加知识库的时效性与完整性,开放知识库数据的源头,为知识库打造自主学习能力。
-
公开(公告)号:CN107748757B
公开(公告)日:2021-05-07
申请号:CN201710858596.2
申请日:2017-09-21
Applicant: 北京航空航天大学
IPC: G06F16/332 , G06F16/33 , G06F40/295 , G06F40/242
Abstract: 本发明提供一种基于知识图谱的问答方法。本发明提供的一种基于知识图谱的问答方法由主体实体匹配,关系匹配以及答案确定来实现。主题实体匹配主要包括命名实体识别和实体链接两个部分。命名实体识别旨在识别自然语言问句q中人名、地名、组织机构名等命名实体。实体链接将识别出的命名实体对应到知识库中的某一个实体上,即找到三元组中的实体s,关系匹配是通过自然语言理解技术理解问句q所表达的语义,并且与搜索空间中三元组(s,p,o)中的关系p进行匹配,以此确定问句所表达的语义及其与知识库中对应的关系。通过实体识别和实体链接得到候选主题实体,关系匹配能够得到候选关系,由此得到若干候选三元组,答案确定需要根据实体识别得分,关系匹配得分等特征对这些候选三元组进行排序,确定最后答案。
-
公开(公告)号:CN109902297B
公开(公告)日:2021-04-02
申请号:CN201910113053.7
申请日:2019-02-13
Applicant: 北京航空航天大学
IPC: G06F40/295 , G06F40/30 , G06F16/2458 , G06F16/35 , G06F16/36 , G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种威胁情报的生成方法及装置,包括:采集多种类型的安全事件的描述文本,以及采集漏洞库和攻击利用数据库;使用正则表达式从所采集的描述文本中过滤掉第一类描述文本,得到第二类描述文本,所述第一类描述文本不包含威胁字段,所述第二类描述文本包含威胁字段;使用卷积神经网络对所述第二类描述文本进行分类,得到真正的威胁情报文本和假正例威胁情报文本;从所述真正的威胁情报文本中提取实体并抽取实体之间的关系,并基于所述实体和实体之间的关系生成三元组信息;基于所述三元组信息,生成威胁情报知识图谱。
-
公开(公告)号:CN107679124B
公开(公告)日:2020-10-27
申请号:CN201710858347.3
申请日:2017-09-21
Applicant: 北京航空航天大学
IPC: G06F16/332
Abstract: 本发明提供一种基于动态规划算法的知识图谱中文问答检索方法,本发明旨在将原本分成三个子步骤的问答过程统一建模到同一个过程中,融入形式语言中状态机的思想将实体的识别过程与问答检索的过程用同一模型进行建模,实体识别被建模成从系统初始状态0到状态1的转移过程,问答检索过程被建模成从状态1转移到状态2的过程。保证回答精度与广度,又能从宏观上将整个问答过程进行统一化建模。另外,本发明将问答过程中的目标实体的转移过程建模成状态机中的状态转移过程,将中转实体建模为中间状态,将最终答案建模为终止状态。在此基础上,使用动态规划算法对所有状态之间的转移过程在整体上进行决策支持,同时保证系统的运行效率。
-
公开(公告)号:CN106874435B
公开(公告)日:2020-02-14
申请号:CN201710061313.1
申请日:2017-01-25
Applicant: 北京航空航天大学
IPC: G06F16/9535 , G06F16/583 , G06F40/284 , G06Q50/00
Abstract: 本发明提供一种用户画像构建方法和装置。本发明提供的用户画像构建方法,包括:获取用户在社交平台上发布的网络信息,所述网络信息包括用户的注册信息和第一预设时长内用户发布的网络内容;根据所述注册信息,确定所述用户的人口属性信息;根据所述网络内容和预设的多个标签词库,确定所述用户的兴趣标签;根据所述人口属性信息和所述用户的兴趣标签,生成所述用户的用户画像。本发明提供的用户画像构建方法和装置,解决了现有技术中的用户画像构建方法所构建出的用户画像不能充分体现用户的特征,从而使得平台无法充分的了解用户,进而无法为用户提供精细化的服务,用户体验度不高的问题。
-
-
-
-
-
-
-
-
-