-
公开(公告)号:CN110377754A
公开(公告)日:2019-10-25
申请号:CN201910588441.0
申请日:2019-07-01
Applicant: 北京信息科技大学
Abstract: 本发明提供了一种基于决策树的数据库本体学习优化方法,包括以下步骤:确定待分类的源数据属性表;利用预设算法对所述源数据属性表进行训练,生成属性决策树;基于生成的属性决策树,使用OWL本体语言构建源数据本体,读取数据库表字段作为本体中类的属性;基于生成的属性决策树,使用OWL本体语言构建源数据本体类,读取决策树中各选择枝作为属性,构建最终决策类。本发明由决策树算法处理后的数据可以用本体有效表示与存储,与数据库学习直接生成的本体对比,由数据库生成的决策树可以为本体添加更多的约束规则,发现的隐藏规则可以作为现有本体的填充。此外,使用本体学习技术可以让机器代替手工节省大量人力成本。
-
公开(公告)号:CN110413796A
公开(公告)日:2019-11-05
申请号:CN201910596452.3
申请日:2019-07-03
Applicant: 北京信息科技大学
Abstract: 本发明提供一种煤矿典型动力灾害领域本体构建方法。该方法融合了传统的骨架法和七步法,详细阐述了本体构建过程中所用的技术,为研究者提供了工程上可实现的本体构建思路。使用Jena工具实现本体的形式化表示,介绍了Jena工具的体系结构和构建所用的关键性代码。
-
公开(公告)号:CN114297404B
公开(公告)日:2024-10-01
申请号:CN202111637269.7
申请日:2021-12-29
Applicant: 北京信息科技大学
IPC: G06F16/36 , G06F16/901 , G06F16/903 , G06F40/295
Abstract: 本发明提供一种领域评审专家行为轨迹的知识图谱构建方法,采用自顶向下与自底向上相结合的方法完成构建。通过爬虫进行数据采集并预处理;定义领域本体,建立模式结构;利用自然语言处理技术进行知识抽取;针对同名专家的多类属性特征,提出基于地点一致性与时间重合性相结合的行为轨迹相似度匹配算法,结合编辑距离和余弦相似度确定消歧专家,实现知识融合;最后将知识存储在图数据库neo4j中,查找专家间建立的直接关系路径和间接关系路径,完成亲密度计算。本发明的方法同名专家消歧的F1值为93%,相比现有技术提高16%,解决了知识图谱中实体歧义问题。该知识图谱可有效表示专家行为轨迹及社会关系等,计算专家亲密度,为评审专家的遴选提供知识基础。
-
公开(公告)号:CN114297404A
公开(公告)日:2022-04-08
申请号:CN202111637269.7
申请日:2021-12-29
Applicant: 北京信息科技大学
IPC: G06F16/36 , G06F16/901 , G06F16/903 , G06F40/295
Abstract: 本发明提供一种领域评审专家行为轨迹的知识图谱构建方法,采用自顶向下与自底向上相结合的方法完成构建。通过爬虫进行数据采集并预处理;定义领域本体,建立模式结构;利用自然语言处理技术进行知识抽取;针对同名专家的多类属性特征,提出基于地点一致性与时间重合性相结合的行为轨迹相似度匹配算法,结合编辑距离和余弦相似度确定消歧专家,实现知识融合;最后将知识存储在图数据库neo4j中,查找专家间建立的直接关系路径和间接关系路径,完成亲密度计算。本发明的方法同名专家消歧的F1值为93%,相比现有技术提高16%,解决了知识图谱中实体歧义问题。该知识图谱可有效表示专家行为轨迹及社会关系等,计算专家亲密度,为评审专家的遴选提供知识基础。
-
公开(公告)号:CN110414671A
公开(公告)日:2019-11-05
申请号:CN201910596454.2
申请日:2019-07-03
Applicant: 北京信息科技大学
Abstract: 本发明提供一种基于Ontology的深度信念网络模型及其生成方法。本发明试图将本体论和深度信念网络结合起来,形成一个新的模型。本体中最重要的关系之一是本体的层次结构。表达深度学习节点属性和函数转换使用本体的概念属性和分类关系。本发明在这里建立的深度信念网络模型只使用本体概念的亲子关系。同时,本发明选择自下而上构建本体,这样,本发明可以最大限度地训练深度信念网络模型,而不会影响本体节点的表示。
-
公开(公告)号:CN109241380A
公开(公告)日:2019-01-18
申请号:CN201810970733.6
申请日:2018-08-24
Applicant: 北京信息科技大学
IPC: G06F16/951
Abstract: 本发明公开了一种基于网络爬虫和新浪API相结合的微博数据的采集方法,基于新浪API从微博名人榜获取种子用户及其对应的粉丝用户和关注用户,加入到种子列表;将种子列表转换为种子URL,并判断种子用户列表是否为空,若为空则结束,否则遍历种子列表,采用网络爬虫的方法,爬取种子用户的相关微博信息、微博评论信息和用户个人信息,并将微博评论用户加入到种子列表中。与现有技术相比,本发明通过将新浪API和针对新浪微博平台的网络爬虫相结合,既可以获取格式比较规范的微博数据,又能进行大规模的数据爬取,并且爬取的数据格式更加规范,噪声数据比较少,进而能够为开展微博中社会安全事件的侦测提供重要的数据基础。
-
公开(公告)号:CN110413995B
公开(公告)日:2022-12-23
申请号:CN201910601361.4
申请日:2019-07-03
Applicant: 北京信息科技大学
IPC: G06F40/295 , G06F16/28
Abstract: 本发明提供一种基于双向MGU神经网络的关系抽取方法。解决了单向MGU模型对后文依赖性不足,无法处理后文信息的问题。通过实验表明了该方法的训练时间更短,抽取准确率、召回率和F值更高。通过分析不同关系类型的抽取性能,发现了关系类型的选取以及语料特点对抽取性能存在一定影响。
-
公开(公告)号:CN110413995A
公开(公告)日:2019-11-05
申请号:CN201910601361.4
申请日:2019-07-03
Applicant: 北京信息科技大学
Abstract: 本发明提供一种基于双向MGU神经网络的关系抽取方法。解决了单向MGU模型对后文依赖性不足,无法处理后文信息的问题。通过实验表明了该方法的训练时间更短,抽取准确率、召回率和F值更高。通过分析不同关系类型的抽取性能,发现了关系类型的选取以及语料特点对抽取性能存在一定影响。
-
-
-
-
-
-
-