一种基于决策树的数据库本体学习优化方法

    公开(公告)号:CN110377754A

    公开(公告)日:2019-10-25

    申请号:CN201910588441.0

    申请日:2019-07-01

    Abstract: 本发明提供了一种基于决策树的数据库本体学习优化方法,包括以下步骤:确定待分类的源数据属性表;利用预设算法对所述源数据属性表进行训练,生成属性决策树;基于生成的属性决策树,使用OWL本体语言构建源数据本体,读取数据库表字段作为本体中类的属性;基于生成的属性决策树,使用OWL本体语言构建源数据本体类,读取决策树中各选择枝作为属性,构建最终决策类。本发明由决策树算法处理后的数据可以用本体有效表示与存储,与数据库学习直接生成的本体对比,由数据库生成的决策树可以为本体添加更多的约束规则,发现的隐藏规则可以作为现有本体的填充。此外,使用本体学习技术可以让机器代替手工节省大量人力成本。

    一种领域评审专家行为轨迹的知识图谱构建方法

    公开(公告)号:CN114297404B

    公开(公告)日:2024-10-01

    申请号:CN202111637269.7

    申请日:2021-12-29

    Abstract: 本发明提供一种领域评审专家行为轨迹的知识图谱构建方法,采用自顶向下与自底向上相结合的方法完成构建。通过爬虫进行数据采集并预处理;定义领域本体,建立模式结构;利用自然语言处理技术进行知识抽取;针对同名专家的多类属性特征,提出基于地点一致性与时间重合性相结合的行为轨迹相似度匹配算法,结合编辑距离和余弦相似度确定消歧专家,实现知识融合;最后将知识存储在图数据库neo4j中,查找专家间建立的直接关系路径和间接关系路径,完成亲密度计算。本发明的方法同名专家消歧的F1值为93%,相比现有技术提高16%,解决了知识图谱中实体歧义问题。该知识图谱可有效表示专家行为轨迹及社会关系等,计算专家亲密度,为评审专家的遴选提供知识基础。

    一种领域评审专家行为轨迹的知识图谱构建方法

    公开(公告)号:CN114297404A

    公开(公告)日:2022-04-08

    申请号:CN202111637269.7

    申请日:2021-12-29

    Abstract: 本发明提供一种领域评审专家行为轨迹的知识图谱构建方法,采用自顶向下与自底向上相结合的方法完成构建。通过爬虫进行数据采集并预处理;定义领域本体,建立模式结构;利用自然语言处理技术进行知识抽取;针对同名专家的多类属性特征,提出基于地点一致性与时间重合性相结合的行为轨迹相似度匹配算法,结合编辑距离和余弦相似度确定消歧专家,实现知识融合;最后将知识存储在图数据库neo4j中,查找专家间建立的直接关系路径和间接关系路径,完成亲密度计算。本发明的方法同名专家消歧的F1值为93%,相比现有技术提高16%,解决了知识图谱中实体歧义问题。该知识图谱可有效表示专家行为轨迹及社会关系等,计算专家亲密度,为评审专家的遴选提供知识基础。

    一种基于Ontology的深度信念网络模型及其生成方法

    公开(公告)号:CN110414671A

    公开(公告)日:2019-11-05

    申请号:CN201910596454.2

    申请日:2019-07-03

    Abstract: 本发明提供一种基于Ontology的深度信念网络模型及其生成方法。本发明试图将本体论和深度信念网络结合起来,形成一个新的模型。本体中最重要的关系之一是本体的层次结构。表达深度学习节点属性和函数转换使用本体的概念属性和分类关系。本发明在这里建立的深度信念网络模型只使用本体概念的亲子关系。同时,本发明选择自下而上构建本体,这样,本发明可以最大限度地训练深度信念网络模型,而不会影响本体节点的表示。

    一种基于网络爬虫和新浪API相结合的微博数据的采集方法

    公开(公告)号:CN109241380A

    公开(公告)日:2019-01-18

    申请号:CN201810970733.6

    申请日:2018-08-24

    Abstract: 本发明公开了一种基于网络爬虫和新浪API相结合的微博数据的采集方法,基于新浪API从微博名人榜获取种子用户及其对应的粉丝用户和关注用户,加入到种子列表;将种子列表转换为种子URL,并判断种子用户列表是否为空,若为空则结束,否则遍历种子列表,采用网络爬虫的方法,爬取种子用户的相关微博信息、微博评论信息和用户个人信息,并将微博评论用户加入到种子列表中。与现有技术相比,本发明通过将新浪API和针对新浪微博平台的网络爬虫相结合,既可以获取格式比较规范的微博数据,又能进行大规模的数据爬取,并且爬取的数据格式更加规范,噪声数据比较少,进而能够为开展微博中社会安全事件的侦测提供重要的数据基础。

Patent Agency Ranking