-
公开(公告)号:CN112380345B
公开(公告)日:2022-03-29
申请号:CN202011313700.8
申请日:2020-11-20
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06F16/35 , G06F16/36 , G06F40/232 , G06F40/258 , G06F40/284 , G06F40/289
摘要: 本发明的基于GNN的COVID‑19科学文献细粒度分类方法,包括:a).COVID‑19科学文献知识图谱的构建;a‑1).知识类别的划分;a‑2).科学文献中实体设计;a‑3).科学文献中关系设计;a‑4).构建COVID‑19科学文献知识图谱;b).西药治疗知识图谱构建;c).中药治疗知识图谱构建;d).构建图神经网络模型;e).文本分类。本发明的基于GNN的COVID‑19科学文献细粒度分类方法,为医学工作者在海量的(通常大于1万篇)有关COVID‑19科学文献中快速查找到自己所需的知识类别文献,提供了一种行之有效的筛选和分类方法,有益效果显著,适于应用推广。
-
公开(公告)号:CN112417166B
公开(公告)日:2022-08-26
申请号:CN202011309998.5
申请日:2020-11-20
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本发明的知识图谱三元组置信度评价方法,包括评估阶段、融合阶段和校验阶段,a).实体层面评估;a‑1).数据源角度;a‑2).文献共现角度;a‑3).外链规模角度;a‑4).文本描述角度;a‑5).实体重要性角度;a‑6).实体的度的角度;b).关系层面评估;b‑1).数据源角度;b‑2).文献共现角度;b‑3).对实体间已知关系层面的评价;b‑4).对实体间未知关系层面的评价;c).知识图谱全局层面评估。本发明的知识图谱三元组置信度评价方法,可高效、快速、大规模的发掘知识图谱数据中的错误,进而提升整个知识图谱系统的数据质量;可以对链接预测、关系推理等机器学习任务的结果进行数据可靠性校验。
-
公开(公告)号:CN111125347A
公开(公告)日:2020-05-08
申请号:CN201911376996.5
申请日:2019-12-27
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06F16/338 , G06F16/36
摘要: 本发明的基于unity3d的知识图谱3D可视化方法,包括:a).摄像机、天空盒和场景初始化;b).三元组数据获取;c).预制体的创建及三维物理结构组织;d).三维力学模型构建;e).帧循环;f).沉浸式摄影机脚本;g).全局摄影机脚本;h).属性信息显示及UI绘制;i).检索功能及传送功能;j).沉浸视图、全局视图切换。本发明的基于unity3d的知识图谱3D可视化方法,具有良好的可移植性和可扩展性,可以发布到web、手机、PC等多种平台,而不会像WebGL等技术一样开发后即对平台具有高度依赖;另一方面表现在未来可以方便的扩展至虚拟现实、增强现实等新兴的显示技术上,实现更广阔、更沉浸、更具互动性的知识图谱3D可视化。
-
公开(公告)号:CN111125347B
公开(公告)日:2023-10-27
申请号:CN201911376996.5
申请日:2019-12-27
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06F16/338 , G06F16/36
摘要: 本发明的基于unity3d的知识图谱3D可视化方法,包括:a).摄像机、天空盒和场景初始化;b).三元组数据获取;c).预制体的创建及三维物理结构组织;d).三维力学模型构建;e).帧循环;f).沉浸式摄影机脚本;g).全局摄影机脚本;h).属性信息显示及UI绘制;i).检索功能及传送功能;j).沉浸视图、全局视图切换。本发明的基于unity3d的知识图谱3D可视化方法,具有良好的可移植性和可扩展性,可以发布到web、手机、PC等多种平台,而不会像WebGL等技术一样开发后即对平台具有高度依赖;另一方面表现在未来可以方便的扩展至虚拟现实、增强现实等新兴的显示技术上,实现更广阔、更沉浸、更具互动性的知识图谱3D可视化。
-
公开(公告)号:CN110767266B
公开(公告)日:2023-04-18
申请号:CN201911064826.3
申请日:2019-11-04
摘要: 本发明的基于图卷积的面向ErbB靶向蛋白家族的打分函数构建方法,包括:a).构建ErbB靶向蛋白数据,对于ErbB包含的4个受体酪氨酸激酶ErbB‑1、ErbB‑2、ErbB‑3和ErbB‑4均构建靶向蛋白数据集;b).扩大数据集规模,采用原始构象、旋转构象、优化构象的方法扩大数据集规模;c).构建ErbB靶向蛋白家族机器学习打分函数模型;d).模型的训练和评估。本发明的打分函数构建方法,建了一个ErbB蛋白家族机器学习分子亲和力评估数据集,为ErbB蛋白家族的机器学习任务奠定了数据基础;通过GCN技术突破了经典打分函数的瓶颈,提高了打分函数的性能,解决了机器学习打分函数通用模型准确率低的问题。
-
公开(公告)号:CN112417166A
公开(公告)日:2021-02-26
申请号:CN202011309998.5
申请日:2020-11-20
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本发明的知识图谱三元组置信度评价方法,包括评估阶段、融合阶段和校验阶段,a).实体层面评估;a‑1).数据源角度;a‑2).文献共现角度;a‑3).外链规模角度;a‑4).文本描述角度;a‑5).实体重要性角度;a‑6).实体的度的角度;b).关系层面评估;b‑1).数据源角度;b‑2).文献共现角度;b‑3).对实体间已知关系层面的评价;b‑4).对实体间未知关系层面的评价;c).知识图谱全局层面评估。本发明的知识图谱三元组置信度评价方法,可高效、快速、大规模的发掘知识图谱数据中的错误,进而提升整个知识图谱系统的数据质量;可以对链接预测、关系推理等机器学习任务的结果进行数据可靠性校验。
-
公开(公告)号:CN111710365B
公开(公告)日:2022-04-08
申请号:CN202010525374.0
申请日:2020-06-10
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G16B40/00 , G06F40/247 , G06F16/36
摘要: 本发明基于本体的蛋白质/基因同义词表构建方法,包括:a).数据源Uniprot、BioGRID和NCBI Gene的获取;b).数据文件的分割;c).上层本体的建立;d).Uniprot‑Swissprot向上层本体的映射和融合;e).BioGRID向上层本体的映射和融合;f).NCBI Gene向上层本体的映射和融合;g).同义词的去重。本发明的蛋白质/基因同义词表构建方法,建立了同义词规模上更全面、准确度上更可靠、分类信息上更细致的蛋白质/基因同义词表,为进行更高效、准确的文献数据挖掘提供了前提保证,是生物医药专家进行科研发现的有力辅助。
-
公开(公告)号:CN112380345A
公开(公告)日:2021-02-19
申请号:CN202011313700.8
申请日:2020-11-20
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06F16/35 , G06F16/36 , G06F40/232 , G06F40/258 , G06F40/284 , G06F40/289
摘要: 本发明的基于GNN的COVID‑19科学文献细粒度分类方法,包括:a).COVID‑19科学文献知识图谱的构建;a‑1).知识类别的划分;a‑2).科学文献中实体设计;a‑3).科学文献中关系设计;a‑4).构建COVID‑19科学文献知识图谱;b).西药治疗知识图谱构建;c).中药治疗知识图谱构建;d).构建图神经网络模型;e).文本分类。本发明的基于GNN的COVID‑19科学文献细粒度分类方法,为医学工作者在海量的(通常大于1万篇)有关COVID‑19科学文献中快速查找到自己所需的知识类别文献,提供了一种行之有效的筛选和分类方法,有益效果显著,适于应用推广。
-
公开(公告)号:CN111710365A
公开(公告)日:2020-09-25
申请号:CN202010525374.0
申请日:2020-06-10
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G16B40/00 , G06F40/247 , G06F16/36
摘要: 本发明基于本体的蛋白质/基因同义词表构建方法,包括:a).数据源Uniprot、BioGRID和NCBI Gene的获取;b).数据文件的分割;c).上层本体的建立;d).Uniprot-Swissprot向上层本体的映射和融合;e).BioGRID向上层本体的映射和融合;f).NCBI Gene向上层本体的映射和融合;g).同义词的去重。本发明的蛋白质/基因同义词表构建方法,建立了同义词规模上更全面、准确度上更可靠、分类信息上更细致的蛋白质/基因同义词表,为进行更高效、准确的文献数据挖掘提供了前提保证,是生物医药专家进行科研发现的有力辅助。
-
公开(公告)号:CN110767266A
公开(公告)日:2020-02-07
申请号:CN201911064826.3
申请日:2019-11-04
摘要: 本发明的基于图卷积的面向ErbB靶向蛋白家族的打分函数构建方法,包括:a).构建ErbB靶向蛋白数据,对于ErbB包含的4个受体酪氨酸激酶ErbB-1、ErbB-2、ErbB-3和ErbB-4均构建靶向蛋白数据集;b).扩大数据集规模,采用原始构象、旋转构象、优化构象的方法扩大数据集规模;c).构建ErbB靶向蛋白家族机器学习打分函数模型;d).模型的训练和评估。本发明的打分函数构建方法,建了一个ErbB蛋白家族机器学习分子亲和力评估数据集,为ErbB蛋白家族的机器学习任务奠定了数据基础;通过GCN技术突破了经典打分函数的瓶颈,提高了打分函数的性能,解决了机器学习打分函数通用模型准确率低的问题。
-
-
-
-
-
-
-
-
-