基于知识图谱推理的地学数据集问答方法及系统

    公开(公告)号:CN116955558A

    公开(公告)日:2023-10-27

    申请号:CN202310893387.7

    申请日:2023-07-19

    Abstract: 本发明提供了一种基于知识图谱推理的地学数据集问答方法及系统,包括:根据地学数据集信息构建地学知识图谱;围绕地学数据集问句的关键意图,训练命名实体识别模型进行问句语义理解与信息抽取;融合文本信息与时空信息对地理实体进行实体对齐;基于知识图谱的实体关系结构,开展知识图谱嵌入,捕获跨实体的潜在关系与全局信息,实现从地学显式数据到深层知识的知识推理;融合对齐结果与推理结果进行多域检索,得到数据集答案。本发明构建了全新的知识图谱智能问答系统,相比于现有问答系统可以提高答案查全性,同时具备知识推理能力,能够通过显式地学数据挖掘隐式内在关联,能够帮助地学专家快速准确地寻找目标数据集。

    基于多维特征融合的二阶段学术数据网页分类方法及系统

    公开(公告)号:CN115130601A

    公开(公告)日:2022-09-30

    申请号:CN202210795308.4

    申请日:2022-07-07

    Abstract: 本发明提供了一种基于多维特征融合的二阶段学术数据网页分类方法及系统,涉及网页分类技术领域,包括:步骤S1:基于学术关键词,输入搜索引擎进行检索,获取检索页面内容;步骤S2:开展基于短文本逻辑回归模型的第一阶段分类;步骤S3:获取第一阶段分类完成后标签为数据网页的网页HTML信息;步骤S4:基于网页长文本和网址信息,开展第二阶段分类,采用文本卷积神经网络结合三元组损失的深度度量学习算法;步骤S5:将最终的分类结果入库整理,分析网页中的必要信息,展示在数据门户网站上。本发明能够快速准确地从互联网中筛选出数据网页。

Patent Agency Ranking