基于深度学习的轨道交通事件知识图谱构建方法

    公开(公告)号:CN111597350B

    公开(公告)日:2023-06-02

    申请号:CN202010365826.3

    申请日:2020-04-30

    摘要: 本发明公开了一种基于深度学习的轨道交通事件知识图谱构建方法;采用词典匹配模式加人工标注方式构建事件识别模型训练数据;采用BERT‑BiLSTM‑CRF算法训练规范事件识别模型,从轨道交通设计规范文本中自动抽取规范条目事件;采用word2vec模型,余弦相似度聚类,逻辑回归二分类模型来对事件识别模型输出的事件进行事件统一;采用snowball算法来构建事件关系模型的训练数据;采用BERT‑BiLSTM‑ATTENTION‑SOFTMAX算法训练关系识别模型,自动抽取事件之间的关系。提升了轨道交通建设设计工程信息化,减少了构建图谱的工作量。

    一种针对游戏业务数据的细粒度访问控制方案

    公开(公告)号:CN110968894B

    公开(公告)日:2023-05-26

    申请号:CN201911194524.8

    申请日:2019-11-28

    IPC分类号: G06F21/62 A63F13/71 A63F13/77

    摘要: 本发明提供了一种针对游戏业务数据的细粒度访问控制方案,首先建立基于游戏数据特征的访问控制模型,然后通过对不用数据关系的分析,定义这些关系的通用组织结构,根据组织结构设计符合该组织结构的权限判决算法,模型中涉及的数据特征可以通过数据挖掘和分析的相关方法,充实数据特征库,以达到完善权限判决覆盖范围和出发角度的目的,最后根据定义模型以及权限判决规则进行用户访问时的权限判决。本方案保证了方案无感知加入系统,并且完成了权限控制层级的细化,定义规则配置的形式完成动态数据行的控制,在整个访问控制结构中从数据出发,可利用数据分析的方法进行安全特征的提取,更合理的进行数据的细粒度访问控制。

    一种基于图卷积神经网络对软件缺陷预测方法

    公开(公告)号:CN110888798B

    公开(公告)日:2022-11-04

    申请号:CN201910973406.0

    申请日:2019-10-14

    IPC分类号: G06F11/36 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于图卷积神经网络的软件缺陷预测方法,利用GCN算法训练模型对输入的代码文件进行缺陷类型的预测。本发明通过Bert模型将软件的源代码文件进行特征提取,并通过构建抽象语法树实现了源代码中的文件之间的关联,然后使用关联算法Apriori将代码中可能具有缺陷传递的文件进行关联,最后将源文件的特征向量与特征向量之间的关联关系作为邻接矩阵作为输入,实现了对GCN模型的训练。当判断软件代码文件是否存在缺陷时,将代码文件自动转化为其对应的特征向量向量作为模型的输入,GCN模型输出代码文件可能存在缺陷,从而大大减少了测试人员的工作量。

    基于Transformer的中文文本信息缺失的补全方法

    公开(公告)号:CN111708882B

    公开(公告)日:2022-09-30

    申请号:CN202010476968.7

    申请日:2020-05-29

    摘要: 本发明公开了基于Transformer编码器的中文文本信息缺失的补全方法,对待处理的中文文本公开语料的人工预处理,通过计算机识别句号,将文本分割为以句为分割的大量短句语料,短句通过minibatch的方式转变为Bert词向量,产生的词向量将传入SVM进行文本二分类任务,模型将通过训练决定缺失位置的信息补全结果;采用大量遮盖[mask]标签产生的噪声,对模型进行训练,使得模型具有文本的生成能力,对文本缺失信息位置生成机器预测的缺失文本结果;本发明完成对中文文本的信息缺失的检测、信息缺失的补全任务,来帮助中文自然语言处理的文本预处理更加规范,使中文自然语言处理任务准确率进一步提高。

    基于图谱和可达路径数的无向加权图的子图查询方法

    公开(公告)号:CN108804593A

    公开(公告)日:2018-11-13

    申请号:CN201810523390.9

    申请日:2018-05-28

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种基于图谱和可达路径数的无向加权图的子图查询方法,步骤1,计算查询图和已知图数据集中每个图的节点标记的编码、边带权重的邻接边标记的编码和可达路径数的编码;步骤2,生成查询图和已知图数据集中每个图的图谱;步骤3,用已知图数据集中每个图的节点标记的编码、边带权重的邻接边标记的编码、可达路径数的编码和图谱构建索引树;步骤4,将查询图与索引树节点图由上至下逐层进行比对,同时进行筛选,直至筛选到最底层,所得图即为与查询图相近的候选图。本发明更好地描述了图的拓扑信息。同时,对这些特征进行编码,不仅容易存储,而且操作简单,可以加快特征之间的比较,从而加快整个子图查询的速度。

    一种针对实体识别和关系抽取任务的语义分析方法

    公开(公告)号:CN112084329B

    公开(公告)日:2024-02-02

    申请号:CN202010762584.1

    申请日:2020-07-31

    摘要: 本发明提供了一种针对实体识别和关系抽取任务的语义分析方法,包含三个模块的内容,建立地铁设计规范领域的概念分层体系和语义关系分类体系,分析规范文本的语言特点,以及获取细分领域任务的实体和关系类别信息。第一个模块,借助本体论的思想,和映射对标UMLS,得到概念分层体系和语义关系分类体系。第二个模块,通过规范文本的来源和构成、数据形式和所具备的子语言特性三个部分,由浅及深地分析规范文本的语言特性,以补充实体识别和关系抽取任务的规则提取。最后一个模块,将本体分类的思想渗入这一领域的研究任务细分过程中,实现任务和实体关系类别的对应,从而提高信息抽取的效率。

    基于Transformer的土木建筑信息领域自然语言问题生成方法

    公开(公告)号:CN112559702B

    公开(公告)日:2022-09-30

    申请号:CN202011249217.8

    申请日:2020-11-10

    IPC分类号: G06F16/332 G06F16/35 G06N3/08

    摘要: 本发明公开了基于Transformer的土木建筑信息领域自然语言问题生成方法,本模型通过分析Bert模型中每层学习到的信息分布,结合训练数据的有限特性,对Transformer的不同模块进行不同语料的训练,提出低层网络用于训练句法语法特性,高层网络用于训练获取语义特性的机制。然后,采用UniLM思想对Bert进行下游任务的微调,提升模型在土木建筑信息领域的自然语言文本生成能力。本方法提出的模型在土木建筑信息领域生成问题具有较高的可行性和有效性,并且达到了较高的自然语言问题生成水准。

    基于Transformer的土木建筑信息领域自然语言问题生成方法

    公开(公告)号:CN112559702A

    公开(公告)日:2021-03-26

    申请号:CN202011249217.8

    申请日:2020-11-10

    IPC分类号: G06F16/332 G06F16/35 G06N3/08

    摘要: 本发明公开了基于Transformer的土木建筑信息领域自然语言问题生成方法,本模型通过分析Bert模型中每层学习到的信息分布,结合训练数据的有限特性,对Transformer的不同模块进行不同语料的训练,提出低层网络用于训练句法语法特性,高层网络用于训练获取语义特性的机制。然后,采用UniLM思想对Bert进行下游任务的微调,提升模型在土木建筑信息领域的自然语言文本生成能力。本方法提出的模型在土木建筑信息领域生成问题具有较高的可行性和有效性,并且达到了较高的自然语言问题生成水准。

    基于深度学习的轨道交通规范关系抽取方法

    公开(公告)号:CN111597420A

    公开(公告)日:2020-08-28

    申请号:CN202010355573.1

    申请日:2020-04-29

    摘要: 本发明基于深度学习的轨道交通规范关系抽取方法,包括获取带有人工标注的有标签数据,对标签数据进行规范向量表示,将向量化数据输入到GRU模型中进行实体和实体间关系特征提取,对提取的实体和实体间关系进行训练,生成实体识别模型和实体间关系抽取模型,使用Softmax和Cross-Entropy函数结合的方式对提取的实体间关系特征进行关系分类,评估关系分类结果,根据未分类成功的实体间关系优化实体间关系抽取模型,将待检测轨道交通规范语料输入实体间关系抽取模型中,即输出待检测轨道交通规范语料中的实体间关系。采用本方法能够抽取中文轨道交通设计规范中实体间关系,从而提高建筑领域从业人员对轨道交通规范的查询速率。