-
公开(公告)号:CN116611080A
公开(公告)日:2023-08-18
申请号:CN202310286362.0
申请日:2023-03-22
摘要: 本发明提供一种数据管理方法、系统、装置、设备和存储介质,由业务系统采集元数据,并向数据湖授权元数据,数据湖对元数据进行注册并构建数据目录,数据需求方可以通过数据湖中的数据目录快速的查询和访问到业务系统中元数据对应的数据,业务系统内的数据无需发送或者复制到数据湖中,避免了因数据梳理繁琐以及因安全策略导致的数据入湖难问题。业务系统还能制定数据标准并根据所述数据标准检核所述元数据对应的数据,向所述数据湖发送质量周期报告,数据湖能够获取质量周期报告进行数据质量管理;业务系统对所述元数据对应的数据进行授权并进行接口配置,生成配置信息,数据湖能够获取配置信息进行数据传输管理。
-
公开(公告)号:CN117648327A
公开(公告)日:2024-03-05
申请号:CN202311568816.X
申请日:2023-11-22
IPC分类号: G06F16/23 , G06F16/245 , G06F16/28
摘要: 本发明涉及铁路数据处理领域,提供一种铁路主数据更新方法、装置、电子设备和存储介质,方法包括:获取铁路新电报,基于铁路新电报对待更新的铁路主数据进行更新,得到第一铁路主数据,利用训练完的文本分析模型对铁路新电报进行分析得到第一结果集,利用更新后的数据库对铁路新电报进行条件查询,得到第二结果集,利用第一结果集、第二结果集对第一铁路主数据进行更新,得到第二铁路主数据。如此,利用训练完的文本分析模型与更新后数据库两种方式同时辅助对铁路主数据的更新,可以提高铁路主数据更新过程中的更新效率,提升铁路主数据质量,解决现有技术中铁路主数据更新过程中更新效率低、主数据质量较低的问题。
-
公开(公告)号:CN111209472B
公开(公告)日:2023-08-18
申请号:CN201911350760.4
申请日:2019-12-24
IPC分类号: G06F16/9535 , G06F16/9536
摘要: 本发明实施例提供一种铁路事故故障关联和事故故障原因分析方法及系统,该方法包括:构建铁路事故故障知识图谱;基于铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;将事故故障及原因编号表输入至协同过滤分析模型,生成原因相似度矩阵;基于原因相似度矩阵,获取与每个事故故障名称相对应的最可能事故故障原因推荐;将事故故障及原因编号表输入至协同过滤分析模型,生成事故故障相似度矩阵;并基于事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。本实施例通过融合知识图谱与推荐算法,提高了事故故障关联与原因分析的精准度,加强了铁路安全运行的保障。
-
公开(公告)号:CN111209472A
公开(公告)日:2020-05-29
申请号:CN201911350760.4
申请日:2019-12-24
IPC分类号: G06F16/9535 , G06F16/9536
摘要: 本发明实施例提供一种铁路事故故障关联和事故故障原因分析方法及系统,该方法包括:构建铁路事故故障知识图谱;基于铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;将事故故障及原因编号表输入至协同过滤分析模型,生成原因相似度矩阵;基于原因相似度矩阵,获取与每个事故故障名称相对应的最可能事故故障原因推荐;将事故故障及原因编号表输入至协同过滤分析模型,生成事故故障相似度矩阵;并基于事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。本实施例通过融合知识图谱与推荐算法,提高了事故故障关联与原因分析的精准度,加强了铁路安全运行的保障。
-
公开(公告)号:CN111191452A
公开(公告)日:2020-05-22
申请号:CN201911350774.6
申请日:2019-12-24
IPC分类号: G06F40/295 , G06F40/211 , G06F40/30 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明实施例提供一种铁路文本命名实体识别方法及装置,该方法包括:对原始铁路文本数据进行预处理,得到预处理铁路文本数据信息;将预处理铁路文本数据信息输入预设BERT模型,得到铁路文本向量信息;将铁路文本向量信息输入预设BiLSTM-CRF模型,得到铁路文本命名实体识别结果信息;其中,BERT实现文本上下文的铁路文本特征向量学习,获得铁路行业事故故障文本向量表示。通过利用预设BERT增强故障文本命名实体关键字的向量和语义表示,通过BiLSTM-CRF模型,实现对于故障文本向量的计算和识别,得到铁路文本命名实体识别结果信息。
-
公开(公告)号:CN116303601A
公开(公告)日:2023-06-23
申请号:CN202310187514.1
申请日:2023-02-21
IPC分类号: G06F16/2455
摘要: 本发明提供一种跨数据中心的数据查询方法、装置、电子设备及存储介质,其中跨数据中心的数据查询方法,包括:获取应用端提交的目标数据查询请求,目标数据查询请求用于跨数据中心请求查询目标数据;基于目标数据查询请求和预设数据存储库,查询所述目标数据,预设数据存储库用于使用存储多模业务数据的不同数据处理架构响应目标数据查询请求。本发明能够在预先设置不同数据处理架构的情况下实现快速响应跨数据中心的数据查询请求及大幅提高数据查询效率的目的。
-
公开(公告)号:CN115906157A
公开(公告)日:2023-04-04
申请号:CN202211419774.9
申请日:2022-11-14
摘要: 本发明公开了一种基于数据湖的铁路数据安全存取方法、设备及介质,该方法包括:获取源数据,判断源数据的风险等级,根据风险等级对源数据进行加密处理;将加密处理后的源数据通过推荐模型选择适合源数据存储的最优数据库类型;根据最优数据库类型调用数据湖存储模块,将源数据按照最优数据库类型存储到数据湖存储模块中;接收数据提取方请求源数据的指令,根据指令判断数据提取方是否拥有提取所需源数据的相应权限;若确定数据提取方拥有权限,则从数据湖存储模块中调取所需源数据并获取对应所需源数据的解密密钥;将所需源数据及其解密密钥一同发送到数据提取方。解决了铁路数据湖存储方面的存储空间利用效率较低和数据存取的安全性较低的问题。
-
公开(公告)号:CN116226747A
公开(公告)日:2023-06-06
申请号:CN202310124795.6
申请日:2023-02-06
IPC分类号: G06F18/2411 , G06F18/2431 , G06F18/22 , G06F18/214
摘要: 本发明涉及人工智能技术领域,尤其涉及一种数据分类模型的训练方法、数据分类方法和电子设备。其中,数据分类模型的训练方法包括:获取多个数据集样本,以及各个数据集样本对应的类别标签;将多个数据集样本输入到初始数据分类模型中,根据各个数据集样本对应的类别标签和分类结果对初始数据分类模型的模型参数进行更新,以得到训练好的数据分类模型;将预分类数据集基于与分类体系的距离进行归堆,将距离近的数据集输入到预训练好的分类模型中进行分类。通过以上分类模型,对待分类数据进行分类效率较高。
-
公开(公告)号:CN113590746B
公开(公告)日:2024-08-20
申请号:CN202110744498.2
申请日:2021-07-01
IPC分类号: G06F16/33 , G06F16/332 , G06F16/387 , G06F40/247
摘要: 本发明提供了一种数据仓库全面检索信息的方法、装置、设备和介质,其中,该方法包括:将输入的检索信息与主数据属性文本进行匹配,得到与检索信息相匹配的目标信息;其中,主数据属性文本是根据主数据属性信息的历史变更记录建立的数据链路;将目标信息作为检索信息输入数据仓库进行检索,得到检索结果。根据主数据属性信息的历史变更记录建立的数据链路,将汇集至数据服务平台的数据与主数据关联,使主数据生命周期中的多个版本数据可以被有效利用,根据数据链路得到目标信息,将目标信息作为检索信息进行检索,使检索全面而高效。
-
公开(公告)号:CN113569931A
公开(公告)日:2021-10-29
申请号:CN202110808710.7
申请日:2021-07-16
摘要: 本发明提供一种动态数据融合方法、装置、设备和介质,其中,该方法包括:根据目标业务主线,确定至少一个信息系统和每一个信息系统的数据范围,构成数据集;根据时空数据和主数据确定核心要素,时空数据包括列车运行过程中的时间信息和空间信息,主数据包括列车运行的线路信息和经过的车站信息;根据数据集和核心要素构建知识图谱,根据知识图谱得到符合目标业务主线的数据融合结果集。本发明可以将大量且多元的数据融合使用,实现快速、实时的响应业务需求。
-
-
-
-
-
-
-
-
-