-
公开(公告)号:CN110727695B
公开(公告)日:2022-05-03
申请号:CN201910936345.0
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/245 , G06F40/30 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向新型供电城轨列车数据运维的自然语言查询解析方法。新型供电城轨列车运行时采集获得的运维数据存储于数据库中,组建一条运维数据的训练样本;对运维数据的自然语言查询和字段进行嵌入处理;将两组输入向量结合各自的标签输入到各自的不同神经网络模型中进行训练;将待测试的自然语言查询语句处理成输入向量,通过训练后的两个不同神经网络模型映射到,对结构化查询语句的不同分类部分进行预测输出,预测后再组合合并成完整的预测结果。本发明利用了数据库已存储的大规模数据扩充训练样本,在获取成本低、存储代价小、使用效率高的基础上,丰富了模型学习到的语义信息,提升了对结构化查询语句的预测准确率。
-
公开(公告)号:CN110647524B
公开(公告)日:2021-11-23
申请号:CN201910934906.3
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/215 , G06F16/23 , G06F16/2458 , G06F16/901
Abstract: 本发明公开了一种新型供电轨道交通运维系统的数据库补全方法。首先,数据库采用链接预测进行发现,识别数据库中异常关系和未知关系;随后通过计算节点关系元组的置信度;最后,判断加入数据库中,使得轨道交通运维数据库更加完整。本发明方法在面对专业领域数据库补全问题上具有完整性、可控性,提升了精度。
-
公开(公告)号:CN110716933A
公开(公告)日:2020-01-21
申请号:CN201910934795.6
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/2458
Abstract: 本发明公开了一种面向新型城轨列车大数据的高伸缩分布式索引方法。针对新型城轨列车大数据采用服务器集群进行存储构建数据库,形成一个图状拓扑结构的服务器集群,为每台服务器分配一个辅键索引范围作为索引区间;将键值类型数据进行分片,分布式地存储到服务器上,每台服务器对本地的数据分片建立分片索引;每台服务器从本地的分片索引中选取中间节点,建立外链索引发布到其他确定服务器上;利用辅键索引处理查询请求。本发明快速定位查找并定位保存了所需数据区块的服务器,建立辅助索引可支持迅速、准确的数据查询功能,解决了键值存储模型缺乏辅助索引的问题,能够提高大数据存储系统的数据检索效率,具有高伸缩性和低延迟的特点。
-
公开(公告)号:CN110727695A
公开(公告)日:2020-01-24
申请号:CN201910936345.0
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/245 , G06F40/30 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向新型供电城轨列车数据运维的自然语言查询解析方法。新型供电城轨列车运行时采集获得的运维数据存储于数据库中,组建一条运维数据的训练样本;对运维数据的自然语言查询和字段进行嵌入处理;将两组输入向量结合各自的标签输入到各自的不同神经网络模型中进行训练;将待测试的自然语言查询语句处理成输入向量,通过训练后的两个不同神经网络模型映射到,对结构化查询语句的不同分类部分进行预测输出,预测后再组合合并成完整的预测结果。本发明利用了数据库已存储的大规模数据扩充训练样本,在获取成本低、存储代价小、使用效率高的基础上,丰富了模型学习到的语义信息,提升了对结构化查询语句的预测准确率。
-
公开(公告)号:CN110688394B
公开(公告)日:2021-11-23
申请号:CN201910934900.6
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/2452 , G06F16/22 , G06F16/2455 , G06F16/2458 , G06F16/28
Abstract: 本发明公开了一种面向新型供电城轨列车大数据运维的NL生成SQL方法。从新型供电城轨列车上收集运行时产生的多种数据,整理成各自的结构化数据,存入关系型数据库的多个数据表中;使用预训练模型对自然语言和数据库的表名及列名进行编码,获得两种编码;构建符合语法结构的语法解析树模板,对语法解析树模板中需要填充的部分进行训练和预测;将待查询的自然语言输入深度学习模型获得数据库中需查询的表名信息,生成完整数据库查询语句,执行该数据库查询语句获取所需查询的数据。本发明根据自然语言问句自动产生数据库查询语句,提升了运维数据的工作效率,在不同场景下涉及的数据库多表查询操作时能准确地返回所需查询的数据。
-
公开(公告)号:CN110716933B
公开(公告)日:2022-03-15
申请号:CN201910934795.6
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/2458
Abstract: 本发明公开了一种面向新型城轨列车大数据的高伸缩分布式索引方法。针对新型城轨列车大数据采用服务器集群进行存储构建数据库,形成一个图状拓扑结构的服务器集群,为每台服务器分配一个辅键索引范围作为索引区间;将键值类型数据进行分片,分布式地存储到服务器上,每台服务器对本地的数据分片建立分片索引;每台服务器从本地的分片索引中选取中间节点,建立外链索引发布到其他确定服务器上;利用辅键索引处理查询请求。本发明快速定位查找并定位保存了所需数据区块的服务器,建立辅助索引可支持迅速、准确的数据查询功能,解决了键值存储模型缺乏辅助索引的问题,能够提高大数据存储系统的数据检索效率,具有高伸缩性和低延迟的特点。
-
公开(公告)号:CN110688394A
公开(公告)日:2020-01-14
申请号:CN201910934900.6
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/2452 , G06F16/22 , G06F16/2455 , G06F16/2458 , G06F16/28
Abstract: 本发明公开了一种面向新型供电城轨列车大数据运维的NL生成SQL方法。从新型供电城轨列车上收集运行时产生的多种数据,整理成各自的结构化数据,存入关系型数据库的多个数据表中;使用预训练模型对自然语言和数据库的表名及列名进行编码,获得两种编码;构建符合语法结构的语法解析树模板,对语法解析树模板中需要填充的部分进行训练和预测;将待查询的自然语言输入深度学习模型获得数据库中需查询的表名信息,生成完整数据库查询语句,执行该数据库查询语句获取所需查询的数据。本发明根据自然语言问句自动产生数据库查询语句,提升了运维数据的工作效率,在不同场景下涉及的数据库多表查询操作时能准确地返回所需查询的数据。
-
公开(公告)号:CN110647524A
公开(公告)日:2020-01-03
申请号:CN201910934906.3
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/215 , G06F16/23 , G06F16/2458 , G06F16/901
Abstract: 本发明公开了一种新型供电轨道交通运维系统的数据库补全方法。首先,数据库采用链接预测进行发现,识别数据库中异常关系和未知关系;随后通过计算节点关系元组的置信度;最后,判断加入数据库中,使得轨道交通运维数据库更加完整。本发明方法在面对专业领域数据库补全问题上具有完整性、可控性,提升了精度。
-
-
-
-
-
-
-