-
公开(公告)号:CN110688386A
公开(公告)日:2020-01-14
申请号:CN201910936371.3
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/2453 , G06F16/27 , G06F16/31
Abstract: 本发明公开了一种面向新型供电轨道交通大数据的分布式列族数据索引方法。对新型供电轨道交通系统运行时产生的结构化数据,根据基表存储结构将不同情境采集获得的结构化数据进行存储处理为列族模型:将不同的多个元组存储于同一列族模型中形成主表列族模型,再按照元组间的主外键关系在主表列族模型之中建立跨表索引结构:利用跨表索引结构进行查询数据。本发明解决了新型供电轨道交通系统大数据难以提供高效、易用数据检索的技术问题,来消除多表查询时的连接操作,保证查询性能,具备高效的数据存取能力和高可伸缩性,提高了系统的易用性。
-
公开(公告)号:CN109101468A
公开(公告)日:2018-12-28
申请号:CN201810873554.0
申请日:2018-08-02
Applicant: 浙江大学
IPC: G06F17/21
Abstract: 本发明公开了一种文本数据转换脚本的执行优化方法。针对通过网络分布式处理执行的文本数据转换脚本,对文本数据转换脚本进行解析,生成执行计划树;使用基于元组的多重集作为文本数据的数据模型,文本数据转换脚本包含了对多重集的结构和内容进行修改和转换的数据操作;根据转换脚本执行场景的不同,采用对应的执行优化方法;根据优化后得到的执行计划结果,生成逻辑程序处理并运行,从而对大数据平台上的数据进行高效地转换和处理。本发明方法能够应用于数据准备阶段对海量文本数据的处理,通过应用面向文本数据转换脚本的执行优化方法,能够有效地减少文本数据转换脚本在执行时的时空代价,提高数据准备阶段的效率。
-
公开(公告)号:CN114580352B
公开(公告)日:2025-04-01
申请号:CN202210223992.9
申请日:2022-03-09
Applicant: 浙江大学
IPC: G06F40/126 , G06F40/284 , G06N3/0455 , G06N3/084 , G06N5/04
Abstract: 本发明公开了一种基于浅层特征预计算的神经网络推理加速方法,该方法首先获取预训练神经网络,根据输入文本,使用预训练神经网络将输入文本进行编码;然后根据所述预训练神经网络,构建浅层特征可预计算神经网络,根据输入文本,使用浅层特征可预计算神经网络将输入文本进行编码;再使用所述浅层特征可预计算神经网络拟合预训练神经网络的中间层特征,训练浅层特征可预计算神经网络;再根据所述浅层特征可预计算神经网络,构建浅层特征查询表;最后使用上述浅层特征查询表替换浅层特征可预计算神经网络的浅层神经网络。本发明可以用于新闻分类、情感分析、问答系统等人工智能领域任务。
-
公开(公告)号:CN115503287A
公开(公告)日:2022-12-23
申请号:CN202211078402.4
申请日:2022-09-05
Applicant: 重庆三大伟业制药有限公司 , 浙江大学
Abstract: 本发明提出一种血液成分分离袋的制作方法,包括步骤1、裁切两片软质PVC膜作为袋体,分别记作第一、二袋体,准备分离袋入口配件和分离袋出口配件,二者均采用硬质PVC材质制成;步骤2、在第一袋体上冲孔形成装配孔;步骤3、将分离袋入口配件和分离袋出口配件进行加热;步骤4、将分离袋入口配件插至装配孔处;步骤5、利用高周波焊接工艺将加热后的分离袋入口配件和分离袋出口配件与第一袋体进行焊接形成半成品;步骤6、将半成品放置在模具中,模具用于将半成品进行固定;步骤7、将第二袋体放在半成品上,利用高周波焊接工艺进行焊接得到血液成分分离袋。上述制作方法制成的血液成分分离袋能承受较高的压力,不会在焊接处出现漏液。
-
公开(公告)号:CN110727695B
公开(公告)日:2022-05-03
申请号:CN201910936345.0
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/245 , G06F40/30 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向新型供电城轨列车数据运维的自然语言查询解析方法。新型供电城轨列车运行时采集获得的运维数据存储于数据库中,组建一条运维数据的训练样本;对运维数据的自然语言查询和字段进行嵌入处理;将两组输入向量结合各自的标签输入到各自的不同神经网络模型中进行训练;将待测试的自然语言查询语句处理成输入向量,通过训练后的两个不同神经网络模型映射到,对结构化查询语句的不同分类部分进行预测输出,预测后再组合合并成完整的预测结果。本发明利用了数据库已存储的大规模数据扩充训练样本,在获取成本低、存储代价小、使用效率高的基础上,丰富了模型学习到的语义信息,提升了对结构化查询语句的预测准确率。
-
公开(公告)号:CN111881222B
公开(公告)日:2022-04-12
申请号:CN202010686608.X
申请日:2020-07-16
Applicant: 浙江大学
IPC: G06F16/28 , G06F16/2458
Abstract: 本发明公开了一种面向审计的关系数据库聚合代数约束自动挖掘方法,它是一种智慧审计应用中潜藏于海量数据之中的约束关系挖掘方法。现有的审计规则或由专家构造,或由数据库约束发现方法产生,能实现审计简单业务的目的,但是不足以应付海量数据规模挑战,无法满足审计作业中含统计数值的复杂运算的需求。本发明针对上述不足,将该需求形式化成聚合代数约束,并提供聚合代数约束的挖掘方法,该方法根据数据库的模式信息依次枚举表连接、分组方式和代数表达式,计算分析后得到聚合代数约束。本发明无需人工参与约束挖掘,可以应对计算海量数据带来的时空性能挑战,满足审计统计数值相关的复杂运算需求。
-
公开(公告)号:CN110647524B
公开(公告)日:2021-11-23
申请号:CN201910934906.3
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/215 , G06F16/23 , G06F16/2458 , G06F16/901
Abstract: 本发明公开了一种新型供电轨道交通运维系统的数据库补全方法。首先,数据库采用链接预测进行发现,识别数据库中异常关系和未知关系;随后通过计算节点关系元组的置信度;最后,判断加入数据库中,使得轨道交通运维数据库更加完整。本发明方法在面对专业领域数据库补全问题上具有完整性、可控性,提升了精度。
-
公开(公告)号:CN111475500A
公开(公告)日:2020-07-31
申请号:CN202010279614.3
申请日:2020-04-10
Applicant: 浙江大学
IPC: G06F16/215
Abstract: 本发明公开了一种自动发现审计规则和异常数据的方法。该方法先将审计的数据集按照属性类型分成分类属性和数值属性,用户再分别给定分类属性的最小支持率和数值属性的偏移率,然后在分类属性中选出支持率高于最小支持率的候选分类属性和属性值;再根据属性类型生成候选属性集,从而获取审计规则;最后根据获取的审计规则,依次对收集的审计数据集进行筛选,选出符合审计规则中满足条件约束的,而派生属性的属性值不在正常值范围内的数据,即为异常数据。该自动发现审计规则和异常数据方法能够有效地提高审计效率,降低审计成本。
-
公开(公告)号:CN108924778B
公开(公告)日:2020-05-22
申请号:CN201810778007.4
申请日:2018-07-16
Applicant: 浙江大学
Abstract: 本发明公开了一种面向非实时快照位置数据的签到用户近似搜索方法。读入非实时快照位置数据,建立室内分区空间索引;输入查询区域计算查询区域对应的保底区域和浮动区域;以浮动区域作为空间范围查询的查询条件,在室内分区空间索引上搜索移动用户;根据搜索到的移动用户的快照位置数据,构建不确定移动区域,判定移动用户为确定签到用户或可能签到用户,并放入对应集合中;将确定签到用户集合和可能签到用户集合作为近似搜索结果返回给图形界面进行展示。本发明方法在无线定位数据采样频率低、内存维护数据条件有限的场景下,搜索当前时刻可能在特定查询区域进行签到的用户时,能同时保证搜索过程的高效性和完整有效性。
-
公开(公告)号:CN110716933A
公开(公告)日:2020-01-21
申请号:CN201910934795.6
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/2458
Abstract: 本发明公开了一种面向新型城轨列车大数据的高伸缩分布式索引方法。针对新型城轨列车大数据采用服务器集群进行存储构建数据库,形成一个图状拓扑结构的服务器集群,为每台服务器分配一个辅键索引范围作为索引区间;将键值类型数据进行分片,分布式地存储到服务器上,每台服务器对本地的数据分片建立分片索引;每台服务器从本地的分片索引中选取中间节点,建立外链索引发布到其他确定服务器上;利用辅键索引处理查询请求。本发明快速定位查找并定位保存了所需数据区块的服务器,建立辅助索引可支持迅速、准确的数据查询功能,解决了键值存储模型缺乏辅助索引的问题,能够提高大数据存储系统的数据检索效率,具有高伸缩性和低延迟的特点。
-
-
-
-
-
-
-
-
-