-
公开(公告)号:CN112069199B
公开(公告)日:2022-08-05
申请号:CN202010842798.X
申请日:2020-08-20
Applicant: 浙江大学
IPC: G06F16/242 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于中间语法树的多轮自然语言转SQL方法。为解决传统端到端方法存在自然语言和SQL间的语义代沟,忽略了SQL内在的语法逻辑等问题,本发明设计了一种类SQL的中间语法树文法,以非端到端的方式,采用编码‑解码架构的语法神经网络,在轮次维度上迭代,按照语法树逻辑由粗到细的两阶段生成每一轮的中间语法树,并在后处理阶段推理生成SQL。应对多轮会话间语义依赖导致生成SQL局部重叠现象,本发明提出了对历史生成SQL的复用策略,进一步地提高了转化准确率。本发明在智能数据库系统等场景中具有广泛的应用前景。
-
公开(公告)号:CN114726054A
公开(公告)日:2022-07-08
申请号:CN202210506644.2
申请日:2022-05-05
Applicant: 浙江大学
Abstract: 本发明提供了一种基于纹波通信的相邻电池能量均衡系统,包括多个能量均衡单元,每个单元包括信号采样调理模块、解调模块和控制模块,两个相邻单元利用共控电池的电压或电流纹波进行通信。本发明系统不需要额外的通信线缆,可以实现均衡系统间的低时延和高可靠的通信,通信数据可用于锂电池状态监测、控制与保护,并且通信控制与功率控制解耦。在此基础上本发明系统可支持多种数据调制方式,包括FSK、PSK、DPSK、FH‑DPSK调制等。
-
公开(公告)号:CN114580633A
公开(公告)日:2022-06-03
申请号:CN202210225240.6
申请日:2022-03-09
Applicant: 浙江大学
Abstract: 本发明公开了一种基于低参数增长快照模型的连续学习方法。本发明将参与训练的模型分为快照模型以及全局模型,全局模型通过顺序学习任务序列中的所有任务以此来接收所有任务中所需要的知识,快照模型为任务流中的每个独立任务训练出来用于存储知识的模型。在学习当前到达的任务时,将学习流程分为两个阶段,第一个阶段是对快照模型进行学习,第二个阶段是利用习得的快照模型来指导约束全局模型学习。本发明利用低参数增长的方法来实现空间高效的快照模型存储,以此来消解对历史数据的依赖,保护用户隐私。使用全局模型保留所有任务的信息,在推断阶段不会引入额外的计算代价。
-
公开(公告)号:CN111475508B
公开(公告)日:2022-05-03
申请号:CN202010244529.3
申请日:2020-03-31
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/2455
Abstract: 本发明公开了一种优化叶子节点合并操作的高效索引方法。该方法的特点是引入了新的一种适合NVM的叶子节点结构设计和高效原地合并操作。该方法首先将索引分成存储在DRAM中的缓冲B树和存储在NVM中的基础B树。在索引执行写操作的过程中,首先写入缓冲B树的日志文件里,再修改缓冲B树;当所述缓冲B树的容量超过阈值,借助基础B树叶子节点结构设计,将缓冲B树通过原地合并操作合入NVM上的基础B树,并通过WBINVD指令高效地将脏数据持久化到NVM。当原地合并操作完成后,清空缓存B树以及NVM上的日志文件,完成对所述写操作的索引过程。该索引方法能够有效地降低对于NVM的写入次数,降低NVM的损耗,提升写入性能。
-
公开(公告)号:CN110716933B
公开(公告)日:2022-03-15
申请号:CN201910934795.6
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/2458
Abstract: 本发明公开了一种面向新型城轨列车大数据的高伸缩分布式索引方法。针对新型城轨列车大数据采用服务器集群进行存储构建数据库,形成一个图状拓扑结构的服务器集群,为每台服务器分配一个辅键索引范围作为索引区间;将键值类型数据进行分片,分布式地存储到服务器上,每台服务器对本地的数据分片建立分片索引;每台服务器从本地的分片索引中选取中间节点,建立外链索引发布到其他确定服务器上;利用辅键索引处理查询请求。本发明快速定位查找并定位保存了所需数据区块的服务器,建立辅助索引可支持迅速、准确的数据查询功能,解决了键值存储模型缺乏辅助索引的问题,能够提高大数据存储系统的数据检索效率,具有高伸缩性和低延迟的特点。
-
公开(公告)号:CN111274814B
公开(公告)日:2021-09-24
申请号:CN201911369784.4
申请日:2019-12-26
Applicant: 浙江大学
IPC: G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种新型的半监督文本实体信息抽取方法。文档短语分割得候选实体集合;建立有、无监督学习部分,有、无标注的文档分别有、无监督学习;文档和实体类型输入实体抽取模块输出实体信息;文档和短语输入类型选择模块输出短语概率分布;两模块损失值相加为损失;文档输入实体抽取模块获得每个实体类型的损失;文档和短语输入类型选择模块输出短语概率分布;两模块损失值相乘后相加构成损失;两部分加权计算获得总损失,优化训练获得模型参数;将测文本依次输入到实体抽取模块和类型选择模块获得实体信息。本发明能够利用海量无标注数据,显著增强模型性能,在小样本标注数据的条件下有着显著的提升,也适用于零样本学习的半监督文本数据处理。
-
公开(公告)号:CN111797911A
公开(公告)日:2020-10-20
申请号:CN202010573202.0
申请日:2020-06-22
Applicant: 浙江大学
Abstract: 本发明公开了一种图像数据多标签分类方法,该方法首先构建图片的拓扑关系,然后用基于协作的多标签传播算法(CMLP)来解决半监督多标签学习(SSML)问题,从而获得无标记图片的置信矩阵 本发明能够充分地利用多标签图像数据的多个标签之间的相关性来提升图片的多标签分类预测性能,提高了准确度和鲁棒性,同时能够挖掘无监督图像数据的分布信息,很好地解决半监督多标签学习问题,其性能优于现有的半监督图像数据多标签分类方法。
-
公开(公告)号:CN109101468B
公开(公告)日:2020-07-03
申请号:CN201810873554.0
申请日:2018-08-02
Applicant: 浙江大学
IPC: G06F40/103
Abstract: 本发明公开了一种文本数据转换脚本的执行优化方法。针对通过网络分布式处理执行的文本数据转换脚本,对文本数据转换脚本进行解析,生成执行计划树;使用基于元组的多重集作为文本数据的数据模型,文本数据转换脚本包含了对多重集的结构和内容进行修改和转换的数据操作;根据转换脚本执行场景的不同,采用对应的执行优化方法;根据优化后得到的执行计划结果,生成逻辑程序处理并运行,从而对大数据平台上的数据进行高效地转换和处理。本发明方法能够应用于数据准备阶段对海量文本数据的处理,通过应用面向文本数据转换脚本的执行优化方法,能够有效地减少文本数据转换脚本在执行时的时空代价,提高数据准备阶段的效率。
-
公开(公告)号:CN107291895B
公开(公告)日:2020-05-26
申请号:CN201710476244.0
申请日:2017-06-21
Applicant: 浙江大学
IPC: G06F16/21 , G06F16/31 , G06F16/335 , G06F16/2458 , G06F40/284
Abstract: 本发明公开了一种快速的层次化文档查询方法。对文档集中的每个文档建立数据模型,对文档进行格式化处理获得文档质心向量和文档标签;生成的文档质心向量作为高维向量空间中的一个点,为每个文档集采用局部敏感哈希方法在内存中构建哈希索引结构;依据查询文本的文档质心向量,采用基于局部敏感哈希思想的查询方法在哈希索引结构中获取一个候选文档集;依据查询文本的文档标签,采用过滤‑细化的层次化框架在候选文档集中获取词移动距离度量下的最近邻文档。本发明设计的层次化查询方法应用于文档分类和检索时在效率和效果上获得了良好的平衡,使得用户在进行词移动距离度量下的文档查询时能够在保证准确性的情况下快速地获取目标文档。
-
公开(公告)号:CN107992835A
公开(公告)日:2018-05-04
申请号:CN201711309852.9
申请日:2017-12-11
Applicant: 浙江大学
IPC: G06K9/00
Abstract: 本发明公开了一种眼镜图像识别方法。采集包含各种类型眼镜的人脸佩戴眼镜图像作为原始图像,并进行预处理;在每张眼镜图像中标注眼镜关键点;采用眼镜物体检测算法实现人脸佩戴眼镜图像上的眼镜关键点的预测结果;进行眼镜的形状特征和颜色特征提取,获得人脸佩戴眼镜图像上的眼镜属性识别结果。本发明设计的眼镜图像识别方法可以广泛应用,针对眼镜提出的关键点预测模型速度快并且鲁棒性好,对于其他形状特征显著的物体具有一定的参考价值。
-
-
-
-
-
-
-
-
-