基于时空分布变化的伪造图片鉴别方法和装置

    公开(公告)号:CN119295841A

    公开(公告)日:2025-01-10

    申请号:CN202411818625.9

    申请日:2024-12-11

    Applicant: 浙江大学

    Abstract: 基于时空分布变化的伪造图片鉴别方法和装置,其方法包括:步骤1:获取任务训练数据,将其划分为训练集和验证集;采用所述训练数据,使用去噪扩散隐式模型去噪采样过程获得相邻噪声图的时序变化数据;获得每个候选判别因子DFactor和时间序列数据#imgabs0#之间的距离,基于KL散度的损失函数从候选DFactor的集合#imgabs1#中获得固定长度为#imgabs2#的最佳DFactor判别因子;采用最佳DFactor判别因子将时序变化数据构建成有向加权的演化图#imgabs3#;采用有向加权的演化图,学习所述时间序列的特征表示;将特征表示与对应的真假标签作为输入,训练分类器,实现伪造图片鉴别。本发明在图片伪造鉴别领域引入时序信息,不依赖于预训练加噪模型,在实际应用场景中有很好的泛化能力。

    一种针对时序排列的结构化数据获得自动特征工程的方法

    公开(公告)号:CN119202647A

    公开(公告)日:2024-12-27

    申请号:CN202411313477.5

    申请日:2024-09-20

    Applicant: 浙江大学

    Abstract: 一种针对时序排列的结构化数据获得自动特征工程的方法,该方法包括获取样本之间具有时序关系的表格数据X;利用策略网络计算各特征的不同特征转换操作的动作概率;并采样多个自动特征工程计划;生成若干含有扩展特征的表格;用于评估预选机器学习在各含有扩展特征的表格上的预选评估指标;加权所有表格上的预选评估指标计算奖励;迭代进行采样特征工程计划以及优化策略网络的过程;输出迭代过程中得到的选评估指标最好的特征工程计划。

    一种低代码开发工业过程智能模型的方法

    公开(公告)号:CN118916021A

    公开(公告)日:2024-11-08

    申请号:CN202410952559.8

    申请日:2024-07-16

    Applicant: 浙江大学

    Abstract: 本发明公开了一种低代码开发工业过程智能模型的方法。该方法包括在可视化界面上传训练数据和建模需求,结合工艺知识推荐智能模型流图,并利用模型柔性自组装枢纽调用智能组件构建智能模型。构建的智能模型可以在工业智能应用中使用,通过智能模型接口传递实时工业数据,预测所需值。此外,该方法在性能下降时触发模型更新机制,以维持模型性能的稳定性,还包括使用无标签的工业实时数据对模型性能进行更准确的评估。

    一种基于量子电路的关系表存储方法

    公开(公告)号:CN118861036A

    公开(公告)日:2024-10-29

    申请号:CN202410972203.0

    申请日:2024-07-19

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于量子电路的关系表存储方法。本发明利用量子比特和量子门,可以使用少量量子比特,存储大量数据。本发明首先使用一种控制哈达玛门,生成从0开始逐一递增的整数作为主键,再利用主键作为控制位,使用多控制位托佛利门,保存每行的数据。本发明使用量子硬件,实现了关系表的存储,可利用少量量子比特保存大量数据,有利于大数据处理的加速。

    基于数据库管理系统的深度神经网络推理方法和装置

    公开(公告)号:CN118278468B

    公开(公告)日:2024-09-06

    申请号:CN202410695887.4

    申请日:2024-05-31

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于数据库管理系统的深度神经网络推理方法和装置,包括:将预训练神经网络模型参数转换为二进制格式;根据不同的目标任务,使用对应的目标数据集微调将参数已转换为二进制格式的预训练神经网络模型,并在微调中,通过概率模型和剪枝技术,去除冗余参数,得到轻量化模型;将若干个所述轻量化模型部署到数据库管理系统中,即SmartLite;其中,所述预训练神经网络模型的结构和参数作为共享块;当所述SmartLite接受到混合查询请求,至少调用一个模型进行推理;所述混合查询包括SQL查询和深度学习模型推理。本发明计算效率显著提升,使用查找表和比特操作优化,在各种计算任务中显著提高了计算速度。

    一种基于特征校正的结构化数据新类别识别方法及装置

    公开(公告)号:CN118228142B

    公开(公告)日:2024-08-13

    申请号:CN202410650118.2

    申请日:2024-05-24

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于特征校正的结构化数据新类别识别方法及装置,包括:获取有标注样本集和无标注样本集,将每一个样本输入表征编码器,得到样本表征;根据神经网络坍缩现象,生成预分配的单纯形等角紧凑结构作为目标化最优分类头;为无标注样本集中的样本生成初步伪标签,对初步伪标签进行细粒度修正,得到硬标签;基于目标化最优分类头和样本标签,对样本表征进行校正;根据校正后的样本表征和对应的标签,进行基于损失大小关系的标签过滤;使用过滤后的标签及其对应的样本进行半监督训练,更新表征编码器参数;所述半监督模型包括训练好的表征编码器和目标化最优分类头,用于新类样本识别。本发明大幅度提升结构化数据新类别识别准确率。

    一种基于数据湖的查询方法和装置

    公开(公告)号:CN118227656B

    公开(公告)日:2024-08-13

    申请号:CN202410650121.4

    申请日:2024-05-24

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于数据湖的查询方法和装置,包括:根据用户输入,对查询的目标数据集进行采样,得到模式信息M和数据样本信息,从而构建查询;将查询分解成若干个子任务,从而构建处理图;修正处理图,采用shuffle技术和/或Collapse技术,并结合成本模型对修正后的处理图进行优化;根据优化后的处理图生成代码并执行,以输出用户查询结果。本发明无需中介模式,简化查询过程,不需要数据转换和加载,简化了操作,从整体上提高了查询效率。在查询细节上,设计了针对LLM生成代码的查询优化器,极大提高了LLM生成代码的执行效率和对应方法的可解释性,其中对处理图修正以辅助LLM能提高查询准确性,使整个自然语言查询任务的准确性超过传统方法。

    一种表格数据重构方法及装置、问答方法

    公开(公告)号:CN118093597B

    公开(公告)日:2024-07-30

    申请号:CN202410490193.7

    申请日:2024-04-23

    Applicant: 浙江大学

    Abstract: 本发明公开了一种表格数据重构方法及装置、问答方法,包括筛选出与用户问题有关的表头并保留该表头所在的列,得到列重构表格;对列重构后的表格进行行重构:根据单元值将表格的列划分为三类,即连续值列、离散值列、时间值列;提取连续值列的统计量、离散值列的与用户问题有关的类别以及时间值列的最早和最晚时间作为表格的重构特征,并将这些重构特征进行连接得到行重构表格,从而得到完整的重构表格;进一步地,输入大语言模型来生成符合用户问题需求的SQL语句,大大提高了通过自然语言处理表格任务的准确率,在实际的使用场景更加智能与有效。

    一种基于持久化学习索引的数据存储系统及方法

    公开(公告)号:CN118312092A

    公开(公告)日:2024-07-09

    申请号:CN202410200910.8

    申请日:2024-02-23

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于持久化学习索引的数据存储系统及方法,包括:持久化内存和与其耦接的动态随机存取内存;所述持久化内存中存储有内部节点层以及叶节点层;其中,内部节点层是由若干个内部节点组成的树形结构,每一内部节点包含一内部节点模型和一槽位数组;叶节点层是由叶节点组成的双向链表,每一叶节点包含一头部信息和一键值对块数组;其中,最底层的内部节点的槽位数组中存储了指向叶节点和块元数据数组的指针;所述动态随机存取内存中存储有块元数据,所述块元数据用于存储叶节点中每个键值对块数组中键的指纹信息。所述系统还包括:持久化内存中存储的溢出缓存和动态随机存取内存中存储的缓存元数据。

Patent Agency Ranking