数据集蒸馏方法、计算机设备及存储介质

    公开(公告)号:CN119357733A

    公开(公告)日:2025-01-24

    申请号:CN202411294683.6

    申请日:2024-09-14

    Abstract: 本申请涉及一种数据集蒸馏方法、计算机设备及存储介质。所述方法包括:获取原始数据集,所述原始数据集包括原始数据以及原始数据标签;基于合成数据标签确定合成数据集中的合成数据,所述合成数据标签基于所述原始数据标签以及预设标签格式确定,所述合成数据集与目标网络模型匹配;基于所述合成数据以及第一预设规则,更新所述目标网络模型的模型参数,并确定所述合成数据的更新梯度;基于所述原始数据、所述更新梯度、更新后的目标网络模型以及第二预设规则更新所述合成数据集。本申请提高了蒸馏后合成数据集的有效性。

    图像标签标注方法、装置、计算机设备及存储介质

    公开(公告)号:CN119360077A

    公开(公告)日:2025-01-24

    申请号:CN202411297222.4

    申请日:2024-09-14

    Abstract: 本申请涉及一种图像标签标注方法、装置、计算机设备及存储介质。所述方法包括:获取图像信息,图像信息包括图像数据、文本数据以及图像标签,图像标签包括第一类别标记信息;基于图像编码模型确定图像数据的视觉特征序列,并基于文本编码模型分别确定文本特征序列、类别特征;基于视觉特征序列以及文本特征序列确定相似度矩阵,并将相似度矩阵对齐至修正矩阵,以更新图像编码模型,修正矩阵基于图像信息确定;基于更新后的图像编码模型,确定更新后的视觉特征序列,基于更新后的视觉特征序列以及类别特征,确定图像标签的第二类别标记信息;基于第二类别标记信息,对第一类别标记信息中的未知类别进行标注。本申请提高了标签标注准确性、鲁棒性。

    一种基于浅层特征预计算的神经网络推理加速方法

    公开(公告)号:CN114580352B

    公开(公告)日:2025-04-01

    申请号:CN202210223992.9

    申请日:2022-03-09

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于浅层特征预计算的神经网络推理加速方法,该方法首先获取预训练神经网络,根据输入文本,使用预训练神经网络将输入文本进行编码;然后根据所述预训练神经网络,构建浅层特征可预计算神经网络,根据输入文本,使用浅层特征可预计算神经网络将输入文本进行编码;再使用所述浅层特征可预计算神经网络拟合预训练神经网络的中间层特征,训练浅层特征可预计算神经网络;再根据所述浅层特征可预计算神经网络,构建浅层特征查询表;最后使用上述浅层特征查询表替换浅层特征可预计算神经网络的浅层神经网络。本发明可以用于新闻分类、情感分析、问答系统等人工智能领域任务。

    一种针对梯度放大攻击的防御方法、电子设备、介质

    公开(公告)号:CN117675344A

    公开(公告)日:2024-03-08

    申请号:CN202311658001.0

    申请日:2023-12-05

    Applicant: 浙江大学

    Abstract: 本发明公开了一种针对梯度放大攻击的防御方法、电子设备、介质,所述方法包括:服务器获取每一参与者上传的本地模型梯度,并计算每一本地模型梯度的L2值,得到L2值集合L2(N);根据L2值集合L2(N)设置检验阈值;根据检验阈值对每一本地模型梯度的L2值进行检验,当本地模型梯度的L2值小于检验阈值时,通过检验;基于通过检验的本地模型梯度更新全局模型。本发明方法通过检验模型梯度的二范数值来识别欺诈者,能够有效地抵制恶意参与者的梯度放大攻击行为。

    一种自动发现审计规则和异常数据的方法

    公开(公告)号:CN111475500A

    公开(公告)日:2020-07-31

    申请号:CN202010279614.3

    申请日:2020-04-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种自动发现审计规则和异常数据的方法。该方法先将审计的数据集按照属性类型分成分类属性和数值属性,用户再分别给定分类属性的最小支持率和数值属性的偏移率,然后在分类属性中选出支持率高于最小支持率的候选分类属性和属性值;再根据属性类型生成候选属性集,从而获取审计规则;最后根据获取的审计规则,依次对收集的审计数据集进行筛选,选出符合审计规则中满足条件约束的,而派生属性的属性值不在正常值范围内的数据,即为异常数据。该自动发现审计规则和异常数据方法能够有效地提高审计效率,降低审计成本。

    一种面向非实时快照位置数据的签到用户近似搜索方法

    公开(公告)号:CN108924778B

    公开(公告)日:2020-05-22

    申请号:CN201810778007.4

    申请日:2018-07-16

    Applicant: 浙江大学

    Abstract: 本发明公开了一种面向非实时快照位置数据的签到用户近似搜索方法。读入非实时快照位置数据,建立室内分区空间索引;输入查询区域计算查询区域对应的保底区域和浮动区域;以浮动区域作为空间范围查询的查询条件,在室内分区空间索引上搜索移动用户;根据搜索到的移动用户的快照位置数据,构建不确定移动区域,判定移动用户为确定签到用户或可能签到用户,并放入对应集合中;将确定签到用户集合和可能签到用户集合作为近似搜索结果返回给图形界面进行展示。本发明方法在无线定位数据采样频率低、内存维护数据条件有限的场景下,搜索当前时刻可能在特定查询区域进行签到的用户时,能同时保证搜索过程的高效性和完整有效性。

Patent Agency Ranking