-
公开(公告)号:CN119360077A
公开(公告)日:2025-01-24
申请号:CN202411297222.4
申请日:2024-09-14
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06V10/764 , G06V10/74 , G06F40/289 , G06N3/0455 , G06N3/09
Abstract: 本申请涉及一种图像标签标注方法、装置、计算机设备及存储介质。所述方法包括:获取图像信息,图像信息包括图像数据、文本数据以及图像标签,图像标签包括第一类别标记信息;基于图像编码模型确定图像数据的视觉特征序列,并基于文本编码模型分别确定文本特征序列、类别特征;基于视觉特征序列以及文本特征序列确定相似度矩阵,并将相似度矩阵对齐至修正矩阵,以更新图像编码模型,修正矩阵基于图像信息确定;基于更新后的图像编码模型,确定更新后的视觉特征序列,基于更新后的视觉特征序列以及类别特征,确定图像标签的第二类别标记信息;基于第二类别标记信息,对第一类别标记信息中的未知类别进行标注。本申请提高了标签标注准确性、鲁棒性。
-
公开(公告)号:CN119939201A
公开(公告)日:2025-05-06
申请号:CN202411853509.0
申请日:2024-12-16
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06F18/211 , G06F18/213 , G06F18/241 , G06F18/25 , G06N20/00
Abstract: 本申请公开一种多视图特征选择方法、模型训练方法、设备及程序产品,方法包括:获取第一多视图数据集;第一多视图数据集包括多个第一视图,任一第一视图中包括一个或多个第一特征子集,第一特征子集中包括原始数据集中原始数据对应的第一特征值;确定每个第一特征子集中第一特征值的分布差异;根据第一特征子集中第一特征值的分布差异,确定第一特征子集的权重;根据第一特征子集的权重,从多个第一特征子集中确定最优第一特征子集。本发明通过关注不同类别原始数据的第一特征值的分布差异层面,而不是去关注不同类别原始数据的数量差异层面,实现对所有类别的原始数据进行平等对待,以减轻类别不平衡问题的影响,从而特征选择的效果也更好。
-
公开(公告)号:CN119543953A
公开(公告)日:2025-02-28
申请号:CN202411515585.0
申请日:2024-10-28
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: H03M7/30
Abstract: 本申请实施例适用于数据处理技术领域,提供了一种时序数据压缩方法、解压缩方法、装置、设备及介质,所述方法包括:获取时序数据数组,时序数据数组中包括多个按时间顺序排列的时序数据;对每个时序数据与时序数据的前一时序数据进行异或运算,得到每个时序数据对应的异或值;根据每个异或值中的前导零数量和有效位长度,确定时序数据数组的报头数据,报头数据用于在对时序数据进行压缩时,确定时序数据的前导零数量与有效位长度的表征方式;基于报头数据,对每个时序数据进行压缩;将报头数据和每个时序数据对应的压缩数据组合为时序数据数组的压缩数据数组。通过上述方法,在对时序数据进行数据压缩时,能够提高压缩比。
-
公开(公告)号:CN118673319A
公开(公告)日:2024-09-20
申请号:CN202410714775.9
申请日:2024-06-04
Applicant: 浙江大学 , 杭州高新区(滨江)区块链与数据安全研究院
IPC: G06F18/214 , G06N3/084
Abstract: 本发明公开了一种针对分割学习数据推断攻击的防御方法、电子设备、介质,应用于客户端,包括:获取隐私训练数据,随机生成C类数据,将每类数据打乱插入到隐私训练数据中作为客户端的训练数据集;将训练数据集输入至客户端模型中,输出得到中间特征;接收服务器模型下发的激活梯度;其中,所述激活梯度为服务器模型基于中间特征及对应的标签计算得到的损失值,根据损失值在服务器模型上进行后向传播更新服务器模型,输出激活梯度;基于激活梯度更新客户端模型;使得攻击者端将中间特征并输入至训练好的辅助模型h,输出扭曲目标特征空间Z;扭曲目标特征空间Z输入至训练好的解码器g‑1,无法得到反演重建结果,从而完成防御。
-
公开(公告)号:CN119621511A
公开(公告)日:2025-03-14
申请号:CN202411766273.7
申请日:2024-12-04
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
Abstract: 本申请涉及一种分布式服务的性能剖析方法、系统和存储介质,其中,分布式服务包括多个工作节点,且各工作节点分别部署有本地剖析器;该性能剖析方法包括:接收各本地剖析器采集的针对工作节点上的堆栈跟踪数据,并对堆栈跟踪数据进行聚合处理,得到聚合堆栈数据;根据聚合堆栈数据生成目标火焰图,并基于目标火焰图生成针对分布式服务的目标性能剖析结果。通过本申请,解决了性能剖析难以适应大规模分布式服务的问题。
-
公开(公告)号:CN119357688A
公开(公告)日:2025-01-24
申请号:CN202411298789.3
申请日:2024-09-14
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06F18/22 , G06F18/25 , G06F18/214 , G06F16/242 , G06F16/2455 , G06N3/0455 , G06N3/0475 , G06N3/0895
Abstract: 本申请涉及一种数据库的模式匹配方法、装置、计算机设备和存储介质,其中,该方法包括:获取数据库的模式信息和查询日志;模式信息包括源模式和目标模式;将模式信息输入到训练完备的第一模型中进行编码,得到属性编码;将查询日志输入到训练完备的第二模型中进行编码,得到查询语句编码;根据属性编码和查询语句编码,确定源模式中源属性与目标模式中目标属性之间的匹配结果;直到完成数据库中所有属性的遍历,得到模式匹配结果。通过本申请,解决了需要手动定义规则,导致匹配结果准确率低的问题,利用训练完备的第一模块结合第二模型来有效地集成结构化查询语言表示和模式表示,提高模式匹配的准确性。
-
公开(公告)号:CN119357234A
公开(公告)日:2025-01-24
申请号:CN202411296629.5
申请日:2024-09-14
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06F16/2455 , G06F16/242 , G06N3/08
Abstract: 本申请涉及一种数据协同查询方法、装置、计算机设备及存储介质。所述方法包括:获取查询信息,并基于所述查询信息确定查询关系算子与至少一个目标模型算子;在数据库中预设执行规则,并基于所述目标模型算子确定目标模型在数据库中的所述执行规则,所述执行规则基于所述目标模型的模型参数以及模型计算图确定;基于所述查询关系算子以及所述执行规则,从所述数据库中确定查询结果。本申请实施例可以基于查询关系算子以及数据库中的执行规则,自动实现数据查询过程,得到数据查询结果,而不再需要用户手动解析目标模型,以及根据目标模型手动编写大量的SQL。本申请不仅降低了人工成本,还有效缩短了数据查询的时间,进而显著提高了数据查询的效率。
-
公开(公告)号:CN119887844A
公开(公告)日:2025-04-25
申请号:CN202411975828.9
申请日:2024-12-30
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06T7/246 , G06N3/0455 , G06N3/0895 , G06N3/09
Abstract: 本申请涉及基于统一成像化数据建模的车辆轨迹恢复方法和设备,方法包括:获取待恢复轨迹的候选点和第一图像,第一图像包含待恢复轨迹所在路网的拓扑结构;根据候选点的位置信息将候选点映射至第一图像,并根据候选点的时间信息得到第一图像中候选点对应像素的灰度值,得到第二图像;根据第二图像预测得到待恢复轨迹的第一轨迹预测图像。采用本方法能够解决车辆轨迹恢复精度低、适用性差的问题。
-
公开(公告)号:CN119723550A
公开(公告)日:2025-03-28
申请号:CN202411785261.9
申请日:2024-12-05
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06V20/62 , G06V10/40 , G06V10/774 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本申请涉及一种基于扩散模型的图像文本识别方法、装置和计算机设备,其中,该基于扩散模型的图像文本识别方法包括:基于输入图像的视觉特征,通过训练完备的扩散模型对输入图像进行重建,得到对应的目标图像;扩散模型的训练为:获取训练数据集;训练数据集中各样本图像对应不同的图像失真情况;基于各样本图像对扩散模型进行训练,得到训练完备的扩散模型;训练过程中的扩散模型用于将每个样本图像进行正向扩散,得到噪声图像,通过学习逐步去噪重建真实图像,实现目标图像的生成;对目标图像进行文本识别,得到目标图像中的文本字符序列。通过本申请,解决了无法在复杂场景下进行准确的文本识别的问题,实现了在复杂场景下进行准确的文本识别。
-
公开(公告)号:CN119539010A
公开(公告)日:2025-02-28
申请号:CN202411472372.4
申请日:2024-10-21
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06N3/082 , G06N3/0455 , G06F18/23 , G06F18/22
Abstract: 本申请涉及机器学习技术领域,提出一种机器学习模型微调方法、系统、服务器和客户端。在该方法中,首先由服务器对机器学习模型的所有网络层进行压缩处理,得到压缩后的目标网络层,并将目标网络层发送至客户端;然后,客户端基于本地的训练数据集对目标网络层的模型参数进行优化更新,并将优化更新后的模型参数发送回服务器;最后,服务器根据接收到的优化更新后的模型参数,对机器学习模型进行微调。采用该方法能够在模型微调的过程中减少传输的模型参数的数量,从而降低敏感信息的泄露风险,提高数据的隐私安全性。
-
-
-
-
-
-
-
-
-