-
公开(公告)号:CN119360077A
公开(公告)日:2025-01-24
申请号:CN202411297222.4
申请日:2024-09-14
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06V10/764 , G06V10/74 , G06F40/289 , G06N3/0455 , G06N3/09
Abstract: 本申请涉及一种图像标签标注方法、装置、计算机设备及存储介质。所述方法包括:获取图像信息,图像信息包括图像数据、文本数据以及图像标签,图像标签包括第一类别标记信息;基于图像编码模型确定图像数据的视觉特征序列,并基于文本编码模型分别确定文本特征序列、类别特征;基于视觉特征序列以及文本特征序列确定相似度矩阵,并将相似度矩阵对齐至修正矩阵,以更新图像编码模型,修正矩阵基于图像信息确定;基于更新后的图像编码模型,确定更新后的视觉特征序列,基于更新后的视觉特征序列以及类别特征,确定图像标签的第二类别标记信息;基于第二类别标记信息,对第一类别标记信息中的未知类别进行标注。本申请提高了标签标注准确性、鲁棒性。
-
公开(公告)号:CN119939201A
公开(公告)日:2025-05-06
申请号:CN202411853509.0
申请日:2024-12-16
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06F18/211 , G06F18/213 , G06F18/241 , G06F18/25 , G06N20/00
Abstract: 本申请公开一种多视图特征选择方法、模型训练方法、设备及程序产品,方法包括:获取第一多视图数据集;第一多视图数据集包括多个第一视图,任一第一视图中包括一个或多个第一特征子集,第一特征子集中包括原始数据集中原始数据对应的第一特征值;确定每个第一特征子集中第一特征值的分布差异;根据第一特征子集中第一特征值的分布差异,确定第一特征子集的权重;根据第一特征子集的权重,从多个第一特征子集中确定最优第一特征子集。本发明通过关注不同类别原始数据的第一特征值的分布差异层面,而不是去关注不同类别原始数据的数量差异层面,实现对所有类别的原始数据进行平等对待,以减轻类别不平衡问题的影响,从而特征选择的效果也更好。
-
公开(公告)号:CN119543953A
公开(公告)日:2025-02-28
申请号:CN202411515585.0
申请日:2024-10-28
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: H03M7/30
Abstract: 本申请实施例适用于数据处理技术领域,提供了一种时序数据压缩方法、解压缩方法、装置、设备及介质,所述方法包括:获取时序数据数组,时序数据数组中包括多个按时间顺序排列的时序数据;对每个时序数据与时序数据的前一时序数据进行异或运算,得到每个时序数据对应的异或值;根据每个异或值中的前导零数量和有效位长度,确定时序数据数组的报头数据,报头数据用于在对时序数据进行压缩时,确定时序数据的前导零数量与有效位长度的表征方式;基于报头数据,对每个时序数据进行压缩;将报头数据和每个时序数据对应的压缩数据组合为时序数据数组的压缩数据数组。通过上述方法,在对时序数据进行数据压缩时,能够提高压缩比。
-
公开(公告)号:CN118673319A
公开(公告)日:2024-09-20
申请号:CN202410714775.9
申请日:2024-06-04
Applicant: 浙江大学 , 杭州高新区(滨江)区块链与数据安全研究院
IPC: G06F18/214 , G06N3/084
Abstract: 本发明公开了一种针对分割学习数据推断攻击的防御方法、电子设备、介质,应用于客户端,包括:获取隐私训练数据,随机生成C类数据,将每类数据打乱插入到隐私训练数据中作为客户端的训练数据集;将训练数据集输入至客户端模型中,输出得到中间特征;接收服务器模型下发的激活梯度;其中,所述激活梯度为服务器模型基于中间特征及对应的标签计算得到的损失值,根据损失值在服务器模型上进行后向传播更新服务器模型,输出激活梯度;基于激活梯度更新客户端模型;使得攻击者端将中间特征并输入至训练好的辅助模型h,输出扭曲目标特征空间Z;扭曲目标特征空间Z输入至训练好的解码器g‑1,无法得到反演重建结果,从而完成防御。
-
公开(公告)号:CN119887844A
公开(公告)日:2025-04-25
申请号:CN202411975828.9
申请日:2024-12-30
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06T7/246 , G06N3/0455 , G06N3/0895 , G06N3/09
Abstract: 本申请涉及基于统一成像化数据建模的车辆轨迹恢复方法和设备,方法包括:获取待恢复轨迹的候选点和第一图像,第一图像包含待恢复轨迹所在路网的拓扑结构;根据候选点的位置信息将候选点映射至第一图像,并根据候选点的时间信息得到第一图像中候选点对应像素的灰度值,得到第二图像;根据第二图像预测得到待恢复轨迹的第一轨迹预测图像。采用本方法能够解决车辆轨迹恢复精度低、适用性差的问题。
-
公开(公告)号:CN119723550A
公开(公告)日:2025-03-28
申请号:CN202411785261.9
申请日:2024-12-05
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06V20/62 , G06V10/40 , G06V10/774 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本申请涉及一种基于扩散模型的图像文本识别方法、装置和计算机设备,其中,该基于扩散模型的图像文本识别方法包括:基于输入图像的视觉特征,通过训练完备的扩散模型对输入图像进行重建,得到对应的目标图像;扩散模型的训练为:获取训练数据集;训练数据集中各样本图像对应不同的图像失真情况;基于各样本图像对扩散模型进行训练,得到训练完备的扩散模型;训练过程中的扩散模型用于将每个样本图像进行正向扩散,得到噪声图像,通过学习逐步去噪重建真实图像,实现目标图像的生成;对目标图像进行文本识别,得到目标图像中的文本字符序列。通过本申请,解决了无法在复杂场景下进行准确的文本识别的问题,实现了在复杂场景下进行准确的文本识别。
-
公开(公告)号:CN119539010A
公开(公告)日:2025-02-28
申请号:CN202411472372.4
申请日:2024-10-21
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06N3/082 , G06N3/0455 , G06F18/23 , G06F18/22
Abstract: 本申请涉及机器学习技术领域,提出一种机器学习模型微调方法、系统、服务器和客户端。在该方法中,首先由服务器对机器学习模型的所有网络层进行压缩处理,得到压缩后的目标网络层,并将目标网络层发送至客户端;然后,客户端基于本地的训练数据集对目标网络层的模型参数进行优化更新,并将优化更新后的模型参数发送回服务器;最后,服务器根据接收到的优化更新后的模型参数,对机器学习模型进行微调。采用该方法能够在模型微调的过程中减少传输的模型参数的数量,从而降低敏感信息的泄露风险,提高数据的隐私安全性。
-
公开(公告)号:CN118939757A
公开(公告)日:2024-11-12
申请号:CN202410990608.7
申请日:2024-07-23
Applicant: 浙江大学 , 杭州高新区(滨江)区块链与数据安全研究院
IPC: G06F16/33 , G06F16/338 , G06F16/31 , G06F40/216
Abstract: 本发明公开了一种基于大语言模型的零样本跨语言重排序方法、电子设备、介质,包括:获取若干语言种类对应的查询,以及若干语言种类对应的文档数据;对每一语言种类对应的文档数据建立词条到文档的映射,得到对应的倒排索引;将查询输入至该语言种类对应的倒排索引,得到每一查询对应的第一重排文档列表;对于每一查询,将查询分解为若干个子查询,对该查询对应的第一重排文档列表中的每一文档设置唯一标志符;设置提示词模板,将查询、子查询、第一重排文档列表、每一文档对应的唯一标志符、提示词模板输入至大语言模型中,输出每一文档与查询的相关性标志符排序,得到每一查询对应的第二重排文档列表。
-
公开(公告)号:CN118569356A
公开(公告)日:2024-08-30
申请号:CN202410729737.0
申请日:2024-06-06
Applicant: 浙江大学 , 杭州高新区(滨江)区块链与数据安全研究院
IPC: G06N3/098 , G06N3/0475 , G06N3/045 , G06N3/094 , G06N5/04 , H04L67/10 , G06V10/82 , G06V10/94 , G06V10/764 , G16H50/20
Abstract: 本发明公开了一种基于分组生成及联邦学习的业务执行方法、设备、介质,应用于客户端,包括:接收服务器下发的基准数据集、初始化的业务执行网络和生成对抗网络;利用本地数据集对业务执行网络进行训练,从而在基准数据集上进行推断,统计各标签的准确率组成向量;每一组别参与联邦学习的每轮迭代训练过程,包括对生成对抗网络进行训练;将高斯噪声输入随机选取的若干个经服务器聚合得到的全局对抗生成模型得到合成样本集;其中,每一组别是服务器基于经阈值截断、随机翻转的准确率组成向量对客户端进行分组得到;利用合成样本集和本地数据集对重新初始化的业务执行网络进行训练;接收经服务器聚合得到的全局业务执行网络,以此执行业务任务。
-
公开(公告)号:CN119621511A
公开(公告)日:2025-03-14
申请号:CN202411766273.7
申请日:2024-12-04
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
Abstract: 本申请涉及一种分布式服务的性能剖析方法、系统和存储介质,其中,分布式服务包括多个工作节点,且各工作节点分别部署有本地剖析器;该性能剖析方法包括:接收各本地剖析器采集的针对工作节点上的堆栈跟踪数据,并对堆栈跟踪数据进行聚合处理,得到聚合堆栈数据;根据聚合堆栈数据生成目标火焰图,并基于目标火焰图生成针对分布式服务的目标性能剖析结果。通过本申请,解决了性能剖析难以适应大规模分布式服务的问题。
-
-
-
-
-
-
-
-
-