-
公开(公告)号:CN119887844A
公开(公告)日:2025-04-25
申请号:CN202411975828.9
申请日:2024-12-30
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06T7/246 , G06N3/0455 , G06N3/0895 , G06N3/09
Abstract: 本申请涉及基于统一成像化数据建模的车辆轨迹恢复方法和设备,方法包括:获取待恢复轨迹的候选点和第一图像,第一图像包含待恢复轨迹所在路网的拓扑结构;根据候选点的位置信息将候选点映射至第一图像,并根据候选点的时间信息得到第一图像中候选点对应像素的灰度值,得到第二图像;根据第二图像预测得到待恢复轨迹的第一轨迹预测图像。采用本方法能够解决车辆轨迹恢复精度低、适用性差的问题。
-
公开(公告)号:CN119723550A
公开(公告)日:2025-03-28
申请号:CN202411785261.9
申请日:2024-12-05
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06V20/62 , G06V10/40 , G06V10/774 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本申请涉及一种基于扩散模型的图像文本识别方法、装置和计算机设备,其中,该基于扩散模型的图像文本识别方法包括:基于输入图像的视觉特征,通过训练完备的扩散模型对输入图像进行重建,得到对应的目标图像;扩散模型的训练为:获取训练数据集;训练数据集中各样本图像对应不同的图像失真情况;基于各样本图像对扩散模型进行训练,得到训练完备的扩散模型;训练过程中的扩散模型用于将每个样本图像进行正向扩散,得到噪声图像,通过学习逐步去噪重建真实图像,实现目标图像的生成;对目标图像进行文本识别,得到目标图像中的文本字符序列。通过本申请,解决了无法在复杂场景下进行准确的文本识别的问题,实现了在复杂场景下进行准确的文本识别。
-
公开(公告)号:CN119539010A
公开(公告)日:2025-02-28
申请号:CN202411472372.4
申请日:2024-10-21
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06N3/082 , G06N3/0455 , G06F18/23 , G06F18/22
Abstract: 本申请涉及机器学习技术领域,提出一种机器学习模型微调方法、系统、服务器和客户端。在该方法中,首先由服务器对机器学习模型的所有网络层进行压缩处理,得到压缩后的目标网络层,并将目标网络层发送至客户端;然后,客户端基于本地的训练数据集对目标网络层的模型参数进行优化更新,并将优化更新后的模型参数发送回服务器;最后,服务器根据接收到的优化更新后的模型参数,对机器学习模型进行微调。采用该方法能够在模型微调的过程中减少传输的模型参数的数量,从而降低敏感信息的泄露风险,提高数据的隐私安全性。
-
公开(公告)号:CN118939757A
公开(公告)日:2024-11-12
申请号:CN202410990608.7
申请日:2024-07-23
Applicant: 浙江大学 , 杭州高新区(滨江)区块链与数据安全研究院
IPC: G06F16/33 , G06F16/338 , G06F16/31 , G06F40/216
Abstract: 本发明公开了一种基于大语言模型的零样本跨语言重排序方法、电子设备、介质,包括:获取若干语言种类对应的查询,以及若干语言种类对应的文档数据;对每一语言种类对应的文档数据建立词条到文档的映射,得到对应的倒排索引;将查询输入至该语言种类对应的倒排索引,得到每一查询对应的第一重排文档列表;对于每一查询,将查询分解为若干个子查询,对该查询对应的第一重排文档列表中的每一文档设置唯一标志符;设置提示词模板,将查询、子查询、第一重排文档列表、每一文档对应的唯一标志符、提示词模板输入至大语言模型中,输出每一文档与查询的相关性标志符排序,得到每一查询对应的第二重排文档列表。
-
公开(公告)号:CN118569356A
公开(公告)日:2024-08-30
申请号:CN202410729737.0
申请日:2024-06-06
Applicant: 浙江大学 , 杭州高新区(滨江)区块链与数据安全研究院
IPC: G06N3/098 , G06N3/0475 , G06N3/045 , G06N3/094 , G06N5/04 , H04L67/10 , G06V10/82 , G06V10/94 , G06V10/764 , G16H50/20
Abstract: 本发明公开了一种基于分组生成及联邦学习的业务执行方法、设备、介质,应用于客户端,包括:接收服务器下发的基准数据集、初始化的业务执行网络和生成对抗网络;利用本地数据集对业务执行网络进行训练,从而在基准数据集上进行推断,统计各标签的准确率组成向量;每一组别参与联邦学习的每轮迭代训练过程,包括对生成对抗网络进行训练;将高斯噪声输入随机选取的若干个经服务器聚合得到的全局对抗生成模型得到合成样本集;其中,每一组别是服务器基于经阈值截断、随机翻转的准确率组成向量对客户端进行分组得到;利用合成样本集和本地数据集对重新初始化的业务执行网络进行训练;接收经服务器聚合得到的全局业务执行网络,以此执行业务任务。
-
公开(公告)号:CN119357733A
公开(公告)日:2025-01-24
申请号:CN202411294683.6
申请日:2024-09-14
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06F18/24 , G06F18/22 , G06N3/084 , G06N3/0455
Abstract: 本申请涉及一种数据集蒸馏方法、计算机设备及存储介质。所述方法包括:获取原始数据集,所述原始数据集包括原始数据以及原始数据标签;基于合成数据标签确定合成数据集中的合成数据,所述合成数据标签基于所述原始数据标签以及预设标签格式确定,所述合成数据集与目标网络模型匹配;基于所述合成数据以及第一预设规则,更新所述目标网络模型的模型参数,并确定所述合成数据的更新梯度;基于所述原始数据、所述更新梯度、更新后的目标网络模型以及第二预设规则更新所述合成数据集。本申请提高了蒸馏后合成数据集的有效性。
-
公开(公告)号:CN118312092A
公开(公告)日:2024-07-09
申请号:CN202410200910.8
申请日:2024-02-23
Applicant: 浙江大学
IPC: G06F3/06 , G06F12/0893 , G06F12/0877
Abstract: 本发明公开了一种基于持久化学习索引的数据存储系统及方法,包括:持久化内存和与其耦接的动态随机存取内存;所述持久化内存中存储有内部节点层以及叶节点层;其中,内部节点层是由若干个内部节点组成的树形结构,每一内部节点包含一内部节点模型和一槽位数组;叶节点层是由叶节点组成的双向链表,每一叶节点包含一头部信息和一键值对块数组;其中,最底层的内部节点的槽位数组中存储了指向叶节点和块元数据数组的指针;所述动态随机存取内存中存储有块元数据,所述块元数据用于存储叶节点中每个键值对块数组中键的指纹信息。所述系统还包括:持久化内存中存储的溢出缓存和动态随机存取内存中存储的缓存元数据。
-
公开(公告)号:CN113657607B
公开(公告)日:2024-03-22
申请号:CN202110894758.4
申请日:2021-08-05
Applicant: 浙江大学
Abstract: 本发明公开了一种面向联邦学习的连续学习方法。联邦学习服务端和各个客户端在确定学习任务后,通过搜集若干个与任务类型匹配的无隐私问题的公开数据集,各自独立地构建一份辅助数据集,用于后续训练过程;客户端借助知识蒸馏损失让本地模型在学习新任务的同时学习辅助数据集以及辅助标签,从而减少对旧知识的遗忘;服务端借助知识蒸馏损失让聚合模型同时学习辅助数据集以及辅助标签,从而减少模型在聚合过程中产生的遗忘。本发明在隐私安全且通信代价小的基础上,提升了联邦模型的连续学习能力。
-
-
-
-
-
-
-