基于扩散模型的图像文本识别方法、装置和计算机设备

    公开(公告)号:CN119723550A

    公开(公告)日:2025-03-28

    申请号:CN202411785261.9

    申请日:2024-12-05

    Abstract: 本申请涉及一种基于扩散模型的图像文本识别方法、装置和计算机设备,其中,该基于扩散模型的图像文本识别方法包括:基于输入图像的视觉特征,通过训练完备的扩散模型对输入图像进行重建,得到对应的目标图像;扩散模型的训练为:获取训练数据集;训练数据集中各样本图像对应不同的图像失真情况;基于各样本图像对扩散模型进行训练,得到训练完备的扩散模型;训练过程中的扩散模型用于将每个样本图像进行正向扩散,得到噪声图像,通过学习逐步去噪重建真实图像,实现目标图像的生成;对目标图像进行文本识别,得到目标图像中的文本字符序列。通过本申请,解决了无法在复杂场景下进行准确的文本识别的问题,实现了在复杂场景下进行准确的文本识别。

    数据集蒸馏方法、计算机设备及存储介质

    公开(公告)号:CN119357733A

    公开(公告)日:2025-01-24

    申请号:CN202411294683.6

    申请日:2024-09-14

    Abstract: 本申请涉及一种数据集蒸馏方法、计算机设备及存储介质。所述方法包括:获取原始数据集,所述原始数据集包括原始数据以及原始数据标签;基于合成数据标签确定合成数据集中的合成数据,所述合成数据标签基于所述原始数据标签以及预设标签格式确定,所述合成数据集与目标网络模型匹配;基于所述合成数据以及第一预设规则,更新所述目标网络模型的模型参数,并确定所述合成数据的更新梯度;基于所述原始数据、所述更新梯度、更新后的目标网络模型以及第二预设规则更新所述合成数据集。本申请提高了蒸馏后合成数据集的有效性。

    一种基于持久化学习索引的数据存储系统及方法

    公开(公告)号:CN118312092A

    公开(公告)日:2024-07-09

    申请号:CN202410200910.8

    申请日:2024-02-23

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于持久化学习索引的数据存储系统及方法,包括:持久化内存和与其耦接的动态随机存取内存;所述持久化内存中存储有内部节点层以及叶节点层;其中,内部节点层是由若干个内部节点组成的树形结构,每一内部节点包含一内部节点模型和一槽位数组;叶节点层是由叶节点组成的双向链表,每一叶节点包含一头部信息和一键值对块数组;其中,最底层的内部节点的槽位数组中存储了指向叶节点和块元数据数组的指针;所述动态随机存取内存中存储有块元数据,所述块元数据用于存储叶节点中每个键值对块数组中键的指纹信息。所述系统还包括:持久化内存中存储的溢出缓存和动态随机存取内存中存储的缓存元数据。

    一种面向联邦学习的连续学习方法

    公开(公告)号:CN113657607B

    公开(公告)日:2024-03-22

    申请号:CN202110894758.4

    申请日:2021-08-05

    Applicant: 浙江大学

    Abstract: 本发明公开了一种面向联邦学习的连续学习方法。联邦学习服务端和各个客户端在确定学习任务后,通过搜集若干个与任务类型匹配的无隐私问题的公开数据集,各自独立地构建一份辅助数据集,用于后续训练过程;客户端借助知识蒸馏损失让本地模型在学习新任务的同时学习辅助数据集以及辅助标签,从而减少对旧知识的遗忘;服务端借助知识蒸馏损失让聚合模型同时学习辅助数据集以及辅助标签,从而减少模型在聚合过程中产生的遗忘。本发明在隐私安全且通信代价小的基础上,提升了联邦模型的连续学习能力。

Patent Agency Ranking