图像标签标注方法、装置、计算机设备及存储介质

    公开(公告)号:CN119360077A

    公开(公告)日:2025-01-24

    申请号:CN202411297222.4

    申请日:2024-09-14

    Abstract: 本申请涉及一种图像标签标注方法、装置、计算机设备及存储介质。所述方法包括:获取图像信息,图像信息包括图像数据、文本数据以及图像标签,图像标签包括第一类别标记信息;基于图像编码模型确定图像数据的视觉特征序列,并基于文本编码模型分别确定文本特征序列、类别特征;基于视觉特征序列以及文本特征序列确定相似度矩阵,并将相似度矩阵对齐至修正矩阵,以更新图像编码模型,修正矩阵基于图像信息确定;基于更新后的图像编码模型,确定更新后的视觉特征序列,基于更新后的视觉特征序列以及类别特征,确定图像标签的第二类别标记信息;基于第二类别标记信息,对第一类别标记信息中的未知类别进行标注。本申请提高了标签标注准确性、鲁棒性。

    多视图特征选择方法、模型训练方法、设备及程序产品

    公开(公告)号:CN119939201A

    公开(公告)日:2025-05-06

    申请号:CN202411853509.0

    申请日:2024-12-16

    Abstract: 本申请公开一种多视图特征选择方法、模型训练方法、设备及程序产品,方法包括:获取第一多视图数据集;第一多视图数据集包括多个第一视图,任一第一视图中包括一个或多个第一特征子集,第一特征子集中包括原始数据集中原始数据对应的第一特征值;确定每个第一特征子集中第一特征值的分布差异;根据第一特征子集中第一特征值的分布差异,确定第一特征子集的权重;根据第一特征子集的权重,从多个第一特征子集中确定最优第一特征子集。本发明通过关注不同类别原始数据的第一特征值的分布差异层面,而不是去关注不同类别原始数据的数量差异层面,实现对所有类别的原始数据进行平等对待,以减轻类别不平衡问题的影响,从而特征选择的效果也更好。

    时序数据压缩方法、解压缩方法、装置、设备及介质

    公开(公告)号:CN119543953A

    公开(公告)日:2025-02-28

    申请号:CN202411515585.0

    申请日:2024-10-28

    Abstract: 本申请实施例适用于数据处理技术领域,提供了一种时序数据压缩方法、解压缩方法、装置、设备及介质,所述方法包括:获取时序数据数组,时序数据数组中包括多个按时间顺序排列的时序数据;对每个时序数据与时序数据的前一时序数据进行异或运算,得到每个时序数据对应的异或值;根据每个异或值中的前导零数量和有效位长度,确定时序数据数组的报头数据,报头数据用于在对时序数据进行压缩时,确定时序数据的前导零数量与有效位长度的表征方式;基于报头数据,对每个时序数据进行压缩;将报头数据和每个时序数据对应的压缩数据组合为时序数据数组的压缩数据数组。通过上述方法,在对时序数据进行数据压缩时,能够提高压缩比。

    针对分割学习数据推断攻击的防御方法、电子设备、介质

    公开(公告)号:CN118673319A

    公开(公告)日:2024-09-20

    申请号:CN202410714775.9

    申请日:2024-06-04

    Abstract: 本发明公开了一种针对分割学习数据推断攻击的防御方法、电子设备、介质,应用于客户端,包括:获取隐私训练数据,随机生成C类数据,将每类数据打乱插入到隐私训练数据中作为客户端的训练数据集;将训练数据集输入至客户端模型中,输出得到中间特征;接收服务器模型下发的激活梯度;其中,所述激活梯度为服务器模型基于中间特征及对应的标签计算得到的损失值,根据损失值在服务器模型上进行后向传播更新服务器模型,输出激活梯度;基于激活梯度更新客户端模型;使得攻击者端将中间特征并输入至训练好的辅助模型h,输出扭曲目标特征空间Z;扭曲目标特征空间Z输入至训练好的解码器g‑1,无法得到反演重建结果,从而完成防御。

    基于扩散模型的图像文本识别方法、装置和计算机设备

    公开(公告)号:CN119723550A

    公开(公告)日:2025-03-28

    申请号:CN202411785261.9

    申请日:2024-12-05

    Abstract: 本申请涉及一种基于扩散模型的图像文本识别方法、装置和计算机设备,其中,该基于扩散模型的图像文本识别方法包括:基于输入图像的视觉特征,通过训练完备的扩散模型对输入图像进行重建,得到对应的目标图像;扩散模型的训练为:获取训练数据集;训练数据集中各样本图像对应不同的图像失真情况;基于各样本图像对扩散模型进行训练,得到训练完备的扩散模型;训练过程中的扩散模型用于将每个样本图像进行正向扩散,得到噪声图像,通过学习逐步去噪重建真实图像,实现目标图像的生成;对目标图像进行文本识别,得到目标图像中的文本字符序列。通过本申请,解决了无法在复杂场景下进行准确的文本识别的问题,实现了在复杂场景下进行准确的文本识别。

Patent Agency Ranking