一种面向大模型的数据溯源方法及其系统

    公开(公告)号:CN119358670A

    公开(公告)日:2025-01-24

    申请号:CN202411351041.5

    申请日:2024-09-26

    Abstract: 本申请公开了一种面向大模型的数据溯源方法,方法包括:构建待输入大模型的测试样本集合;对于测试数据集合,采用去偏修正方法,计算每个训练样本和测试样本在训练后模型和训练前模型上的去偏影响分数;根据在训练后模型和训练前模型上的去偏影响分数进行去偏计算,获取每条训练数据的最终影响分数,根据最终影响分数,实现数据的溯源分析。本发明在去偏修正方法的基础上还包括了去噪修正方法。本发明实现的影响分数方法能够更有效地评估训练数据溯源方法的准确性和可靠性。

Patent Agency Ranking