预标注模型的构建方法、预标注方法及装置、电子设备

    公开(公告)号:CN116229197A

    公开(公告)日:2023-06-06

    申请号:CN202211481061.5

    申请日:2022-11-24

    Applicant: 浙江大学

    Abstract: 本发明公开了一种预标注模型的构建方法、预标注方法及装置、电子设备,所述预标注模型的构建方法包括:构建预标注初始模型;将未标注的数据集输入所述预标注初始模型中,得到标注数据集;从所述标注数据集筛选出标注不准确的数据;对所述标注不准确的数据进行人工标注;将人工标注后的数据加入到已标注的数据集中,构成新的训练集;使用新的训练集对所述预标注初始模型重新进行训练,得到预标注模型。所述预标注方法包括:获取待标注的数据;将所述待标注的数据输入到上述方法构建的预标注模型中进行预标注。解决了现有技术中存在的算法对数据需求量大,数据质量和数量要求高导致的人工标注成本上升和数据预标注模型效果不佳的问题。

Patent Agency Ranking